形態素だったっけ?

Chasenの結果 (0.77783秒)
日本語 は いろいろ と 制約 が 多く て 困り ます 。 文字 コード も さる こと ながら 、 単語 分割 の 際 に 日本語 は どういう こと に なる の でしょ う ぁ ?

Text::ChaSen::getopt_argv('chasen-perl','-j','-F','%m\n')
ChaSen version 2.3.3 (c) 1996-2001 Nara Institute of Science and Technology

Kakasiの結果 (0.113735秒)
日本語 はいろいろと 制約 が 多く て 困り ます 。 文字コード もさることながら 、 単語 分割 の 際に 日本語 はどういうことになるのでしょうぁ ?

Text::Kakasi::getopt_argv('-c','-w')
KAKASI - Kanji Kana Simple Inverter Version 2.3.4
Copyright (C) 1992-1999 Hironobu Takahashi. All rights reserved.

MeCabの結果 (0.929841秒)
日本語 は いろいろ と 制約 が 多く て 困り ます 。 文字 コード も さる こと ながら 、 単語 分割 の 際 に 日本語 は どういう こと に なる の でしょ う ぁ ?

Yet Another Part-of-Speech and Morphological Analyzer
Copyright (C) 2001-2003 Taku Kudo, All rights reserved.

ChasenとKakasiとMeCabの形態素解析・わかち書きの比較の実行結果


さすが、誰かがやってますね。
助かります。



kakashiはずば抜けて早いですけど。


分割精度はそんなに求めていないものの、
「はどういうことになるのでしょうぁ」
で区切られてもなぁ…


いままで探した限りではMecabChasenのどちらかで
決定ですかね。


一応msearchの中身を確認させていただいて
どっちを使うか決めることにします。