形態素だったっけ?
Chasenの結果 (0.77783秒)
日本語 は いろいろ と 制約 が 多く て 困り ます 。 文字 コード も さる こと ながら 、 単語 分割 の 際 に 日本語 は どういう こと に なる の でしょ う ぁ ?Text::ChaSen::getopt_argv('chasen-perl','-j','-F','%m\n')
ChaSen version 2.3.3 (c) 1996-2001 Nara Institute of Science and TechnologyKakasiの結果 (0.113735秒)
日本語 はいろいろと 制約 が 多く て 困り ます 。 文字コード もさることながら 、 単語 分割 の 際に 日本語 はどういうことになるのでしょうぁ ?Text::Kakasi::getopt_argv('-c','-w')
KAKASI - Kanji Kana Simple Inverter Version 2.3.4
Copyright (C) 1992-1999 Hironobu Takahashi. All rights reserved.MeCabの結果 (0.929841秒)
日本語 は いろいろ と 制約 が 多く て 困り ます 。 文字 コード も さる こと ながら 、 単語 分割 の 際 に 日本語 は どういう こと に なる の でしょ う ぁ ?Yet Another Part-of-Speech and Morphological Analyzer
Copyright (C) 2001-2003 Taku Kudo, All rights reserved.
ChasenとKakasiとMeCabの形態素解析・わかち書きの比較の実行結果
さすが、誰かがやってますね。
助かります。
kakashiはずば抜けて早いですけど。
分割精度はそんなに求めていないものの、
「はどういうことになるのでしょうぁ」
で区切られてもなぁ…
いままで探した限りではMecabかChasenのどちらかで
決定ですかね。
一応msearchの中身を確認させていただいて
どっちを使うか決めることにします。