形態素解析

なんだかすごく小難しい言葉ですが、単語ごとの区切りのない日本語を
いかにして単語ごとに分割するか。


わかち書き。


大手検索エンジンの使っているものは
Basis Technologyらしいのですが、
価格の表記などされていなくて、
多分ぶりっといってしまうくらいのお値段なんでしょう。


さしあたりテストサイトを作りたいだけなので、
検索キーワードに「フリーウェア」を当たり前のように足しました。


大学関係のものが多いようで、
研究関連リンク集にまとめてのっていたのでがっつり。

日本語形態素解析システム

以上、研究関連リンク集より引用


ほとんどリンク切れなんですけど。




あとは…
MeCab (和布蕪)
freeWAIS-sf
ChaSen (茶筌)


Namazukakashiだけ使って単語分割のみを簡単にできるんだったら
それが一番いいかも。


参考になりそうな記事を。
あ、はてなブックマークできた。


これ便利いいな〜
誰でもリンクはれるんかな?
早速やってみよう。


もうひとつは
http://pukiwiki.sourceforge.jp/?PukiWiki%2FInstall%2Fxrea.com%2Fkakasi%E3%82%92%E4%BD%BF%E3%81%86



ただ単語分けたいだけなんで、
とりあえずPHP関数なんかにしやすそうなのがいいのですが、
どれにしたらいいんでしょうか?


うーーーん…