レビュー感謝+中身
マイコミジャーナルさんにレビューしてもらえました!
http://journal.mycom.co.jp/articles/2007/04/06/infony/index.html
infolustの記事を見かけたので「マイナビ」企業サイトへようこそに公開した旨を書き込んだらほんとにレビューしてくれました。
しかもブックマークもたくさんいただけて。
かなりモチベーションあがります!
今後の参考にさせていただきます。
ありがとうございました!
infonyの中身
ただ作った側にとってはすごいわかりやすい作りなつもりなのですが
若干レビューしていただいている部分と違う箇所があるようなのでちゃんと説明させていただくと…
- HTTP_Clientで対象ページソースを拾う
- (本文抽出なら)ブログの記事本文を抽出するスクリプトをつくってみたで本文らしき箇所を抜き出す
- HTMLタグとか削除
- http://mecab.sourceforge.jp/で形態素解析
- 出現頻度をカウントしてソート(記号や数字だけの単語はカウントしない)
- はてなダイアリーキーワードAPIから意味をもらう
- (はてなで戻りがなかったら)WikipediaAPIから意味をもらう
- (なかったら)あきらめる
となっております。
もし『ここどうやってんの?』とかあればご質問ください。
その他もろもろ
精度が微妙⇒確かに。ちかいうちbulkfeeds.net - このウェブサイトは販売用です! - bulkfeeds リソースおよび情報も試してみます。
API⇒他のAPIを使ったもののAPIを公開するのはちょっとだめっぽいことと、現時点のアクセス数ですでにかなりの処理速度低下なので全く使い物にならないと思うことから残念ながら今のところムリそうです...
他の辞書⇒も試してみて取り込み可能なのですが、2箇所見に行くだけで十分遅いので使ってません。ご要望があれば英語辞書との切り替えはできるようにしたいと思います。あれば。
自動タギング⇒なるほど。別サービスで考えてみます。
ついでにサービス終了のお知らせを使ってページキャッシュ適用しました。
今後ともよろしくおねがいします。