Toggle navigation
mindia
HTML::ExtractContent
はてブで使われてる本文抽出ライブラリ。
http://d.hatena.ne.jp/tarao/20090322
#1237750634
本文っぽい、本文っぽくないでスコアリングするヒューリスティクアルゴリズム。
Perl
はてなブックマーク
自然言語処理
履歴
コメント(0)
Good!(0)
コメントするにはログインが必要です
もしかして
他の人の「HTML::ExtractContent」
無所属ソフトウェアエンジニア
akkun_choi pedia
(1722words)
最新
最新エントリ
関連ツイート