/ / WinChalow

ngramツール[topic_extraction]

2005-01-06

Statistical Language Modeling Toolkit
http://svr-www.eng.cam.ac.uk/~prc14/toolkit.html
昔からおなじみの枯れたキット。Cで書かれているので高速だが、要コンパイル。

Pure Perl版:
http://search.cpan.org/~btmcinnes/Text-Positional-Ngram-0.3/Ngram.pm
コーパスが小さければこれの方が使いやすいかもしれないのだが、実際に使ってみたらCPANで☆がゼロというのを納得。ドキュメントがわけわからず。仕様も妙。一応ちゃんと動いてはいるが…
(2005-01-06 16:46:02)

permlink