前の日 / 次の日 / 最新

WinChalow

2005 : Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2004 : Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec

2005-01-06 Thu

ngramツール


Statistical Language Modeling Toolkit
http://svr-www.eng.cam.ac.uk/~prc14/toolkit.html
昔からおなじみの枯れたキット。Cで書かれているので高速だが、要コンパイル。

Pure Perl版:
http://search.cpan.org/~btmcinnes/Text-Positional-Ngram-0.3/Ngram.pm
コーパスが小さければこれの方が使いやすいかもしれないのだが、実際に使ってみたらCPANで☆がゼロというのを納得。ドキュメントがわけわからず。仕様も妙。一応ちゃんと動いてはいるが…
(2005-01-06 16:46:02)

File::Find::Rule


サブディレクトリーを全部さらって処理をしたいとき、昔の人はUNIXのfindを使っていたらしい。使ったことはあるが、シンタックスを直ぐ忘れるので困る。

perl coreのFile::Findというのもあるが、使いやすいとはいえない。

こういうことはもうやめよう。

そんなときに便利なモジュールが File::Find::Ruleだ。

use File::Find::Rule;

# recursively find all perl scripts
my $directory = '.';
my @subdirs = File::Find::Rule
			->file
			->name('*.pl')
			->in( $directory );
map {print $_, "\n"} @subdirs;

ナイス・グッドラップ。
ppmがあるのでwindowsでも使える。
(2005-01-06 11:38:25)

2005-01 / 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31