CaboCha/Rubyで、入力形式等を指定する
形態素解析ツールのCaboChaにはRubyで使うためのラッパーが付属していて、require 'CaboCha'とすることで色々と使えるようになるわけですが、それについての説明書きがどう頑張ってもなかったのでメモ。
cabocha - Yet Another Japanese Dependency Structure Analyzer - Google Project Hosting
因みに、SWIGをいれないとインストールできない、みたいな情報が検索すると沢山出てきますが、最新版(ver 0.68)ではそんなことはないようです。
CaboChaをインストールした後に、
ruby extconf.rb
make
make install
でOKでした。
基本は同梱されているtest.rbの通り。
test.rb - cabocha - Yet Another Japanese Dependency Structure Analyzer - Google Project Hosting
CaboChaをコマンドラインで使う場合は、色々オプションをつけられます。
例えば入力形式を変更する時にはIオプションだとか。
CaboCha::Parser.newする時に、オプションでそのまま引数を渡してやればいいらしい。
例えば、
CaboCha::Parser.new("-I1 -n0")
だとか。