お約束

最初が肝心、と言うことで、書きたいことと書きたくないことについて。

  • 書きたいこと(つまり、僕が興味を持っていること:順不同)
    • 自然言語処理について
    • 経済/金融について
    • ジャズとジャズドラムについて
    • その他、もろもろ
  • 書きたくないこと
    • 建設的でない批判(ただの悪口/誹謗中傷のたぐい)
    • ネガティブ一辺倒なコメント
    • どうだ俺ってすごいだろう的コメント
    • 仕事のグチ
    • 思わせぶりなこと・結論があるのに書かないこと【追記:May 29, 2005】

cygwin/ChaSen/CaboCha

cygwin環境でCaboCha*1を使いたくて、はまっております。
CaboChaはChaSen*2のshared libraryを使うことを前提に作られているんだけど、そのChaSencygwin環境ではうまくshared libraryを作ってくれない。
-no-undefinedして無理やり作らせてもsig11で落ちるし。
どうしたもんだかなあ。

ややこしいので、事実関係を整理しておく。

  • CaboChaが要求するもの
    • ChaSen
    • YamCha*1
    • TinySVM*2(オプション、だがYamChaが事実上要求しているという罠)
  • ChaSenが要求するもの
    • 特になし(2.3.0はDarts*3が必要だが、このバージョン(ChaSen-2.3.0)はmmapまわりにバグがあり、cygwinでは動かない)
  • YamChaが要求するもの
    • TinySVM、もしくはSVM^light*4

これまでの結果

  • TinySvm
    • -enable-shared=yes:コンパイル通らず
      • C++関連ライブラリのリンクがおかしい?
    • -enable-shared=no:コンパイル、make checkとも問題なし
  • SVM^light
    • コンパイル問題なし(手動でインストールする必要あり)
  • YamCha
    • コンパイルそのものは問題なし、ただしmake check時に以下のエラーが出る(checkはすべてパスしたよ、って言ってくれるんだけど)
    • -enable-shared=yes
      • staticなTinySVMを使用:learning時に以下のエラー
SVM_Solver::learn(): This data have real-value class label.
SVM_Solver::learn(): Use C-SVR mode for regression estimation.
/usr/local/bin/svm_learn: Unexpected error occurs
      • SVM^lightを使用:test dataのevaluation時にsig11で落ちる
    • -enable-shared=no
      • staticなTinySVMを使用:learning時に上記と同じエラー
      • SVM^light使用:evaluation時に以下のエラー
FATAL: Chunker::open(): SVM::open(): size of model file is invalid.
  • ChaSen
    • 上述のように、最新の2.3.0はコンパイルはできるが動かないので、2.2.9を使用する
    • そのままコンパイルすると、shared libraryを作成しない
  • CaboCha
    • YamCha、ChaSen共にshared libraryを要求

うーむ、ややこし。