自然言語処理
素晴らしい。 長岡技術科学大学の自然言語処理研究室より。3つの公約は、僕みたいなまともな経歴がない人間には本当に嬉しい。特に研究情報の公開は是非すすめていただきたいものです。 一方、こういう感じだと本当にがっかり。これをみても、趣味でやってる…
ょゎさんの裏kdooより。 「すべての道は松本研へ通ず」には禿同まくりです。 しかし人工無脳系はやってるなあ。もしかして第2次ブームなのだろうか。といいつつここのラベルは「自然言語処理」と強気です。わはは。 で、僕が今作りかけのもの、名前を「さか…
こんなものもある、と。 なまこの進化を見る限り、1文中の名詞と動詞から作成したハッシュをもとに、1つ前の発言に反応して文を生成しているようだ。
GoogleのInformation Retrieval関連のDirectory。
MLAS LISPで書かれた言語学習プログラム。 ヴァーチャルインファントという本も出てる。表紙は怪しいけどお勧め。 アプローチとしては至極まっとうに思う。 特に、「共通性と違いに気付く能力」だけをベースに学習していくというモデルは、まさに脳の認知処…
メモ。 variable n-gramとPrediction Suffix Tree 後でちゃんと調べること 参考。ここの2002/12/28日分。詳細はわからないけど、僕が当面やりたいと思っていることそのまんまの気がする。 PLSI (Probabilistic Latent Semantic Indexing) 上と同じ人の論文。…
まとまってないのでちゃんと書いておこう。 perl-5.6.1-2のインストール(ダウングレード) perl-5.8.0-2には深刻な問題がある TinySVM-0.09のインストール ./configure --enable-shared=noとしてコンパイル どうしても(笑)shared library化したい場合、22…
どうやらcygwinのperlにバグがあるらしい。 詳しくはここ。 要は、現在最新のPerlバイナリは改行コードを勝手に\r\nにしてくれるのだ。 このリンク先にあるように、perlのバージョンをひとつ落とすことで、YamChaのmake check問題は解決。で、結局YamChaはTi…
コンピュータと馬鹿話がしたいのだ。 馬鹿なこと言うだけなら、かれこれ10年近く前にこんなのを作ったんだけど(最初はHyper Talkで書いたんだよなあ)、もっと発展させて、会話ができたら面白かろう、と。 新山さんによると、こういうことを妄想しちゃうの…
今の僕の力量ではいかんともしがたく、結局、断念しますた。 自宅のLinux機でデータ処理することにします。
と同時に、TinySVMの動きも怪しい気がしてきた・・・YamChaのcheckの前半部分、SVM^lightだと動くのにTinySVMだと動かない・・・。 コンパイル通るからって動くとは限らんと。 でもmake checkではエラー出てないんだけどな・・・。
どうもmmapまわりが怪しい気がしてきた。 FATAL: Chunker::open(): SVM::open(): size of model file is invalid. ってエラー、ソース見るとmmapしたモデルファイルのサイズが合ってないってことだもんなあ。 似たようなことやってる人がいたのでメモ。 それ…
TinySVM単体での動作はOKそう。 automake&autoconfのバージョンが違うらしく、configure.inやMakefile.amをいじると「Checking how to recognise dependant libraries」で違うものが認識されてしまい、DLLが作成されない。 なので、./configureした後のMakef…
ややこしいので、事実関係を整理しておく。 CaboChaが要求するもの ChaSen YamCha*1 TinySVM*2(オプション、だがYamChaが事実上要求しているという罠) ChaSenが要求するもの 特になし(2.3.0はDarts*3が必要だが、このバージョン(ChaSen-2.3.0)はmmapまわ…
cygwin環境でCaboCha*1を使いたくて、はまっております。 CaboChaはChaSen*2のshared libraryを使うことを前提に作られているんだけど、そのChaSenがcygwin環境ではうまくshared libraryを作ってくれない。 -no-undefinedして無理やり作らせてもsig11で落ち…