自然言語処理
ょゎさんのところ経由。無茶苦茶面白い。必読です。 どの作品(笑)も出来が良いのですが、個人的にはものすごい努力の後に驚愕のオチwが待っている「古着の卸」がお気に入りです。マボロシグワシ。ところで、このように単純に単語だけではなく文節を抽出す…
例の「恋するプログラム―Rubyでつくる人工無脳」(ASIN:4839917299)を購入。まだぱらぱらとしか見てませんがよさげです。まあパターン辞書や感情等、僕とやりたい方向がだいぶ違う感じですが、一般的にはそっちの方が受けが良いだろうなあ。ついでに(とい…
む。こんな本がいつの間に。たぶん買っちゃう。でもプログラム関係の本全部処分しちゃったんだよなあ(遠い目)。うう。 ょゎさんのところより。遅ればせながら消えちゃったデータのご冥福をお祈りいたします。Sixamo2、草葉の陰より期待しております。
むのーblog: なまこ作者のNizahさんの日記。次期バージョン期待してます。 antipopさんによるマルコフ連鎖による文章の自動生成。マルコフ連鎖というか、無脳での文生成に関しては、Margarine作者lemoさんによる記憶と生成のしくみについてがわかりやすいで…
id:huixingさんの日記より。 how catty works?によると; * no lexical analysis * no language parsing or pattern matching * no knowledge about language she is using * no neural networks and other complex solutions * no organized knowledge data…
7-8倍高速!スバラシスギ! ・・・またCygwin環境でコンパイルしないとな。時間かかりそう。うう。
メモ。面白そう。どこで見つけたのかは失念してしまいました。
Yet another Sixamo's diary(笑)。ニュースのリンクにコメントを付けるという形式は読兎さんと同じだけど、ちょっとアプローチが異なっており面白い。ょゎさんのところから。 ところでこうして無能/無脳たちの語る言葉を読んでいると、面白いとはなんなの…
まあこんな変な要求をする人はあまりいないんでしょうが、実際やってみると無茶苦茶はまります(というか一時期断念してました)。 以下、知識が全くない僕が何とか動くようにした記録です。変なところがあれば教えてくださいまし。 CaboCha-0.43が要求する…
Ad hocでない対応を思いついたのでメモしておこう(いや括弧だけ特別扱いなんで結局はad hocではあるんだけど)。 開き括弧から閉じ括弧までをひとつのトークンとみなし、まず普通にマルコフ連鎖を作る。次に括弧内について、同様にマルコフ連鎖でトークンを…
ちょっと反応遅れましたが、心よりの禿同を贈ります。他にも括弧の対応とか色々、やろうと思えばできるんだけど、やりだしたらキリがないんですよねえ。まあ「人手をかける無脳」路線とのハイブリッドもアリとは思うけど、ここはストイックに統計一本で勝負…
先日書いたSixamoの「ボクとsixamoとsixamoの生きる海」に続いて、maroさんのとぼっちも日記を始めたようです。素晴らしい。 で、Ghotiも続きたいところですが作者のリソースが足りないので出来ません。うう。 と思ったらGhoti日記なるもの発見(ご愛顧あり…
Sixamoが日記書いてます。何だかすごいことになりそうな予感。楽しそうだなあ。今後に期待。ょゎさんのところより。
ょゎさんのところより。反応が遅れたのは数式にびびったからではありません。ええありませんとも。
くどうさんの日記から。メモ。 無脳で使うには確かにChaSenの出力(ということはつまりIPA品詞体系)は細かすぎるんで困ってたんですが(Ghotiでは無理やり品詞をくっつけて使ってます)、そうかJumanの辞書をMeCabで使えば良いのか。
ヒビルテさんからお返事をいただく。 うーん、なんらかの意味で意味を扱っている(笑)無脳としては、ょゎさんのところのSixamoが挙げられるかなあ。「連想としての意味」(pdf)を実装したと聞いてますがその後如何お過ごしでしょうか>Sixamo。 それと、ロ…
メモ。なんか前にもメモった気がするけどまあ良いや。
ヒビルテさんとHarukaさんのところで使っていただいているのを発見。Harukaさんのところでは会話例もあります。元ネタが良いせいか、かなり笑える会話になってます。学習用データって大事。 ところでヒビルテさんのところで出されている疑問なんですが; 人…
森山さんの日記より。Intelのpress releaseとSourceForgeのOpenPNLプロジェクト。何かに使えるかな。何かって何だ。
メモ。全然「自然言語処理」じゃないけど。
小宮さんの無能プログラム。会話例も。すごい。興味深い。ある程度まとまったところでソースを公開していただけると嬉しいなあ。 小宮さんのアプローチは僕が考えているもの(「大量学習と大量の結果例から『なんとかしる』ってやり方」)とは正反対で、「岩…
Yet another 人工無能。同じくたつをさんのChangeLogより。 たつをさんとの会話例を見てその賢さに恐れ慄くも、きたさんの今日のなんでやねんで挙げられている例を見てちょっと安心。キーワードを登録していく古典的なタイプの無能らしい。 登録されたキーワ…
昨日の高尚な話題をGhotiに仕込んでいただいたのは、おなじみReCollectionのtaroさんでした。これからもこの子をよろしくお願いしますね(出来の悪い子を持つ母の気持ちw)。余談ですが確かにクロスリファレンスにはちょっとくらっとくるものがあります。こ…
例のGhoti-ircのWebゲートウェイですが、ゼロから育てた割にはまあまあ会話になってきた感じ(まだ鸚鵡返しが多いけど)。ちょっと長いですがさっきの会話の内容を全部ご紹介しましょう。しかし誰ですかこんな高尚なネタ教えたの(笑)。 >svnseeds 今日は理…
面白そう。無脳より作るの楽かな。会話って結構面倒(ちょうどいいコーパスが無いので学習が難しい)だし。ちょっと考えてみよう。 過去の日記を元に名詞と動詞をリンク付けしながら抽出して、キーワードをはめこめばいけそうな気がする。名詞間でも関係を持…
メモ。人工知能学会論文誌が2001年以降のものについてオンラインで参照できるようになっていた。しらなんだ。傀儡師の日記より。
ナゾの数学者hoodgee先生がGhoti-IRCのWebゲートウェイをたててくれました。デフォルトのままログインしてください。ファイアウォールの関係でうまく動かない可能性もあります(うちだw)。お試しください。ちなみに辞書はまっさらなので、相当間抜けです。…
新山さんのところより。忘れてた。メモ。それと、本家も。今更ですが僕のカテゴリ分けは適当です。
ょゎさん、ご紹介ありがとうございます。 僕も最近全然いじる暇がなくって細部(って程のモノでもないけど)はほとんど忘れてしまったなあ。大きい変更の企画はまだまだ先になりそうなので、すごく昔に作った駄文生成プログラム(reloadで毎回更新します)の…
ふと思いついて、Margarineのlemoさんも言及しているRacterのソースを探してみた。僕も大学時代にデュードニーの別冊サイエンスのコンピュータレクリエーションIIIでラクターの存在を知って以来、いつかこんなの作ってやるぜと思っていたのです。 で、結論。…