完全に独学・・・

ょゎさんどうもです。
僕の場合、誰かに習ったというのは全然無くて、社会人になってからの完全な独学です。Googleで手繰って手繰って手繰りまくるだけ。だから理解も中途半端で系統だってないし、そもそも数式なんて全然読めない(だから実装しようと思うと苦労します・・・)。ヘタレですんません。
「有繋文字列」はたぶん「ゆうけい文字列」だと思います。例の修士論文に断片的なコードが載ってて、ukなんたら、って関数があったので。
それと、無脳で使う分にはブラックボックスでOK、てのにも禿同です。日本語の品詞分類にコンセンサスが無い現在、統計的に処理して分割したものと品詞ありきで分割したものの優劣は一概に言えない、むしろ実装を考えると統計処理の方が良いのでは、と思ってます。
品詞ってのはそもそも「同じクラスであれば相互に入替可能な単位の集合」くらいのゆるい定義で良いのではないか。定型表現などではこの限りではないんだけど、そういう例外は文節なり文なりの上位で処理できるんじゃないかと。って、良く調べもせんで書いてます。話半分で聞いてくださいまし。
って、僕もとりあえず結果出さんとなあ。コーディング速くてうらやましいです。