これに気づいたのは少し前で、その時は「5段動詞仮定形+まい」だろうと安直に思ってそれで出せるようにしたのですが、気になって辞書を引いてみると「まい」が仮定形に接続するとは一言も書いてない。
「それじゃ一体、どういう構成になってんだ?」と思って、mecab(ipadic) に「動けまい」を食わせてみたら、
動けまい
動け 動詞,自立,*,*,一段,未然形,動ける,ウゴケ,ウゴケ
まい 助動詞,*,*,*,不変化型,基本形,まい,マイ,マイ
EOS
という。
一段動詞だぁ?
納得がいかない。絶対に行かない。
「動ける」が一語の一段動詞だというのか?
もしそうなら、それは「助ける」や「受ける」といった語と同類だということになると思うが、「助ける」や「受ける」に可能の意味はない。しかし「動ける」には可能の意味が入っている。というか、モロ「可能」だ。同じではありえない。
そもそも辞書には「動ける」では載ってない。ということはやはり、これは一語ではなく「5段動詞『動く』+可能の助動詞」の二語のはずだ。
じゃあ、仮定形「動け」+助動詞「る」なのかというとこれも違う。
「動けない」には「る」は入ってないのに可能の意味は残ってる。
「なら、何なんだよ」と思って考えた。
結論。
・5段動詞「動く」の語幹は「うごk」である
・「動ける」は語幹「うごk」+可能の助動詞「eる」である
うごk-eる
・「動けない」は語幹「うごk」+可能の助動詞「eる」の語幹「er」+否定の助動詞「ない」である
うごk-e(r)-ない ※音が「rnai」と子音が連続するので「r」は落ちる
・「動けまい」は語幹「うごk」+可能の助動詞「eる」の語幹「er」+助動詞「まい」である
うごk-e(r)-まい ※音が「rmai」と子音が連続するので「r」は落ちる
一段動詞の場合はどうか。例えば「助けられる」。
これも、
・一段動詞「助ける」の語幹は「たすけr」である
・「助けられる」は語幹「たすけr」+可能の助動詞「aれる」である
たすけr-aれる
・「助けない」は語幹「たすけr」+否定の助動詞「ない」である
たすけ(r)-ない ※音が「rnai」と子音が連続するので「r」は落ちる
・「助けられない」は語幹「たすけr」+可能の助動詞「aれる」の語幹「aれr」+否定の助動詞「ない」である
たすけr-aれ(r)-ない ※音が「rnai」と子音が連続するので「r」は落ちる
・「助けられまい」は語幹「たすけr」+可能の助動詞「aれる」の語幹「aれr」+助動詞「まい」である
たすけr-aれ(r)-まい ※音が「rmai」と子音が連続するので「r」は落ちる
聞いたことない説明だが、こう考えないと筋の通った説明はできないと思う。
(まだ未然形とかの活用形がどういうことになるのかは考えてないし、考え足りないところはあると思うが)。
よく言う「受身や可能や尊敬を表す助動詞『れる・られる』」は、本当は「eる・aれる」じゃないかと思う。そうじゃなきゃ「動ける」に可能の意味があることの説明がつかない。語幹が「er・aれr」なのか「e・aれ」なのかはまだよく分からんが。
もっと言えば、「aれる」も元々は動詞「ある」+「eる」なんだろう。
つまり、「助けられる」は「助ける状態にあることができる」ってことなんだろう。
「ら」抜き言葉は本当は抜いたり省略したりしてるんじゃなく、他の動詞と同じように「eる」を使っただけで(たすけr-eる)、本当は「aれる」の方が冗長で特殊なんだ、と言えるかもしれん。
「eる」は「得る」が助動詞化したものなのか、それとも逆に「eる」が動詞化して「得る」になったのかしらんが、同源なのは確かだろうと思う。
まぁ、自分が数時間で考えつくようなものなんで、国文とか言語学の人が多分とっくに言ってることだろうと思うし、言ってなければまだ考え足りないところがあるんだろうと思いますが、ここで自分が言いたいのは「正しい文法理論は何か」ではなくて、「これを anthy と cannadic改でどう実現したらいいか」ってことです。
もし「正しく変換するためには、活用や接続はかなを使うのではダメで、さらにローマ字に分解しなければならない」のだとしたら、多分「anthy を根本的に改造しないとダメだ」ということになるんだろうと思う。
さすがにそれはあんまりなので、「じゃあ、ローマ字に分解せずにかなでやるとして、つまり今の anthy のやり方を踏襲するとして、どうすれば正しく出せるようになるか、また正しくないものを出さないようにできるか」ということになるわけですが、一応やってできなくはないだろうと思ってます。それでも結構いじらないとダメなんじゃないかと思いますが。
mecab(ipadic) が「動ける」を一段動詞として登録してるのも、かなだけで済ますための苦肉の策なのかもしれんな。
一応辞書側で対応するとどうなるかと思って、5段動詞え段を一段動詞に変換するスクリプト書いて見たら、13,000 エントリ強ありました。
まぁ、やってもいいんですが、それだと cannadic改を使ってくれる人はいいですが、cannadic や他の辞書を使う人は出せないままになってしまうので、anthy 側でやった方がいいでしょう。
すでに anthy では五段動詞を流用して下一段動詞の「可能動詞」として「動ける」「殺せない」等は出せるようになってるわけだし。
ただ、接続が元の五段動詞と下一段にした可能動詞とで同じになってるのが結構あるようで、「泳げせる」とか「泳げまくる」とかありえない接続ができてしまっているので、これを区別するようにすればいいと思ってます。
ただ、それが大変なんだが…
【関連する記事】
活用の種類の情報が入っていることにいま気づきました。
種類を判定するコードを苦労して書いたというのに。:-p
頻度調整を施しました。
詳しいことは word-counter-0.0.5 の README に
書いています。
単純分析と未知語に変更はありません。
後で見させていただきます。
wikicanna と alt-cannadic との差分を取るツールを
作って(差分を取るのに 3-4 時間かかります)、
merged-altcanna というdiffファイルを作りました。
この merged-altcanna を wikicanna 用に頻度調整して
wikicanna に追加しました。
差分作成ツールは word-counter-0.0.6 に入れています。
コンパイル済みファイルもアップロードしています。
(ソースの段階では完全に分離しています)
もうちょっと詰めれば実用的になるかもしれません。
(そこまでやるか分かりませんが)
wikicanna-* に統一しました。
tabata さんが anthy-8604 をプッシュされていたので
8604 用にコンパイルしました。
明日にでも試してみます。