2009年05月04日

一つの活用形に複数の読みがある場合

昨日、「オリジナルの anthy の方で『来んな』を出せるように出来ない、D2T35 も有効化できない」とか騒いでましたが、やっぱり単純ミスでした。

それはすぐ直せたんですが、別の問題に気づいてしまった。

カ変「来る」やサ変「する」は、語幹そのものが変化するというか、語幹と活用語尾の区別がないので、活用形そのものが辞書に登録してある。他の動詞は語幹だけ。

しかも、例えば「する」の場合、未然形は「さ」「し」「せ」と 3つもある。命令形も「しろ」「せよ」の 2つがある。

しかし、anthy には一つの活用形に複数の読みがあるという前提がない。「さ」も「し」も「せ」もすべて「サ変『する』の未然形」で同じ扱いになる。従って、いくら付属語グラフで未然形「し」と未然形「せ」で接続を分けても、区別なく両方に接続してしまう。
(「さ」は「させる」「される」を辞書に登録してあれば実質的に不要と思われるので入ってない。また、カ変とサ変「する」以外は語幹と活用語尾が分かれており、付属語グラフでいくらでも対応出来るので問題は起こらない)。

同じ事がカ変終止形「来る」と「来ん(「くんな」の「くん」)」でも起こる。

「そんな基本的なこと、今ごろ気づいたんか」と言われそうですが、そうなんですよねぇ、参ったね。
というわけで、色々ゴチャゴチャといじって、「同じ活用クラスの同じ活用形でも区別できるように」とやってましたが、結局、非常に不細工な方法でしか回避できなかった…。

興味のある奇特な方は、明日出す予定の depgraph改の
 anthy/wtype.h
 src-worddic/ptab.h
 src-worddic/wtab.h
あたりを以前のと見比べて下さい。
【追記】5/4
説明するのが面倒 & 変更箇所はごくわずかだったのでこう書いたんだけど、何か却って勿体つけて興味を惹こうとしてるみたいだな…、これじゃ。
簡単に言うと、品詞コードをもう一つ作って、「する」なら

 品詞コード SRV : し し する する すれ しろ
 品詞コード SRV2: せ ○ ○ ○ ○ せよ

という風に分けることで区別した、ということです。

posted by vagus at 01:34| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。