2009年04月13日

「未完成らしい」他 【追記】4/13

4月も早 10日あまりが過ぎましたが、G-HAL 氏の日記が「その2」に移っていることに昨日やっと気づきました orz
そして、またありがたい情報が。いつもありがとうございます。

「未完成らしい」が一文節で出ないのは depgraph の問題でしたので、登録しておきました。

それ以外は辞書の方の問題ですが、こちらはちょっと面倒なので明日書きます(『レッド・クリフT』見てたら遅くなってしまった)。


# ところで、先月くらいから「病気か?」と心配になるくらい頭が動かんのですが、何とかならんのか > オレの脳味噌さん

【追記】4/13
1文節で出ない:
|みかんせいらしい| |未完成らしい|

T16 に助動詞「らしい」が接続するようになっていなかったので追加。ついでに、T17 も。さらにいくつか気づいたのを追加。

1文節で出ない:mkworddic 関連なので alt-depgraph, alt-cannadic は無関係。
|げんいんついきゅうできる| |原因追及できる|、「|げんいんついきゅうが|できる|」(|原因追及が|できる|)が本則?で、「原因追及|できる」は音便?かもしれない?。
|げんぶつしきゅうする| |現物支給する|、「|げんぶつしきゅうを|する|」(|現物支給を|する|)が本則?で、「現物支給|する」は音便?かもしれない?。

「現物支給」は現状 alt-cannadic には登録されておらず、mkworddic/compound.t に T35 で登録されているので、一文節にすると「する」には接続できないというわけですね。
→ alt-cannadic に T30 で登録しました。

「原因追及」も「現物支給」と同様、alt-cannadic にはなく、mkworddic/compound.t に T35 で登録されている。なので、これも T30 で…って、ちょっとマテ。
普通「原因のツイキュウ」といった場合には「追及」ではなく「追究」が正しいはず。が、Yahoo! で検索してみたら

 原因追求 358,000件
 原因追及 204,000件
 原因追究 64,200件

という結果に…。ナンテコッタ。
文脈によっては「追及」でも正しい場合はあるかもしれないが(国会での野党による事故原因の追及(政府に対する追及)みたいな文脈で)、「追求」はあるかなぁ…?
むー、誤りなら入れたくないが、これだけ多いと無視するのも勇気が…。もうちょっと悩むことにします。

1文節で出ない:単語登録が無いので、1文節になるわけが無い。
|よてい|ろが| 「|予定|路が|」 → 「|予定|路|が|」になってしまう。「路」は単漢字。

これは仰るとおり。「予定路」を登録、「路」も T35 で登録しました。

1文節で出ない:音便?かもしれないので、1文節にならない方が適切かもしれない。
|かきかたして| |書き方して| #T35。「|かきかたを|して|」(|書き方を|して|)が本則?で、「書き方|して」は音便?かもしれない?。
|かきかたする| |書き方する| #T35。「|かきかたを|する|」(|書き方を|する|)が本則?で、「書き方|する」は音便?かもしれない?。

これが一番判断が難しい。「1文節にならない方が適切かもしれない」と書かれている通り、通常はサ変名詞には含めないんじゃないかと思いますが、でも「する」に接続できた方が変換上良さそうにも思えるなぁ。
ただ、

 ・「〜し方」のパターンの複合語はいくらでもあるが、全部辞書に登録するのか
 ・動詞連用形について複合語を作る接尾語の D2T?? という品詞コードもあるが、いつの頃からか効かなくなってて使えない(多分ありえない候補を作りまくるので無効化したんだと思いますが)
 ・使えたとしても、「食べさせ方」「褒められ方」のように助動詞が付くものには効かない

しなぁ。
逆に、「かた #T30 方」にして「書き|方する」「遊び|方する」「食べさせ|方する」「褒められ|方する」と区切るようにする手も考えられるけど、読みが短くなる分多分誤変換は増えるような気がする。が、そこそこ行けそうな気もする。
あとは、alt-cannadic でも anthy の複合語方式の登録を解禁するか(現在は人名フルネームのみ使用)。
ちょっと色々試してみます。

1文節で出ない(alt-depgraph-090402 の問題では無い):既出(丘の道を登り - 2009年03月14日)。
|しょざいする| |所在する|、#T35 → #T30 ?
|しょざいしている| |所在している|、#T35 → #T30 ?
|みていが| |未定が|、#T16 → #T15 ?
|けんえんする| |倦厭する|、#T35 → #T30 ?
|けんえんされそうな| |倦厭されそうな|、#T35 → #T30 ?
|けんえんしているらしい| |倦厭しているらしい|、#T35 → #T30 ?

1文節で出ない(alt-depgraph-090402 の問題では無い):既出(丘の道を登り - 2009年03月10日)。
|しゅくたいさせる| |縮退させる|、#T35 → #T30。
|しゅくたいした| |縮退した|、#T35 → #T30。

1文節で出ない(alt-depgraph-090402 の問題では無い):既出(丘の道を登り - 2009年03月09日)。
|どうこんした| |同梱した|、#T35 → #T30。
|どうこんして| |同梱して|、#T35 → #T30。

はい。すべてその通りです。alt-depgraph-090408 には反映させてませんでしたが、手元では修正済です。

忘れてた、「ある程度」。
基本的には、「ある|程度(T35)」と区切って出すべきものだと思っています。では、なぜ「あるていど #F14 ある程度」を入れたか。もう登録した時のことは覚えていないんですが、多分

 ・誤変換を起こした
 ・「ある程度進んだら」「ある程度終わったので」のように副詞的に使われるがあるので、文節のつながり上、副詞にもあった方がいいと思った

からだと思います。

変換時には、後ろに助詞が付かない時は F14 の「|ある程度|」が使われ、助詞がつく時には「|ある|程度の|金額|」と T35 の「程度」が使われるので一応問題は出ないと思います。「ある」の後ろで区切られたり区切られなかったりするのが混乱を招くと言われればその通りなんですけども。
それも「あるていど #F14 #_2ある_3程度」という風に複合語方式で登録すれば解消できることは解消できますが。
やっぱ、複合語方式解禁した方がいいのかな…。

「[こそあど]の程度」(T35)は元々 cannadic にあったのがそのまま残ってます。こいつらも F14 にしておいた方がいいかもしれないですね。
posted by vagus at 00:08| 東京 ☀| Comment(0) | TrackBack(0) | cannadic改 - 作業メモ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。