2007年10月29日

anthy-9100d

例文数が 1万を越えたそうですね。凄いペースです。
協力された方々と作業されたいくやさんに感謝です。

使い始めてますが、それなりに効果が出てるんではないでしょうか。

個人的には、一度 make update_params したものの方が多少よくなるような気がしてますが、気のせいかもしれません。(参考)

make update_params + make update_params2 × 9回のも作ってみましたが、こっちはやり過ぎたようで、むしろ悪くなりました。make update_params2 は 2-3回くらいが適当のような気がします。全くの勘ですが。

ちなみに、update_params0 だと corpus をまったく使わないようです。つまり、辞書の設定がそのまま出るということだと思います。どのくらいコーパスが効いているか比較するのにいいんではないでしょうか。


以下、おまけ。

・ランクの補正漏れ修正
--- anthy-9100d/alt-cannadic/gcanna.ctd 2007-10-27 22:39:04.000000000 +0900
+++ anthy-9100d/alt-cannadic/gcanna.ctd.new 2007-10-29 23:16:45.000000000 +0900
@@ -117785,7 +117785,7 @@
めくらめっぽう #T15*80 盲滅法
めくるめ #K5*250 めくるめ #K5*200 目くるめ 目眩
めくるめく #RT*100 めくるめく #RT*50 目くるめく 目眩く
-めぐ #R5*501 回 #R5*302 巡 #R5*301 廻 #R5*300 めぐ #M5*251 恵 #M5*200 めぐ #JN*150 めぐ メグ #M5*100 芽ぐ 恤 #M5*10 萌
+めぐ #R5*302 巡 #R5*300 めぐ #R5*200 回 廻 #M5*251 恵 #M5*200 めぐ #JN*150 めぐ メグ #M5*100 芽ぐ 恤 #M5*10 萌
めぐすり #T35*250 目薬 #T35*200 眼薬
めぐみ #T35*250 恵み #T35*200 め組 #JN*150 めぐみ 恵 #JN*100 メグミ 愛 愛美 恵美 慈 潤 #JN*50 めぐ美 恩 芽美
めぐみの #CN*100 恵み野


・「使おうなんて」他、「…しようなんて」を出せるように
--- anthy-9100d/depgraph/v.depword      2007-06-16 06:25:01.000000000 +0900
+++ anthy-9100d/depgraph/v.depword.new 2007-10-29 20:38:43.000000000 +0900
@@ -11,7 +11,7 @@
#@動詞未然形U 5段の "う" へ続く方 「書こ う」
@動詞未然形U "う" Se@ Se@間投助詞 @と(引用)
@動詞未然形U "う" @か? @と(引用) @や @よ @ね @とか
-@動詞未然形U "う" @とする @にも @わけ @が(逆接)
+@動詞未然形U "う" @とする @にも @わけ @が(逆接) @なんて
#
#@動詞未然形5 5段の "う" へ続かない方 「書か ず」
#


posted by vagus at 23:29| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。