2006年12月04日

anthy.dic

色々やってたら、ワケ分からんくなった orz
一応、i586/x86_64 用 anthy.dic (anthy-8300, alt-cannadic-061203) を落とせるようにしました
/usr/share/anthy に(大抵)あるデフォルトの anthy.dic と置き換えてお使い下さい。

併せて、cannadic改も出し直しました。

品詞毎の基準となる頻度を色々いじりました。
普通名詞なら、これまで 100 を基準にしていたのを 200 にしたり、動詞は 300 にしたりとか。
また、普通名詞で、Yahoo での hit 数が 100 未満だったものは 20 に下げてます。

それで賢くなったかというと、よく分かりませんが…

重要な変更点として、単漢字の出し方を元に戻しました
ishii さんから要望があったのと、anthy で試したところ、田畑さんが対応してくださったのか、8300 でも 8327 でも先頭に単漢字がくることはなくなっていたのに気づいたので。

もし「読み:」の出し方の方がお好きな方は、お手数ですがご自分で「:」付きにしてください。

mv gtankan.ctd orig-gtankan.ctd
sed 's/^\([^ ]*\) /\1: /' orig-gtankan.ctd > gtankan.ctd

とか。

posted by vagus at 01:47| 東京 ☀| Comment(0) | TrackBack(0) | cannadic改 - 更新情報 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。