2009年05月05日

自作 depgraph 更新(5/4) - 出し直し(5/6)

【追記】5/6
いくつかミスを発見したので出し直しました。

---------------
alt-depgraph 更新しました。

多分、常用しても問題ないくらいにはなったと思います(ほんとか?)ので、ヒトバシラーズの皆様には是非積極的に使って頂きたく。

※「常用しても問題ないくらい変換精度が上った」という意味では決してありませんので、そこは誤解なきように。「付属語グラフが、通常使われる表現はほぼ出せるレベルになった」という意味です。「付属語グラフ」というのは、ごく簡単に言うと、助詞や助動詞がどういう自立語に付くか、また、助詞助動詞同士はどういう繋がり方をするか、というのを定義したもののことです。例えば、ここに「名詞の後ろに助動詞『です』が付く」という定義がないと、「のみものです」を変換しても「|飲み物|デス|」とかになってしまい、「|飲み物です|」と一文節で出すことができない、というようなものです。

【変更点】
・G-HAL 氏のパッチを patch13Bptn23.2009503 に更新
・G-HAL 氏のパッチを使用する場合、文末属性を利用するように
D2T35 を再有効化
カ変とサ変「する」で、同じ活用形に複数の読みがある場合に、それらを区別するように

【注意点】
・G-HAL 氏のパッチが patch13Bptn22 で、再度「学習データ形式変更」になっています。原作 anthy もしくは G-HAL 氏の以前のパッチを当てた anthy を使っていて、かつ、学習機能を利用している場合は、形式変換の作業が必要になるそうです。
詳細はこちら
学習データの形式が、また変更になっています。 オリジナルの Anthy もしくは patch1〜patch13Bptn21 までの Anthy から patch13Bptn22以降に移行する場合、 一旦、

% rm ~/.anthy/last-record1_*.bin
% anthy-agent --update-base-record
% rm ~/.anthy/last-record1_*.bin
% anthy-agent --update-base-record

を実行(同じ事を2回繰り返していますが、間違いではありません)して、 学習データの形式変換をして下さい。


posted by vagus at 01:00| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック