-----
【更新】3/28
G-HAL 氏に反応を頂いたので(いつもお世話になります…)、
実行時に学習履歴から古い日付エントリを削除するよう対応してみました。
自己責任でどうぞ。
datedic.t を更新した後、text の last-record* から日付エントリ(「きょう?」とか「ことし?」とか)の行を削除、その後、バイナリの last-record*.bin を削除します。
euc の場合も考慮したつもりですが、utf-8(last-record*.utf8)と euc の履歴ファイルが混在しているケースは考慮してません(普通、ないですよね?)
まぁ、作者が作者なので、一応、実行する前に ~/.anthy/ をバックアップしておくことをお勧めします。
一応、1世代だけバックアップ取るようにしてはありますが。
※以下の本文も若干変更しました。
P.S. 「言問橋」は「言問団子」等とともに登録させて頂きました。ありがとうございます。repo 公開準備ができるまでもうちょっとお待ちを。ここ 2ヶ月ほど格闘してるんですが、なかなかまとまらん…。でも多分もうすぐ
【更新】3/29
つまらないミスをしてコケてたので修正しました。
【更新】3/31
クォートをミスっていて、ケツの文字のない「きょう」や「きのう」等も履歴ファイルから削除されてしまっていたのを修正しました。確認したはずだったんですが…。すみません…。
ついでに、履歴ファイルが EUC、かつ、ruby1.9 を使った場合にエンコーディングがおかしくなるのも修正。
【更新】4/27
マジックコメントは "encoding" という文字列をキーにしてるんだから、"fenc" ではダメなんだよね、という訳で修正。
影響があるのは ruby1.9 系のみです。
-----
個人的には特に欲しい機能でもないんですが、「一応出来なくはない」のに「出来ない」と思われてるようなので、ruby の勉強がてら作ってみました。
datedic.rb.bz2 【更新】4/27
落として展開して実行権限付けて実行すると、
~/.anthy/imported_words_default.d/datedic.t
という辞書が作成されます(~/.anthy/imported_words_default.d/ がない場合は作成します)。
そのまま、「きょう?」と、読みのケツに "?" を付けて変換すると、「2010/3/23」や「平成22年3月23日」に変換できます。
(画像は、「-f」オプションで全角数字の候補は出さないようにしたもの)
後は、「$ crontab -e」して自分の crontab に
@daily /path/to/datedic.rb
@reboot /path/to/datedic.rb
とか書いておけば宜しいかと。
(「/path/to/datedic.rb」は「datedic.rb の絶対パス」です。例えば「/home/vagus/bin/datedic.rb」とか。)
(「@daily」は「毎日0時0分に実行」。これだけだと、0時0分にマシンが起動していなかった場合には辞書が更新されないので、「@reboot」で起動時にも実行するようにする。
※ただ、その時間にスリープ中だった場合にはどうしようもないので、その場合は手動で実行する必要があります。)
続きを読む
posted by vagus at 01:16| 東京 ☀|
Comment(10)
|
TrackBack(0)
|
日本語入力 - アプリ
|
|