[変更点]
・新語追加&誤登録修正(内海さん、井汲さん、登録希望さん、Ishiiさん)
・UTUMI さんの wiki-analyzed-20070303/analyzed-unknownからの取り込みの続き
・Anthy Wiki の「単語収集/未分類語」から一部取り込み
・人名ランク分け完了
・anthy-9100 の base.t からの取り込み完了
・gtankan-okuri.ctd は extra パッケージへ
最後の奴ですが、新たに「alt-cannadic-extra」というパッケージを作り、厄介の種になっていた gtankan-okuri.ctd はそっちへ移しました。
ファイル名は
anthy用: gt_okuri.t
canna用: gt_okuri.ctd
になっています。
以下、補足説明をば。
こいつらは以前予告していたとおり、「読み」に半角小文字の「t」を付けて変換するようになっています。
かな入力派の方などで読みに「t」を入力できない方は、予め「t」をお好きな文字に置換した上でお使いください。
anthy用は ~/.anthy/imported_words_default.d/ 以下に置いて使うこともできるような形式にしてあります。
つまり、個人辞書として、従って anthy.dic を再作成することなく、使うことができます。
ただし、anthy-8819 以降でないとダメですが。
逆に mkworddic に入れて anthy.dic に含めて使う場合は、dict.args に書く場所に注意してください。UTF-8 なので。
alt-cannadic-extra には jis第3第4水準相当単漢字辞書も入れてあります。こちらは anthy用のみです。
(cannaでも使えるという噂は聞いていますが、自分がやり方が分かりません。どなたかご存じでしたら教えてください。確認できたら canna用も入れます)
jis第3第4水準相当単漢字辞書を使うには、JIS2004 に対応したフォントと、UTF-8 に対応したフロントエンドが必要です。
UTF-8 対応のフロントエンドは、現在自分が知っているのは
・uim-1.4.0以降
・scim-anthy-1.3.0 (今のところ x86_64 では動かない)
・白井さんのegg-anthy
です。
jis第3第4水準相当単漢字辞書は「漢字部分」の辞書と「非漢字部分」の辞書とに分かれています。
なので、こいつは今のところ、今まで通り anthy.dic に含めて使うしかありません。
(一応田畑さんには報告済みですが、「承認待ち」になったまま止まってます)。
<追記>
LANG=C でソートし直せば使えることが分かりました。
漢字部分の gt34-tankanji-kanji.t の方は個人辞書としても anthy.dic に含めても使えます。
# こいつらもUTF-8 なので dict.args を編集するときは書く場所に注意。
ユーザの環境に JIS2004 対応フォントと UTF-8 対応フロントエンドがあると期待することは現在ではムリなので、jis第3第4水準相当単漢字辞書はこういう風に、anthy 本体には含めず、使いたい人が各自で使う、という形にしておくしかないですが、
あ、ちなみにこちらは送り仮名のある読みであるか否かに関係なく、基本的にはすべて「読み+t」で出すようになっています。
ただし、読みが数字や記号のものは「t」は付けません。
詳しくは README の最後の方を読むか、辞書ファイルを直接覗いてください。
…あー、こんなもんだったかな?
何か色々説明が足りてない気がしますが、とりあえず今日はここまでで。
# 「俺って説明下手だなぁ…」と README 書きながら思った…
# メチャメチャ時間かかってるし…
# Anthy-dev への連絡は明日だな…
【関連する記事】