2007年08月06日

cannadic改: 070805 出しますた

あぢー上に一日がかり… orz

[変更点]
・新語追加&誤登録修正(内海さん、井汲さん、登録希望さん、Ishiiさん)
・UTUMI さんの wiki-analyzed-20070303/analyzed-unknownからの取り込みの続き
・Anthy Wiki の「単語収集/未分類語」から一部取り込み
・人名ランク分け完了
・anthy-9100 の base.t からの取り込み完了
・gtankan-okuri.ctd は extra パッケージへ

最後の奴ですが、新たに「alt-cannadic-extra」というパッケージを作り、厄介の種になっていた gtankan-okuri.ctd はそっちへ移しました。
ファイル名は

 anthy用: gt_okuri.t
 canna用: gt_okuri.ctd

になっています。

以下、補足説明をば。

こいつらは以前予告していたとおり、「読み」に半角小文字の「t」を付けて変換するようになっています。

かな入力派の方などで読みに「t」を入力できない方は、予め「t」をお好きな文字に置換した上でお使いください。

anthy用は ~/.anthy/imported_words_default.d/ 以下に置いて使うこともできるような形式にしてあります。
つまり、個人辞書として、従って anthy.dic を再作成することなく、使うことができます。
ただし、anthy-8819 以降でないとダメですが。

逆に mkworddic に入れて anthy.dic に含めて使う場合は、dict.args に書く場所に注意してください。UTF-8 なので。

alt-cannadic-extra には jis第3第4水準相当単漢字辞書も入れてあります。こちらは anthy用のみです。
(cannaでも使えるという噂は聞いていますが、自分がやり方が分かりません。どなたかご存じでしたら教えてください。確認できたら canna用も入れます)

jis第3第4水準相当単漢字辞書を使うには、JIS2004 に対応したフォントと、UTF-8 に対応したフロントエンドが必要です。
UTF-8 対応のフロントエンドは、現在自分が知っているのは

 ・uim-1.4.0以降
 ・scim-anthy-1.3.0 (今のところ x86_64 では動かない)
 ・白井さんのegg-anthy

です。

jis第3第4水準相当単漢字辞書は「漢字部分」の辞書と「非漢字部分」の辞書とに分かれています。
が、非漢字部分の gt34-tankanji-hikanji.t は ~/.anthy/imported_words_default.d/ 以下に置いても読み込んで貰えません。

なので、こいつは今のところ、今まで通り anthy.dic に含めて使うしかありません。
(一応田畑さんには報告済みですが、「承認待ち」になったまま止まってます)。


<追記>
LANG=C でソートし直せば使えることが分かりました。


漢字部分の gt34-tankanji-kanji.t の方は個人辞書としても anthy.dic に含めても使えます。

# こいつらもUTF-8 なので dict.args を編集するときは書く場所に注意。

ユーザの環境に JIS2004 対応フォントと UTF-8 対応フロントエンドがあると期待することは現在ではムリなので、jis第3第4水準相当単漢字辞書はこういう風に、anthy 本体には含めず、使いたい人が各自で使う、という形にしておくしかないですが、非漢字部分の gt34-tankanji-hikanji.t が ~/.anthy/imported_words_default.d/ 以下に置いても読み込んで貰えないのは痛いです。これができれば非常にお手軽なんですが…。

あ、ちなみにこちらは送り仮名のある読みであるか否かに関係なく、基本的にはすべて「読み+t」で出すようになっています。

ただし、読みが数字や記号のものは「t」は付けません。
詳しくは README の最後の方を読むか、辞書ファイルを直接覗いてください。


…あー、こんなもんだったかな?
何か色々説明が足りてない気がしますが、とりあえず今日はここまでで。

# 「俺って説明下手だなぁ…」と README 書きながら思った…
# メチャメチャ時間かかってるし…
# Anthy-dev への連絡は明日だな…

posted by vagus at 00:21| 東京 🌁| Comment(0) | TrackBack(0) | cannadic改 - 更新情報 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック