【追記】6/24
【追記】8/3
霞の 2.5 が出たようなので(ありがとうございます)、そちらをどうぞ。
ラベルを「品詞」「品詞の細分類」に変更

いくつかの品詞を追加、名称変更

例によって、見よう見まねでやったのでいまいち自信がないですが、処理の部分をいじったわけではないので多分大丈夫なんじゃないかと。
「uim-dict-gtk はどうなってるのかな?」と思ってみてみたら(こっちも実は初めてちゃんと見た)、こっちは Canna の全部の品詞コードを網羅してある感じだなぁ。しかし、「実は Anthy では使われてないものもある」という罠…
個人的には、品詞コードの一覧見ながらエディタで編集するのが一番楽だと思ってるので、あまり辞書ツールを改善しようという気にはならないんですが、一般ユーザにとってはやはり「ちゃんとした辞書ツールがあるべき」なんでしょうか…。
【関連する記事】
辞書登録ですが、一般の人はおそらく「一回〜複数回入力したら覚えろ」で、辞書登録するよりも必要であれば毎回文節を調整しながら変換するかと思います。
頻繁に使うが文節を調整しても中々出せない面倒なもののみ登録する形で、文書の専門家以外は辞書は基本的に利用しないような使い方が主流だと想像しています。
適切な品詞が選べず、従って辞書作りの敷居が高くなるという状態を解消する意味では選択可能な品詞の種類が増えるのは有意義な事かと思います。
辞書登録をする時に例えば国連のようなものを名詞にするか会社名にするか、Unicodeの記号は単[漢字]なのか、後はライトユーザーにとっては「顔文字」という分類も重要な気がします。
そうですね。私もそう思います。
とりあえず、パッチは作って霞のメンテナの方へ投げておきます。
> 辞書登録をする時に例えば国連のようなものを名詞にするか会社名にするか、Unicodeの記号は単[漢字]なのか、後はライトユーザーにとっては「顔文字」という分類も重要な気がします。
まあ、確かに「分類」という意味では、「記号は漢字じゃないでしょ」という意見も尤もだと思いますし、名詞と固有名詞は「どっちで登録すべきか」と迷うことが私も結構あります。
ただ、例えば
KJ1 - 単漢字 - 一文字の漢字のみ
KJ2 - 記号 - 一文字の記号のみ
KJ3 - ひらがな - 一文字のひらがなのみ
KJ4 - カタカナ - 一文字のカタカナのみ
KJ5 - 数字 - 一文字の数字のみ
という風に品詞コードを細分化すれば、登録時に迷うことはなくなるかもしれませんが、
・変換エンジンから見れば「機能的にはどれも一緒」で区別する意味がない
・品詞コードを分けると候補の並び順に影響が出る可能性がある(単漢字系では大したことはないと思いますが、たとえば自立語の場合は慎重にやる必要がある)
と思うので、あまり名前にはこだわらずに、「どういう働きをする語か」「変換エンジンにどう扱われるか」という所で判断するべきかと思います。
なので、「単漢字」という名前でも、変換エンジンが扱う仕方が同じなら「漢字以外の候補」や「2文字以上の候補」が含まれててもよい、と。
「そういう事情を知らない一般ユーザは戸惑うでしょ」というのは勿論分かりますし、「変換エンジンがその品詞コードをどう扱うかなんて分からない」というのは実は私もそうだったりするんですが、「『単漢字』に記号を含めるのはいいのか」という点に限れば、これは同じでいいと思います。