2007年01月03日

JIS 第3,4水準単漢字辞書 作業開始(追記)

えー、タイトルのとおりですが、昨日から作業開始しました。

最初辞書に、以前ブックオフで 105円で買った角川の「新字源 改訂版」ってのを使ってたのですが、載ってない字が結構あって、「散々探した挙句に載ってなかった」というのを何度か繰り返した後、「あ゛ー、もうこいつじゃダメだ」とプチギレして辞書買いに行きました。

初めはやはり近所のブックオフを見に行ったんですが、2 軒回ってロクなのがなかったので、家電屋に行って電子辞書見たんですが異体字の情報とか全然出てこなかったので、早々に退散して普通の本屋にいきました。
そこで「JIS 第1~4水準完全対応」みたいなのを見つけて「おお、それはありがたい」と思ってそういうのを探しました。
結局、

 ・学研 「漢字源 改訂第四版」
 ・大修館 「漢語新辞典」

の 2つがそれに該当するらしかったので、見比べて(「何で俺こんなもんに金使ってんだろ」とか思いながら)学研の方を買いました。
本屋にあったのはちょっと古いのか、値段はそれぞれ 2,900円と 2,850円でしたが。
付録は大修館の方が良かったんですが、見やすかったのと、「親字 17,000 字」に惹かれました。

で、「これでもう『散々探した挙句に載ってなかった』っていう思いをせずに安心して引ける」と思ったんですが、しかし、使ってみると不満が…
せっかく JIS やユニコードのコード番号載せてるんだから、そのコード番号で引けるようにしてくれればいいのに、なんで文字コードの索引をつけてくれないんだろうか?
大修館の方にも多分なかったよなぁ。
ありゃ一発なのに…

やってみれば分かりますが、漢和辞典って引くのに頭の柔かさを要求されるんだよなー。
「この文字、どの部首で引きゃいいんだ?」と思って色々探すも見つからず、「しょうがねぇな」と総画数でたくさんの文字の中から探してやっとこさ見つけてみたら、思いもしない部首のところにあった、とか結構あるんだよね。特に第3、第4水準の漢字とかになると。

まあ、載ってないより遥かにマシですが。

そんなこんなで作業は進めてますが、第3、第4水準の文字が実際実用的に使えるようになるのはいつなんでしょうね。

以下、メモ。

JIS2000情報
  habian での字形の画像データとかコード一覧とかあって役立つ
Vistaで化ける字,化けない字 [NIKKEI ITPro]
安岡孝一
  上記記事の筆者のサイト

<追記>
「Gnome キャラクタマップ」素晴らしい。「KCharSelect」つかえね

<追記 2>
昨日書き忘れたが、sed, awk, sort, uniq 等のテキスト処理系のコマンドはまだこの辺の文字には未対応らしい。
気をつけてないとハマる。

posted by vagus at 15:53| 東京 ☀| Comment(11) | TrackBack(0) | cannadic改 - その他 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
どうでもいい情報ですが、scim-tomoe-0.5.0に「Gnomeキャラクタマップ」を載せました。
Posted by ashie at 2007年01月04日 16:08
ぬお! scim-anthy にはお世話になってます m(__)m
今年もよろしくお願いします。

では早速と思ったのですが、tomoe-0.5.0 は入ったのですが、libtomoe-gtk-0.5.0 でつまづきますた…
./configure は通ったんですが、make でコケました。
-----------------
Making all in test
make[1]: ディレクトリ `/home/jn/work/pkg/others/libtomoe-gtk-0.5.0/test' に入ります
if gcc -DHAVE_CONFIG_H -I. -I. -I../src -I/usr/include/cairo -I/usr/include/freetype2 -I/usr/include/libpng12 -I/opt/gnome/include/gtk-2.0 -I/opt/gnome/lib64/gtk-2.0/include -I/opt/gnome/include/atk-1.0 -I/opt/gnome/include/pango-1.0 -I/opt/gnome/include/glib-2.0 -I/opt/gnome/lib64/glib-2.0/include -I/usr/include/tomoe -I/opt/gnome/include/glib-2.0 -I/opt/gnome/lib64/glib-2.0/include -I../src -I../src -DSYSCONFDIR=\""/usr/etc"\" -DDATADIR=\""/usr/share"\" -DTOMOESYSCONFDIR=\""/usr/etc/libtomoe-gtk"\ -DTOMOEDATADIR=\"".."/data\" -g -O2 -Wall -Wmissing-declarations -Wmissing-prototypes -Wpointer-arith -Wcast-align -MT testtomoegtk.o -MD -MP -MF ".deps/testtomoegtk.Tpo" -c -o testtomoegtk.o testtomoegtk.c; \
then mv -f ".deps/testtomoegtk.Tpo" ".deps/testtomoegtk.Po"; else rm -f ".deps/testtomoegtk.Tpo"; exit 1; fi
In file included from ../src/tomoe-gtk.h:29,
from testtomoegtk.c:2:
../src/tomoe-gucharmap.h:27:33: error: gucharmap/gucharmap.h: そのようなファイルやディレクトリはありません
In file included from ../src/tomoe-gtk.h:29,
from testtomoegtk.c:2:
../src/tomoe-gucharmap.h:58: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘*’ token
make[1]: *** [testtomoegtk.o] エラー 1
-----------------

gucharmap-devel は入れてあって、gucharmap.pc は
-----------------
prefix=/opt/gnome
exec_prefix=${prefix}
libdir=/opt/gnome/lib64
includedir=${prefix}/include

Name: gucharmap
Description: GTK+ Unicode Character Map
Version: 1.8.0
Requires: gtk+-2.0 glib-2.0 libgnomeui-2.0 libgnome-2.0
Libs: -L${libdir} -lgucharmap
Cflags: -I${includedir}
-----------------
で /opt/gnome/include/gucharmap/gucharmap.h が存在することは確認したんですが…
何か、gcc に gucharmap.h を include するのに必要なオプションが渡ってない気がするんですが、自分にはこの辺のことはよく分かりませんです。
すみません。
Posted by vagus at 2007年01月04日 22:19
あれから、libtomoe-gtk-0.5.0/test/Makefile の INCLUDES に「-I/opt/gnome/include」を書き足して無理やり libtomoe-gtk は入れましたが、今度は scim-tomoe がやっぱり「gucharmap/gucharmap.h がない」と言われて make られません orz
src/Makefile の INCLUDES とかに手当たり次第「-I/opt/gnome/include」を書き足しましたが通りませんでした。
suse が特殊だからですか?
でも、Makefile.in にも gucharmap に関する項目はないですし、./configure でも gucharmap の検査はないみたいですし、これって現在ビルドできる状態にあるんでしょうか…?
Posted by vagus at 2007年01月12日 11:06
今ググったら vine には scim-tomoe-0.5.0 のパッケージがちゃんとあるのか…
じゃ、何でダメなんだろ…。後で時間のある時に vine のパッケージ覗いてまたトライしてみます。

# scim-gucharmap なんてのもあったんですね。今気づきました
Posted by vagus at 2007年01月12日 19:08
何かちょっとだけ分かった気がしてきた。
 pkg-config --cflags-only-I gucharmap
の中に -I/opt/gnome/include がないのがいかんのかな?
suse のせいか。疑ってすみません。
でも、何でないんだ…

何かもう意地になってきたな
Posted by vagus at 2007年01月12日 19:41
すんません、たぶんlibtomoe-gtk側のミスです。
gccのバージョンによってはビルドが通ってしまうようです。

他の方からも指摘があったのでCVS版で修正しました。
Posted by ashie at 2007年01月15日 09:51
> gccのバージョンによってはビルドが通ってしまうようです。

分からんわけだ… orz

ともあれ、凄いソフトだと思います。
これからもときどき追っかけさせて貰います。
Posted by vagus at 2007年01月16日 10:49
足永さんはコメント欄は追っておられないと思いますので、
問題があったときは ML に送ったほうが良いと思います。
別件があったので先週の土曜に一緒に送っておきました。
http://lists.sourceforge.jp/mailman/archives/tomoe-devel/2007-January/000142.html
(一番下の「別件ですが」以降)
Posted by ut at 2007年01月16日 18:58
また気づくのが遅くてすみません(今回は出先なので)

> 別件があったので先週の土曜に一緒に送っておきました。
わざわざありがとうございました(以前にもありましたね。すみませんです)。

ただ、今回のはてっきり自分の側の問題(環境/知識/時間)だと思っていたので、そもそも ML に投げることは頭にありませんでした。
そう言われて思い出しましたが、以前足永さんに「環境依存の問題でも結局はプログラム側の問題であることが多いので気にせず投げてください」というようなことを言って頂いていました。投げればよかったですかね。

でも、正直なところ、ML は好きじゃないのでどうしでも腰が重くなります。
anthy-dev だけは(cannadic改の関係上)義務感みたいなものもあるので、相手にされなくても投げるだけは投げますが。
Posted by vagus at 2007年01月17日 21:50
>でも、正直なところ、ML は好きじゃない
ML は一度送ると編集できないので、
送信するのにためらいますね。

私の場合はパッケージングの都合もあるので、
落ちたりビルドエラーが出たときは
なるべく連絡するようにしています。
Posted by ut at 2007年01月19日 22:59
> ML は一度送ると編集できないので、
それもありますね。
私の場合、「ML は敷居が高い」というのが大きいです。
ML だと「まず subscribe して…」で、入ったら入ったでお互い顔見知りの人たちの中によそ者が一人紛れ込んだみたいで浮いてそうだし、プログラムできる人たちばっかみたいでまた浮いてそうだし、と色々気になるのが嫌なので。
掲示板なら一見さんの単発質問でもしやすいんですが(ここだけは windorz 界隈のフリーソフトのノリの方が好きです)。
まぁ、昔からの文化なのでここで愚痴っても仕方ないんですけどね。
Posted by vagus at 2007年01月20日 22:40
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック