compound.t は SKK 辞書(多分 L 辞書だと思う)を元にしてるというのは覚えてて、「てことは、nosuke さんが挙げてるようなのが SKK 辞書にもあるのかな?」と思って L 辞書を覗いてみたところ、あるものもあればなくなってるのもあるみたい。
なら、まず「compound.t にあるけど L 辞書からはなくなってるもの」を洗い出してそれをチェックしてから、nosuke さんがやられたような作業をすれば少しは楽かな?とか考えてました。
でも、そこでふと気づいた。
cannadic改なんかとは違って素晴らしい SKK 辞書は、誤登録も単に修正したり消したりして終わりではなく、ちゃんとそれらのエントリを理由つきで記録として残してあります(本当に頭が下がりますね、これは)。
ということは、それらの編纂記録を見れば、誤登録を簡単に見つけることができるかも。
実は、SKK 辞書と cannadic には同じ誤登録がかなりあります(理由は大体想像がつきますが)。なので、SKK の方で直してくれた誤登録は、そのまま cannadic改でも直すべきものとして参考にすることができます。
「こりゃいいことに気づいた」と思って早速 SKK-JISYO.wrong の「okuri-nasi」部分のみをとりあえず対象にして、cannadic改に同じ誤登録がないか調べてみたところ、結局 10個くらい見つけることができました。いやいや、感謝感謝。
まいかたし 枚方市なんてのがまだ残ってたなんてのはショックでしたが…。地名はほぼ全部作り直したと思ってたんだが…。
「okuri-ari」部分は調べるのがかなり面倒な上に、以前全部見直してるからまずないと思うので多分やらない。やるとしたら SKK-JISYO.noregist の「okuri-nasi」部分か。でも、明日から数日家を空けてしまうんで、帰ってからですな。
今の地名拡充作業に飽きたら、compound.t も見てみようと思う(ホントかよ
あと、nosuke さんが挙げられてるような「読みの表記の揺れ」(っていう言い方でいいのかな?「ぢ」と「じ」、「ず」と「づ」、「すうがくか」と「すうがっか」みたいなやつ)の問題についても書いておきたい。が、多分まとまりはしない。この辺は日本語の方に問題があるんで、きちんとした対応をすることはムリ(だと思う)。
【関連する記事】