2007年08月30日

虫取り

nosuke さんが compound.t を探検、色々発見されてるのを読んで、自分もちょっと思うところがあって今日はその辺をゴニョゴニョとやってました。

compound.t は SKK 辞書(多分 L 辞書だと思う)を元にしてるというのは覚えてて、「てことは、nosuke さんが挙げてるようなのが SKK 辞書にもあるのかな?」と思って L 辞書を覗いてみたところ、あるものもあればなくなってるのもあるみたい。

なら、まず「compound.t にあるけど L 辞書からはなくなってるもの」を洗い出してそれをチェックしてから、nosuke さんがやられたような作業をすれば少しは楽かな?とか考えてました。

でも、そこでふと気づいた。
cannadic改なんかとは違って素晴らしい SKK 辞書は、誤登録も単に修正したり消したりして終わりではなく、ちゃんとそれらのエントリを理由つきで記録として残してあります(本当に頭が下がりますね、これは)。
ということは、それらの編纂記録を見れば、誤登録を簡単に見つけることができるかも。

実は、SKK 辞書と cannadic には同じ誤登録がかなりあります(理由は大体想像がつきますが)。なので、SKK の方で直してくれた誤登録は、そのまま cannadic改でも直すべきものとして参考にすることができます。

「こりゃいいことに気づいた」と思って早速 SKK-JISYO.wrong の「okuri-nasi」部分のみをとりあえず対象にして、cannadic改に同じ誤登録がないか調べてみたところ、結局 10個くらい見つけることができました。いやいや、感謝感謝。
まいかたし 枚方市
なんてのがまだ残ってたなんてのはショックでしたが…。地名はほぼ全部作り直したと思ってたんだが…。

「okuri-ari」部分は調べるのがかなり面倒な上に、以前全部見直してるからまずないと思うので多分やらない。やるとしたら SKK-JISYO.noregist の「okuri-nasi」部分か。でも、明日から数日家を空けてしまうんで、帰ってからですな。

今の地名拡充作業に飽きたら、compound.t も見てみようと思う(ホントかよ

あと、nosuke さんが挙げられてるような「読みの表記の揺れ」(っていう言い方でいいのかな?「ぢ」と「じ」、「ず」と「づ」、「すうがくか」と「すうがっか」みたいなやつ)の問題についても書いておきたい。が、多分まとまりはしない。この辺は日本語の方に問題があるんで、きちんとした対応をすることはムリ(だと思う)。
posted by vagus at 01:03| 東京 🌁| Comment(0) | TrackBack(0) | cannadic改 - 作業メモ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。