2011年03月02日

郵便番号辞書更新

郵便番号辞書更新してあります

結局、gendic_zip.rb を一から作り直した。
ken_all.csv の丸括弧の中の情報もできるだけ生かそうとしたら、結局 2週間以上かかった…orz
でも、まあ、これで曲がりなりにも自動更新できるようになったので、自分の更新の手間はぐんと減った(はず)。

変更した主な点
・品詞コードを "CNS" から "CN" にした
・「0000000」を変換すると辞書のバージョンを候補に出すようにした
 ex.) 0000000 → 郵便番号辞書:2011年3月版
・丸括弧の中の情報(丁目、番地、字・大字など)もできる限り入れた
 (ただし、解釈を間違えてるものがあるかも)


cron で自動更新する方法も書いてみたので、もしよさそうだと思われたらどうぞ。
posted by vagus at 22:50| 東京 ☀| Comment(0) | cannadic改 - 更新情報 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。