2012年03月10日

更新 【追記】3/13,3/25

超久々ですが「作業部屋-angie」の方を更新中です。

【追記】3/13
もうちょい続きます。

【追記】3/25
ダメだ、やっぱりこれで一区切りにします orz
ムダに待たせてしまって済みません。
(言い訳: 以前やりかけたまま放ってあったのがあったので(地名とかカタカナ語とか)、それを突っ込もうと思ったんですが、今の時間とモチベーションを上回る面倒臭さだったので挫けました)

【変更内容】
・G-HAL 氏版 Anthy を更新(anthy-9100h.patch13-release-2011Y23.alt-depgraph-110208-angie.zipdic-201101)

・G-HAL 氏 Whats new のご指摘を反映(ありがとうございます)
  ・未登録語を登録
  ・「何処からを」「未満しか」が出せなかったのを修正
  ・「尽くし」「尽くめ」の読みが「ずくし」「ずくめ」になっていたのを「づくし」「づくめ」に修正(nosuke さん感謝)
   → ありゃ、「尽くめ」は現代では「ずくめ」が一般的なのか…。両方入れとくか

・辞書名を変更
  ・format: (x)-(y)-(z).t
   (x): g => 自立語、gf => 付属語、gc => 複合語形式、gt => 単漢字・記号
      ※おまけ辞書は先頭に "x" を付ける
   (y): 辞書の内容を表す文字列(jiritu, fuzoku, fullname, hikanji, kanji, etc...)
   (z): 規格を表す文字列(0208 => JISX0208、0213 => JISX0213、uni => Unicode)

・単語追加
  ・世界史、日本史、医療用語を増やした(十分とは言えない)
  ・改定常用漢字(2010)の音訓はすべて自立語辞書にあるようにした
  ・Unicode の記号を増やした
  ・助数詞を増やした
  ・その他気づいたもの

・新規おまけ辞書
  ・xg-kanbun-0208.t - 「漢文入力支援辞書(いい加減)」
  ・xg-seireki_wareki-0208.t - 「西暦 <-> 和暦変換辞書」
  ・xg-eki-uni.t - 「Unicode の易経の卦の記号辞書」
  【追加】
  ・xgt-bushu-0213.t - 部首辞書

・「読みのケツに付ける文字」の方針変更
  ・「単漢字の漢字辞書」以外、規格がどれかに関係なく、読みには何も付けない(従って、辞書さえ有効になっていれば、ユニコードにしかない文字を含むものも通常変換時に普通に出てくる)
  ・単漢字辞書は「非漢字」と「漢字」に分割(gt-hikanji-???.t, gt-kanji-???.t)
   ・規格に関係なく非漢字(gt-hikanji-???.t)の読みには何も付けない(これまでは一部 "t" を付けていた)
   ・規格や送り仮名の有無に関係なく漢字(gt-kanji-???.t)の読みにはすべて文字を付ける
     gt-kanji-0208 -> 読みのケツに "「「" を付けて変換
     gt-kanji-0213 -> 読みのケツに "」」" を付けて変換
    ※読みに余計な文字を付けないと単漢字が出てこなくなるので、改定常用漢字音訓表にあるものはすべて自立語辞書に入れた
    ※音便のもの(「あっ #KJ 圧」等)も通常変換時は出なくなる。どのくらい影響があるか見て、どうするか考える
    ※付加文字を何にするかは、ユーザ環境の「ローマ字入力/かな入力」「全角/半角」の違いに無関係な文字は何か、で考え、初め "ーー" にしたが、上手くなかったので上記のようにした。かな入力派は shift キー押す必要があってやや面倒かもですが。

・単漢字の漢字辞書を置き換え
  ・IPA の「文字情報一覧表 Ver.001.01」から作成したものに置き換え(ライセンスは "クリエイティブ・コモンズ・ライセンス 2.1「表示、継承」")
  ※「税金も使われたんだろうし、せっかく自由なライセンスで公開してくれてるんだから、活用しないとね」と思ったんですが、ちょっと色々気になるところもあって、もしかしたら戻すかも…


注: 複合語形式の gc-fullname-*.t は anthy.dic に含めるようにしないと使えない(~/.anthy/imported_words_* では複合語形式が使えないため)

…とりあえず、今んとここんな感じです

【メモ】
・「巡りて」「終わりて」等を出せるように(弱い接続で) → やると破綻しそうな気がするのでヤメ
・extra/ の辞書は/usr(/local)/share/anthy/extradics/ にインストールされるので、~/.anthy/imported_words_default.d/ にリンクを張ったり消したりすることで利用することを想定。
 でも、一般ユーザは dict.args を見たりしないので、どの辞書が anthy.dic に含まれてて、どの辞書が含まれてないのか分からない。どうすれば…?
posted by vagus at 20:56| 東京 ☁| Comment(2) | cannadic改 - 作業メモ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
対応ありがとうございます & 更新おつかれさまです。
暫く利用させて頂きましたが今の所問題は見つかっておりません。
それから、無理して作業してもなんですし……。
Posted by G-HAL at 2012年03月31日 19:46
げげっ、すみません、今コメントに気づきました orz
全然見てなかったので…あうあう…大変失礼をば致しました

こちらこそ、ご指摘ありがとうございました。まとめて頂いていたので大変助かりました。
私がサボっている間も着々と改良されていたんですね。私の思いつきまで実装して頂いて、何とお礼を申し上げてよいやら…。

> 無理して作業してもなんですし……。
お気遣いありがとうございます。思いつきとかはいくつかあるんですが、もう手が動きませぬ。
なんとか、ソース辞書等はリポジトリに上げてから終了にしたいとは思ってるんですが(やらずに終わると嘘つき確定になってしまうので)、手元がかなりグチャグチャなので、それもなかなか…

(と書いていたらちょっと「んー、やんなきゃ」という気になってきたので、手をつけてみようかな…。まずはどうするつもりだったか思い出すところから始めないとですが…)

Posted by vagus at 2012年04月16日 01:20
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。