2007年09月20日

alt-cannadic-070918 の変更点

遅れましてすみません。

・新語追加&誤登録修正(内海さん、登録希望さん、nosukeさん、n/aさん、2chの匿名の方々)
・SKK-JISYO.wrong(v 1.141 2007/01/09 02:58:25)を参考に誤登録修正(okuri-nasiのみ対象)
・四字熟語一部見直し、誤登録修正
・Anthy Wiki の「単語収集/未分類語」から一部取り込み

登録依頼を下さった方々、ありがとうございます。
SKK 辞書のメンテナの方々にも感謝。

以下補足等。

●「京都がでねぇ」という声に耐えかねて、都道府県名・県庁所在地・一部国名の頻度を+200してみたけど、効果なかった… orz
anthy 側でも地名を下げるようにしてるんだろうか?

# 「ギリシャ」が「斬り者」になるのは何でだ…?

●cannadic改 wiki の登録依頼のページで「取り込まなかったもの」に入れられてるのは以下の理由からです。

 ・「ばな #SUC 花」「だまり #SUC 溜まり」
  anthy では「SUC」は効かない(cannaもだったと思う)。接尾語は「N2T35」「D2T35」等が使えるが、これらはありえない候補をたくさん作ってしまうので今はできるだけ使わないようにしている。代わりに一般名詞で登録しているが、「ばな 花」も「だまり 溜まり」も既に登録済みなので「取り込まなかったもの」としました。
  ちなみに2chに出てた「勤務帯系」とか「和佳取り」(だっけ?)とかが「N2T35」「D2T35」等の弊害の例です。

 ・「たく #JSSUC 択」
  「ニ択」「三択」は登録するとすれば助数詞(JS)ですが、せいぜいあっても「五択」くらいまでだと思うので、「五択」までを一般名詞として登録した。
  助数詞も不用意に登録するとありえない候補をいっぱい作るので、今は登録に慎重になってます。

 ・「は #JNSUC 派」
  これを登録すると恐らく「人名+は」はすべて「○○派」になってしまうので。「古田は泣いた」が「古田派泣いた」とか。

●Anthy wiki 「単語収集/未登録語」
・「*iB」のカタカナ表記は後で登録しておきます(コメント欄ばかり見て忘れてました。ごめんなさい)。
・「*i」の方もやっておきます
・「Й」は NHK のテキストみたいなのを見たら「イ・クラートゥカヤ」となってましたので、入力しやすさを考えて「いくらーとかや」「いーくらとかや」の二つで登録しておこうと思います。


しかし、あの wiki ではやっぱり色々非常に不便だなぁ…
(↑Anthy wiki 「単語収集/未登録語」の方です)
posted by vagus at 22:40| 東京 ☀| Comment(0) | TrackBack(0) | cannadic改 - 更新情報 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック