2006年10月31日

cannadic改:出しました

どぞ

ご協力頂いた denson さん、井汲さん、登録希望さんありがとうございました。

また、Anthy wiki の「単語収集」のものも追加してあります。

普通名詞の頻度手直しはまだ半分にも満たないですが、メンテ用の方に

 せんむ #T35 100 専務 4780000
 せんめい #T05 100 鮮明 7550000
 せんめい #T30 100 闡明 19100
 せんめつ #T30 100 殲滅 1720000

といった感じで hit 数を残してあるので、興味のある方はご覧ください。

人名はスクリプトで並べ替えただけで、まだ点検してません。
変な部分もあると思いますが、それほど多くはないと思うので、
そのまま出すことにしました。いずれ直します。

posted by vagus at 23:31| 東京 🌁| Comment(9) | TrackBack(0) | cannadic改 - 更新情報 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
> ご協力頂いた denson さん、井汲さん、登録希望さんありがとうございました。う、名前を挙げていただいたのはありがたいのですが、今回は私はまったく寄与できていないはずです………。すみません。それはともかく、いつも作業お疲れさまです。今回もありがたくインストールさせて頂きました。
Posted by 井汲 景太 at 2006年11月02日 23:25
ぬお、いまコメントに気づきましたw

> 今回は私はまったく寄与できていないはずです………。
失礼しました。前回のが記憶に残っていて勘違いしたようです。
でもまぁ、逆じゃなくてよかった。
Posted by vagus at 2006年11月13日 10:04
cannadic改の導入は少し手間がかかるので、
コンパイル済みの anthy.dic を併せて配布されると
便利かもしれません。
これだと /usr/share/anthy/ にコピーするだけで使えます。
("CPU のアーキテクチャによって anthy.dic が変わるかもしれない" と
思っていたのですが、i586 と x86_64 の anthy.dic を比較したところ、md5sum の値は同じでした)
Posted by ut at 2006年11月23日 15:42
お久しぶりです。

> ("CPU のアーキテクチャによって anthy.dic が変わるかもしれない" と
> 思っていたのですが、i586 と x86_64 の anthy.dic を比較したところ、md5sum の値は同じでした)

そうですか。i586 と x86_64 は一緒ですか。
でも、anthy のバージョンによっては anthy.dic そのものが異なるんですよね、確か。
でも、いつからだったのか思い出せない…
まあ、「古いバージョンだと形式が違って使えないことがあるから、
その時は自分でコンパイルしてね」でいいか。
次回から anthy.dic も置くようにしてみます。
アドバイス感謝です。
Posted by vagus at 2006年11月24日 12:42
> でも、anthy のバージョンによっては
> anthy.dic そのものが異なるんですよね、確か。

その時々の安定版 (現在なら anthy-8300) で動けば問題ないと思います。
今の anthy-ss だとひょっとしたら動かないかもしれませんね (用例辞書が加わっているようなので)。
http://lists.sourceforge.jp/mailman/archives/anthy-dev/2006-November/003248.html
> anthyのcalctrans/corpus.?.txt
Posted by ut at 2006年12月03日 02:25
> その時々の安定版 (現在なら anthy-8300) で動けば問題ないと思います。

そうします。
というわけで、出してみました。
でも、utumi さんには必要ないですね(^^;)
Posted by vgus at 2006年12月04日 02:35
> でも、utumi さんには必要ないですね(^^;)
ときどき srpm を作ってアップロードしています。
何人かダウンロードなさっていますよ。
http://sourceforge.net/project/showfiles.php?group_id=109779&package_id=118621&release_id=239349

コンパイル済みの anthy.dic が動くことを確認しました。
srpm のほうはソースから anthy.dic を生成しています。

> 14MB 弱あります
圧縮すると 3-4MB になります。
$ 7za -a -mx=9 alt-anthy_for_8300.dic.7z alt-anthy_for_8300.dic
=> 3.4MB
$ bzip2 alt-anthy_for_8300.dic
=> 4.4MB
Posted by ut at 2006年12月04日 18:59
> $ 7za -a -mx=9 alt-anthy_for_8300.dic.7z alt-anthy_for_8300.dic

間違っていました。
正しくはこちらです。
$ 7za a -mx=9 alt-anthy_for_8300.dic.7z alt-anthy_for_8300.dic
Posted by at 2006年12月04日 19:07
げ、いつも気づくのが遅くてすみません orz

> 圧縮すると 3-4MB になります。
え、そんなに変わるんですか。
「圧縮しても大して変わらんだろう」と思って、初めから諦めてました。
次からは圧縮するようにします。

# こういう情報はガンガンください(w
Posted by vagus at 2006年12月07日 09:31
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。