普段自分がやっているように「update_params2 × 3」でやったので傾向が変わってしまったのかもと思い、anthy-9100h.patch13ptn20.2009225.alt-depgraph-090223.calctrans.tar.bz2 の corpus_info, weak_words でやってみましたが、同じでした。
何か間違えてるのかな?
でも、それはそれとして、もう一回数詞がらみはチェックしなきゃなと思うので、また hogedic 作ってみよう。
【関連する記事】
日 | 月 | 火 | 水 | 木 | 金 | 土 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
この広告は90日以上新しい記事の投稿がないブログに表示されております。
VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE_AND_POST 5.0e-13
VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE 7.0e-7
VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_POST 8.0e-7
指定で1〜2文節分下げて、ようやく「|大体|全部|」になりました。2文節分下げると、「|大体千部|」が3文節と等価の確率になっている筈なんですが。
確率を下げすぎると、今度は「|約二百個|」みたいな物が、「|訳に|百個|」になってしまいますし。
# あれ、alt-depgraph-090223だと「|等価の|」が出ない。#T17 かな。
patch13ptn20.2009303 で確認致しました。> 「|大体|全部|」
ただ、よく考えたら cannadic改はオリジナルの anthy にも対応させないといけないんですよねぇ。
オリジナル anthy でも「|大体千部|」「|週六単語|」にならないようにしないといけないとなると、やはり結局「数詞に付く接頭辞」は消すしかないと思います。
せっかく実装してくださった G-HAL 氏には大変申し訳ないのですが…。ごめんなさい。
> 「|等価の|」が出ない。#T17 かな。
ビンゴです。修正しておきました。ありがとうございます。