でも、調べてみたが、alt-depgraph には該当するようなエントリはなかった。
「もしかして」と思って、~/.anthy/conf の「DEPGRAPH_WITH_PART」を "false" にしてみたら、出なくなった。
あー、「ぁぃぅぇぉゃゅょっ」だけじゃなく、音引きもそうだったのね。
この辺はあった方が嬉しい人(特に「っ」)とそうでない人の好みが分かれる所だと思いますが、自分は "false" で行こう。
# G-HAL 氏版 Anthy の話です。素の Anthy は関係なし。
日 | 月 | 火 | 水 | 木 | 金 | 土 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
コーパスから自動生成した用例辞書の加点数を、単語の辞書の頻度値の 100相当になるように大幅に下げた。の影響だと思いますが、変換の傾向が結構変わった。さっき入れ直したばかりで、まだあまり使ってないのでアレですが、以前は文節を短く切ろうとする傾向が強かった(原作からの傾向)のが、長い文節をかなり許容するようになった気がする。ただ、やや緩すぎる(長い文節を許容しすぎる)感じがする。CANDIDATE_SCORE_CORPUS_UDICT というのを調節してみればいいんだろうか?
$ sudo dpkg-reconfigure console-setupで、「日本語106」を選んだ後「OADG109A」にして再起動すれば確かに直りました。
XKBLAYOUT="jp,jp"を
XKBVARIANT="106,"
XKBLAYOUT="jp"にして再起動しても直るようです(「106」の代わりに「OADG109A」でもいい)。
XKBVARIANT="106"
|終了ですか|そうですか|以上の、「〜か|〜」のパターンはすべて alt-depgraph のせい(文末属性対応時のチェック漏れ。「か」副助 が付いてなかった)です(修正済)。
|仕様ですか|そうですか|
|中毒ですか|そうですか|
|送るべきか|送らない|
|行うべきか|否か|
|買うべきか|否か|
|考えるべきか|あぐねて|
|どうするべきか|迷う|
|変換するべきか|区切らずに|
|熱狂しているからか|本当に|
|悲しみよ|こんにちは|の「よ」は、言われてみれば(大きな切れ目ではあっても)文末とは言えないので、「Se@」に修正しました。
|混ぜるな|危険|ですが、これは慣用句と見て一語で辞書に登録することにします。
anthy-9100h + patch13Bptn23 + alt-depgraph-090506。の件。
「|直すの|大変だよ|」(|なおすの|たいへんだよ|)
が、1発では出ない。
で正しく出せるようになると思います。--- particle_kaku.depdef.orig 2009-05-06 01:22:07.000000000 +0900
+++ particle_kaku.depdef 2009-05-16 01:22:07.000000000 +0900
@@ -329,6 +329,7 @@
# 「お前んとこ」 何にでも付くわけではないので微妙
@「の」格助(連体・音便) "ん" St@
#
+@「の」格助(準体) "の" Se@
@「の」格助(準体) "の" @_助動「だ」
@「の」格助(準体) "の" @_助動「です」
@「の」格助(準体) "の" @_助動「らしい」
「@_サ変連用形(共通)」から遷移しようとしている「@_補動「やる」(複合・可動)」「@_補動「やる」(複合・可動)」「@_補動「やる」(複合・音便・可動)」は、あまり使われない & 入れると誤変換しそうだと思ったので今のところ全部外してありますが、あった方がいいでしょうか?
「@_上下一段連用形(共通)」から遷移しようとしている「@_補動「やる」(複合・可動)」
が、無い。 と思ったら、コメントアウトしてあった。
@「たら」終助これらも確かに全部未使用です(一応、チェックスクリプト作ってあって、すべて把握済み)。定義だけ作って、実際にはどこにも接続させてません。結構微妙なものたちなので…。
@「たら」副助
@「ちゃ」接助(引用)
@「ほど」副助(準体)
@補動「ある」終止形I
が、未使用
学習データの形式が、また変更になっています。 オリジナルの Anthy もしくは patch1〜patch13Bptn21 までの Anthy から patch13Bptn22以降に移行する場合、 一旦、
% rm ~/.anthy/last-record1_*.bin
% anthy-agent --update-base-record
% rm ~/.anthy/last-record1_*.bin
% anthy-agent --update-base-record
を実行(同じ事を2回繰り返していますが、間違いではありません)して、 学習データの形式変換をして下さい。