2007年01月26日

anthy utf8化 - 追記2

anthy が 8523 で共有辞書も utf8化したというので第3第4水準の文字を数文字適当に拾った辞書を作って試してみた。

…んだが、多分 anthy.dic 自体は utf8化されたと思うんだが、

$ anthy-agent <<EOF > test.txt
> ku
> (space)
> EOF

とやっても

(2 ((UL) "く" -1 -1) cursor)
(3 ((UL RV) "〓" 0 3))

と化けてしまう。

test.txt のエンコーディングを見たら euc-jp の CR+LF だった…
なぜ CR が…というのは置いておいても、出力が euc-jp じゃ化けるよなぁ。
utf8 に対応したフロントエンドなら大丈夫なのか?
それともそもそも anthy が euc-jp で返してきてるのか?

どうも後者のような気がするが、自分には確かめる方法が分かりませぬ。
それ以前に時間が取れませぬ。つーか、最近マジでいっぱいいっぱいなんですけど。

<追記> 1/26
田畑さんのメール見直したら、
eucの外の文字を入れたときに正しく「〓」が出るようにするには

と書かれてあった。
ってことは、出力はまだ euc-jp のままってことか。
お騒がせしますた。
よく嫁 > 自分

<追記2> 1/27
あの後、doc/LIB を(初めて)見た。
どうも少なくとも数ヶ月前から utf8 の出力にも対応していたっぽい。
知りませんでした。ごめんなさい。

ってことは、utf8 に対応したフロントエンドがあれば確認できるのか。
ほのかたんが対応したというのをどこかで見た気がするが使ったことないし。
自分で何とかすることも不可能ではない気がするが、どうしよう…

どっち道月曜以降にならないと時間が取れないのでそれまでに考えよう。
posted by vagus at 01:42| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。