2008年12月31日

【お試し版】自作 depgraph

「遅くとも年内には」と思ってたら本当にギリギリになってしまいましたが、一応「お試し版」として置いておきました。

depgraph改 - Anthy の depgraph を改善してみようとするテスト

使い方は中の README を見てください。
(他に anthy-9100e のソースG-HAL 氏の patch13alt-cannadic-081018 が必要です)。


あくまでまだ「作りかけ」のものですので、出せないものもあることはご承知置きください。
配布方法もまだ決めかねてます。
(何か他にも色々書くことがあったはずなんですが、思い出せない。とりあえず、「年賀状書く」というのは覚えてるんだが…)


それでは、良いお年を。

(patch13 を当てると make update_params0 が「セグメンテーション違反」でコケる気がするんですが…ぼそ)

posted by vagus at 23:25| 東京 ☀| Comment(2) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年12月28日

どうも地雷を踏んだらしい - 追記

depgraph でまたハマってます… orz

詳しいことは明日書きます。

【追記】12/28
と思ったら、直ったっぽい。
depgraph と直接は関係ないところでミスってたのを直したら、だと思うんだけどよく分からない。まあ、直ったのでよかった。

posted by vagus at 00:34| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年12月16日

「aす」はどっちだ?

再びnosuke さんのところから、「買えして」「飛べして」「撃てして」ってなんじゃ?というお話。

最初にお断りしておきますが、今回もパッチはありません。ちゃんと直すとなるとかなり大きな修正になるので。

続きを読む
posted by vagus at 01:35| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年12月15日

anthy の make update_params2

昨日「update_params2 がセグメンテーションフォルトでコケる」と書きましたが、何度か試しているうちに、一応、自作 depgraph でも動いた。
動いたということは、depgraph のせいではなかったわけで、ちょっとホッとした。

でも、まだどういう場合にコケるのかよく分かってない。
【追記】12/17
分かった。100% 自分のせいだった。

とりあえず、
  • 辞書や depgraph に手を入れた場合は calctrans/corpus_info を作り直す必要があるらしい。でないと、候補の並び順が上手く行かないっぽい。
  • calctrans/corpus_info を作り直すやり方は calctrans/Makefile.am と [Anthy-dev 3470] を参照。(anthy-9100x と anthy-c74rc1 とでは若干違う)。
  • でも、作り直すと結構変換結果が変わる。「前の方が良かった…」というパターンも大いにありうる(念の為、元のを corpus_info.old として取っておいた方がいいかも)
  • だが、どこをどういじれば結果がどう変わるのか、そもそもいじれるところがあるのかすら、全然分からない(例文次第?あるいは、運次第?)

というのが、今の状態。

ちなみに、calctrans/corpus.2.txt のコメントに
./calctrans file -o ../src-splitter/transition.h
というのがあって、気になって試してみたところ、
$ cd calctrans/
$ ./calctrans parsed_data -o ../src-splitter/transition.h

という感じで使うらしい。
これで作成された src-splitter/transition.h は calctrans/corpus_info と同一のようです。また、src-splitter/transition.h は現在はどこからも include されてないようなので、「将来こうなるよ」というものなのかもしれません。

posted by vagus at 23:19| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年12月13日

WinAnthy の Anthy - 追記

某所で話題が出てたのを見かけて、「そう言えば、そういうものもあったんだっけ。win機はないので試せないけど、ソースは見れるのかな」と思ってサイトを見たら、ちゃんと anthy 単体のソースも置いてあった(下の方の「リンク」のとこ)ので落としてきてちょっと diff 取って見てみた(勿論、殆どの部分は見ても分からないですが)。

続きを読む
posted by vagus at 18:44| 東京 ☁| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年12月11日

anthy.dep のサイズ

190KB 突破 記念マキコ。

200KB 突破も確実な情勢。


…大丈夫なんかな。

【追記】12/12
200KB 突破。

もはや整理しようとしてるんだか、よりカオスにしようとしてるんだか分からんようになってきた。

とりあえず、もう少ししたら一度公開してみようかと思っている。
ものになるかならんかはそれから判断しよう。

posted by vagus at 00:10| 東京 ☁| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年12月09日

uim の「ぬぉ」

uim-anthy で「でんわ」(denwa)と入力すると「でぬぁ」になったり、「るすでんを」(rusudenwo)と入力すると「るすでぬぉ」になって「いや、こっちが『ぬぉ!』じゃい!」と突っ込んだりしつつも、「でもこれは自分が ~/.uim で無茶なことをしてるせいだろうな」と思ってたんですが、uim スレで uim-skk でも出るらしいことを知った。

ほんとだ、~/.uim 消してもなるな。


デフォルトだったんですか…。なぜこんな…。

続きを読む
posted by vagus at 00:26| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

「だに」の話

イエダニとかのダニの話ではない。

nosuke さんのところの「anthy で『あいだに』が『愛だに』になる」の件。

実は depgraph 作ってる関係で少し前に調べたりしてたので、書いてみます。

続きを読む
posted by vagus at 00:14| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年12月02日

自作 depgraph の進捗状況 - 追記

ああ、もう 12月か。早いな…っていつも言ってる気がするな。

一応進んではいます。11月中に終わらせたかったんですがムリだった。
感覚的には 7割くらいでしょうか。
anthy.dep のサイズは現時点ですでに 100KB を超えてますが…。

この文章もそれを使って書いてますが、まぁ、まだ色々足らないのでつっかえつっかえです。

続きを読む
posted by vagus at 00:35| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年11月25日

G-HAL 氏の Anthy パッチとコーパスについてちょっと思ったこと

G-HAL 氏の Anthy パッチには、現在 patch0〜13 まであるようですが、このうち、コーパスを切る(空にする)のは patch0 だそうです。で、さらに下の方に書かれてるように、
patch0 の内容は、patch0 以外のパッチには含まれていません。

patch1〜patch13 は、どれか1つだけ選ぶ必要があります (大きい番号のパッチは、それより小さい番号のパッチ全部を含んでいます)。
ということなので、たとえば patch13 のみを適用しただけではコーパスは切れてないはずなんですよね。

どうも patch0 を適用せずに、他の patch を適用しただけでコーパスも切ったと思われてる方が多い気がするんですが、大丈夫でしょうか?

コーパスを切った方がいいかどうかは各自で判断していただくとして、一応ちょっと気になったのでつぶやいてみるテスト。



posted by vagus at 00:17| 東京 ☔| Comment(7) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年11月21日

anthy depgraph に接続を定義しても効かないものがある問題 - 絶賛ハマリ中

タイトルの通り、ハマってます。

実はこれ、今回初めて知ったわけではなく、以前「可能動詞がどうの」と騒いでた時にぶつかって、「んー、分からん!」でほったらかしてた奴なんですが。あん時に聞いときゃよかったな…。

再現手順はこんな感じ。

続きを読む
posted by vagus at 00:29| 東京 ☀| Comment(4) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年11月18日

んー

ムズい。

作っては壊し、作っては壊しの繰り返しで全然進まん。
とりあえず、高望みせずにまずは動くものを作るか。

posted by vagus at 00:33| 東京 🌁| Comment(2) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年11月04日

【ネタ】IME Feed Reader

久々に「知識なき妄想」シリーズ。

この 3連休は、初日にお付き合い BBQ に行って帰ってきてからどうも体調が悪くて、後はほとんど寝てました。何か喉の、鼻と繋がってる辺りが変。

で、寝てたといってもそうそう何十時間も眠れるわけはなく、数日前に ATOK の拡張(?) API が公開されたとかいうニュースがありましたが(@ITMYCOMITMedia)、寝ながら「そんなもん公開されても、何か嬉しい使い方ってあるのか?」と色々妄想したことについて。


続きを読む
posted by vagus at 08:12| 東京 ☁| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年11月02日

個人辞書ツール

~/.anthy/imported_words_default.d/ についてで「後は「リンクの作成/削除」を簡単に行える GUI な Tool があればいいんでしょうが」と書きましたが、自分が欲しかったので zenity ででっち上げました。

続きを読む
posted by vagus at 11:09| 東京 ☁| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年10月27日

scim-bridge.el

scim-bridge.el なるものがあるのを知った。
そもそも emacs を使わないのでお世話になることはないと思うけど、スクリーンショット見ると何か格好良くて、ちょっと使ってみたくなったり。

いや、今それどころじゃないんで、多分やらないですが。

posted by vagus at 23:59| 東京 ☁| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年10月26日

~/.anthy/imported_words_default.d/ について

Anthy の個人辞書用ディレクトリである ~/.anthy/imported_words_default.d/ について、現時点で自分が知っていることのメモ。

続きを読む
posted by vagus at 21:46| 東京 ☁| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年10月23日

uim-anthy-utf8 を使いやすくする

前に「UTF-8 に対応したフロントエンドの中で実用に耐えるのは uim-anthy-utf8 だけ」みたいなことを書きましたが、正直、デフォルトの状態では色々辛い。

何とか使いやすくしようといじったことの現時点でのメモ。

※ uim は 1.5.3、uim-qt は色々面倒なのでまだ入れてない。gtk アプリでのみ確認。
※ でも、もうあれこれいじる必要はなくなるかも (-人-)

続きを読む
posted by vagus at 22:28| 東京 ☔| Comment(2) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年10月19日

ibus-anthy, uim-anthy-utf8 スクリーンショット

uim-anthy-utf8 が使えるようになったので、確認しながらスクリーンショット撮影。

まずは集合写真(Xfce4 にて)。

taskbar.jpeg

左から

・scim ツールバー(タスクバーに重ねてるだけで、統合されてるわけじゃない)
・scim(anthy の王冠マーク)
・ibus
・uim ツールバー(右の 4アイコン。システムトレイに統合されてる。カコイイ)

続きを読む
posted by vagus at 20:18| 東京 ☁| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2008年10月18日

depgraph のパッチ

anthy の depgraph を若干修正するパッチ。(上げ直した 11:22)

all.diff を当てれば他の個別のは不要。
anthy-9100e で作ったけど、それ以前のバージョンでも行けると思う。

* 重複したエントリを削除
* nosuke さんご指摘の「せっていに」が「迫っていに」になる問題を修正
* 「〜しにくい」が出せなかったのを直す。
* 「死んでいる」「書いてみる」等、「〜して/で〜」のパターンを少し整理&追加
* 「書こうなんて」「行こうなんて」等、「〜しようなんて」のパターンを出せるように

次の anthy には多分取り込んでもらえると思う(送付済)。



posted by vagus at 10:41| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2007年11月25日

【実験】hogedic - その2

間が空きましたが、前回からの続き。

助詞等をつけて変換した場合に、hogedic1,2,3 で候補の並び順がどう変わるか。

続きを読む
posted by vagus at 23:26| 東京 ☀| Comment(0) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。