2010年04月29日

MacUIM に Anthy 用辞書エディタが入るらしい、と思ったけど前からあったらしい

ふと「先日出た MacUIM って、G-HAL 氏のどのパッチ使ってるんだったっけ?」と思って、リポジトリ覗いたら、AnthyDict というディレクトリが追加されてるのを見つけた。

README には
AnthyDict is a personal dictionary editor of Anthy
とあるので、個人辞書ツールらしい。

そう言えば、MacUIM には個人辞書ツールがなかったのか。
uim-dict-gtk を移植するのかな?



# 風邪ひいたらしい。熱がある。ダルい…

【追記】
リポジトリ見ても、G-HAL 氏のどのパッチか分からなかった。
ekato さんの日記を見て分かりましたが、コメント欄に AnthyDict がどうこうという話が…。 あら? 以前からあったんですか? 何か見当たらないんですけど。どこだ…。

あった。
/Library/Anthy/AnthyDict.app
知らなかった…か? なんかデジャヴな気もしてきた…
posted by vagus at 01:22| 東京 ☁| Comment(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2010年04月27日

VMware Fusion 2.0.7(246762) on OSX 10.6.3【追記】5/4

ゲスト(openSUSE 11.2)で文字入力してると、時々、いきなりウィンドウが最小化(Dock に格納)されて焦ることがあるんですが、一体これは何?

何かのキーの組み合わせで発動するような気がするんだけど、どのキーだか分からん…

自前で build した vmware-tools じゃなくて、open-vm-tools 使ってるからなのかなぁ…。

【追記】5/4
"h" のキーが絡んでるのは分かった。が、他にも何かが絡んでるはず。
で、Fusion のキーバインドで "h" を使うものを見直したら、「アプリケーションを隠す」が「command+h」だった。
テキストを入力してる最中に command キーなんて押さないんだけど、一応これを切って様子を見る。

あと、シングルクリックがときどきダブルクリックになる。更に、クリックしたままドラッグしてる時に、勝手にクリックイベントが発生してる。文字列選択してる最中とかに勝手にクリックイベントが発生して、非常にいやーんなことになる。

VMware かゲストの X.org かと疑ってたが、何か「そもともホストの OS X のせいなんじゃないか」という気がしてきた。よく分からんけど。
posted by vagus at 22:35| 東京 ☔| Comment(0) | Mac | このブログの読者になる | 更新情報をチェックする

2010年04月25日

数字に続くハイフンの入力【追記】4/25,4/27,5/4

郵便番号辞書つながりでもう一つ。

現在、読みとして入力する郵便番号は「1000014」のようにすべて数字になっています。

でも、本来は「100-0014」「100─0014」のようにハイフンを入れたい。見やすいし、「1000014えん」が「|東京都千代田区永田町|円|」になるのも防げるだろうから。

なぜそうなっていないのか、郵便番号変換機能が実装された時の経緯は分かりませんが、仮に今それをやりたいと思ったとしても上手く行きません。
というのも、現状のフロントエンド({scim,uim,ibus}-anthy で確認)では、前の文字が数字でもハイフンは長音記号のままになってしまうから。
例: 100ー0014

※uim-anthy は「英数モード」に変えてから入力すればハイフンになります。
 また、テンキーから入力した場合どうなるかは、ウチにはテンキーがないので分かりません。

勿論、「100ー0014 #CNS 東京都千代田区永田町」という風に、読みをハイフンでなく長音記号で登録すれば、「100ー0014」から「東京都千代田区永田町」に変換できますが、みっともないので自分はやりたくない(フォントによっては全角ハイフンと長音記号の区別がつかないかもしれませんが(特にゴシック体)、区別してあるフォントの場合は、長音記号は左端が上がってる)。

数字の次にハイフンがくるのは郵便番号だけでなく、他にも

日付: 2010-4-24
住所: ○○市××町3-2-1-503
バージョン: 1.2.3-4

などがある。
数字の直後に長音記号がくることは、多分まずないと思うので、「前が数字だったら長音記号ではなく、ハイフン」という動作にして問題ないと思うんですが、どうでしょうかね。


ちなみに、「数字の次の句読点も同じようにカンマやピリオドに」というのは、マズい気がする。
「右に30、左に5。」みたいな文が「右に30,左に5.」になってしまうので。

ならば、「前の文字が数字かどうか」ではなく「後ろの文字が数字かどうか」で判断すれば行けるんではないかと、ちょっと思ったけど、これも「今日は、24日です」が「今日は,24日です」になるのでマズい。

【追記】4/25
続きを読む
posted by vagus at 01:08| 東京 ☀| Comment(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

全角/半角の違いを誰が吸収すべきか問題【追記】4/27,5/4

昨日の続き(元々はこっちからつなげる積もりだったんですが、どっちでもいいや)。

昨日の話は郵便番号辞書の話でしたが、これは別に郵便番号辞書に限った話ではなく、いわゆる全角/半角の種別のある文字を変換する場合すべてについて言える。

簡単にまとめると、要するに、

・英数記号にはいわゆる全角/半角の 2種類がある(他に「ヴ」と「う゛」というパターンもある)
・全角を好むユーザもいれば、半角を好むユーザもいる
・なので、IME は両方に対応できなければならない
・この差異を誰が吸収すべきか(フロントエンド? 変換エンジン? 変換辞書?)

という問題です。

本音をぶっちゃけると、現状はこの差異を辞書が吸収してるんですが、リソースの無駄だと思うので、フロントエンドか変換エンジン側でやってくれたらなぁ、というお話です。

続きを読む
posted by vagus at 01:07| 東京 ☀| Comment(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2010年04月24日

ibus-anthy の辞書管理機能(郵便番号辞書について)【更新】4/27,5/4

ibus-anthy-1.2.1 が出てますが、更新をサボっていたせいで色々知らない機能が増えてました。
親指シフト関係が充実したようです。また、「逐次変換」というもの見えます(まだ使ってない)。

---------
【追記】5/4
前にもどこかに書いた気がしますが、新しめの ibus 関係のパッケージは、openSUSE なら OBS のこの人のところから入れられます。ただし、公式パッケージではないので、自己責任で。
※自分は自前でビルドしてしまったので、使ってないです。
---------

その中で、新たな辞書管理機能についてちょっと書いてみます。

ibus-anthy-121_dict.png

この[拡張辞書]の部分ですね。

これは、一言で言うと、自分が以前、

~/.anthy/imported_words_default.d/ について
個人辞書ツール

という記事で書いたようなこと(というか、それ以上のもの)が実装された感じ、と言えばいいでしょうか。

続きを読む
posted by vagus at 01:38| 東京 🌁| Comment(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2010年04月21日

かな英字交じり文を一度に変換する方法のまとめ【追記】4/22

「日本語入力」「かな漢字変換」とは言っても、実際にユーザが入力したいのは「ひらがな」「カタカナ」「漢字」だけじゃなく、「アラビア数字(算用数字)」や「アルファベット」や「記号」もある。

それらを uim-anthy, scim-anthy, ibus-anthy でどう入力するか、というお話(但し、uim-anthy 以外はローマ字入力方式限定ですが)。

尤も、「カタカナ」「漢字」は通常「ひらがな」から変換して出すし、ローマ字入力なら「アラビア数字」と「記号」はそのまま普通に入力できるので、結局、問題は「アルファベット」だけ、ということになる。

まぁ、知ってる人はとっくに知ってる話だと思いますが、一応自分の知ってる範囲でのまとめ。

続きを読む
posted by vagus at 01:51| 東京 ☔| Comment(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

2010年04月19日

scim(-anthy) の謎 - 文節区切り表示

uim には、こういう風↓に文節区切りを表示する機能があり、非常に分かりやすくていい。

uim-anthy_border.png

でも、scim-anthy は注目文節の前後しか区切り位置が分からず、うっかり確定すると、実は変なところで区切られてて、それを学習してしまったために変換結果が悪化する、ということが起こる。

scim-anthy_border1.png

と、そう思われてると思いますが、というか、実際そうなんですが、実は、scim-anthy でも、文節区切りが表示されることがある。

scim-anthy_border2.png

これは、Firefox 内のテキストボックスで入力した時のものですが、文節の切れ目で下線が切れてます。
(Firefox 内なら、検索ボックスでもどこでもこうなるらしい)。
scim(-anthy) も、実は文節の切れ目を表示してる?
それともこれは Firefox 側で何かやってるんでしょうか?

よく分かりませんが、今の所、scim-anthy で文節の切れ目が表示されるのは、自分の知る限り、Firefox だけで、他は Thunderbird でもダメでした。

また、Firefox でも、ibus の場合は切れ目は表示されませんでした。

うーん、謎。
posted by vagus at 23:47| 東京 ☀| Comment(5) | TrackBack(0) | 日本語入力 - アプリ | このブログの読者になる | 更新情報をチェックする

Knowit から Kjots へ移行【追記】4/20,4/22,5/4

自分は、すぐ忘れてしまうコマンドのオプションとか Tips とかをずっと Knowit というソフト(いわゆる outliner とか jotter とか言われるもの)に書き溜めてきました。
でも、もうずっと前から開発が止まってしまっていて、乗り換え先を探すもなかなかこれと思うものがなく、困ってた。

要件としては、

・別のアイテムにリンクを貼れる
・文字色を変えられる
・最低 3階層以上にできる

という単純なものなんですが、これがなかなか気に入るのが見つからなくて。
あっても、不安定だったり UI が気に入らなかったり。

が、ここにきて、Kjots が要求を満たしてくれそうなので乗り換えることにしました。しかも、嬉しいことに、Knowit のデータを直接インポートできる

実際やってみたら、インポートできました。
助かった。3分で終わった。

ただ、不具合もあって、文字列を選択してフォントやフォントサイズを変更しようとすると、選択された文字列が消える(Kjots-4.3.5)。
この場合は、慌てず騒がず、ctrl+z すればよい。
そうすれば、変更が反映された状態で消えたテキストが戻る。
メニューの「編集」には Undo/Redo の項目はありませんが、他のアプリ同様 ctrl+z/ctrl+Z でできます。

OBS から最新の持ってくれば直ってるかも。

【追記】
ここをリポジトリに追加して、kjots-4.3.5-4.31 を入れてみたが、やはり選択テキストが消える。
ふと、InputMethod を変えたらどうなるかと思って、

$ QT_IM_MODULE=ibus kjots &

で起動したら、消えなくなった。
どうも、scim-bridge だとダメらしい。SCIM は OK だった(Qt4 じゃ使えなかった)。

kwrite でもなるな。
KDE4 (というか Qt4 か)全般の問題なのか。というか、scim-bridge が古いのか?
ともあれ、今まで KDE3 を使ってたために自分が知らなかっただけで、多分既知の問題なんだろうな。

【追記】4/20
リンクが貼れない…

【追記】4/22
ダメだ、ibus でも消える。
怖くて使えん…。
KDE/Qt パッチ集に上がってるので直るのか?
早く直って欲しい…

続きを読む
posted by vagus at 23:24| 東京 ☀| Comment(0) | TrackBack(0) | Linux | このブログの読者になる | 更新情報をチェックする

2010年04月18日

引っ越し終わらず【追記】5/4

あらかた終わりましたが、まだいくつか残ってる。

uim のインストールとか、knowit に書き溜めてたメモを kjots に移行する作業とか。
あと、Xorg が 7.4 に上がったからか、~/.xim とか ~/.Xmodmap とかが効かなくなったので、新しいやり方を調べる。

【追記】
~/.xim と ~/.Xmodmap が効かなかったのは、単に自分のミスでした。

.xim は XMODIFIERS="@im=〜" の @im の部分を忘れてた。
.Xmodmap は、今の MacBookPro と前の MacBook とで keycode が違っていた。
! 「ろ」のキーのバックスラッシュを縦棒に
keycode 97 = bar underscore

そんだけのことでした。

あと、scim のアイコンがシステムトレイに出てこない(突然現れたりもする)とか、scim の候補ウィンドウが常に画面の左上にすっ飛んでるとかありますが、これは Xfce の問題な気がするので、実害はないし我慢する。

【追記】
uim のインストールも終了。

<おまけ>
3ime.png
右から scim, ibus 飛んで uim。uim-toolbar-gtk-systray は Xfce 4.6 だと、3つのアイコンがアイコン 1つ分のサイズに詰め込まれてしまうので使わず、uim の applet を gnome-applet 経由で表示。
scim のアイコンが消えない内に撮った…。

続きを読む
posted by vagus at 01:40| 東京 ☁| Comment(0) | TrackBack(0) | チラシの裏 | このブログの読者になる | 更新情報をチェックする

2010年04月17日

New MacBook Pro 15 購入 & 到着【追記】4/18

去年の暮れ頃から新しいのが欲しいと思っていた。
しかし、次に出るのは CPU が変わるらしいと聞いて、それまで待つことにしたら、こんな季節になった。

しかも、13インチのは Core2Duo のまま。

CPU が上がるならと思って待っていたので、「こんなに待ったのに結局変わらなかった」では納得が行かない。

しかし、15インチはさすがにデカい。
ケースやキーボードカバーも使い回せないだろう。

どうしたもんか。

で、一日考えて、結局 15インチのにした。
折角ここまで待ったから、というのと、
168800円 / $1799 = 93円/ドル
で、15インチが一番おトクに思えたから。
以前(2-3年前)なら考えられんレートだ。
(単にレートが低くなったというのではなく、実際の為替相場との差がなくなった、という意味。以前は "Apple レート" とか陰口を叩かれてて、実際の相場より 10円くらい高かったと思う←ですよね?)

カスタマイズでディスプレイの解像度を上げられるというので、迷ったが、そうすると当然出荷がちょっと遅くなるので、懐との相談もあって、結局どノーマル(でも 24時間以内に出荷)にした。

そして、本日到着しておりました。

続きを読む
posted by vagus at 01:12| 東京 ☁| Comment(4) | TrackBack(0) | Mac | このブログの読者になる | 更新情報をチェックする

2010年04月16日

nkf で euc → utf-8 に変換すると"¥"と" ̄"が化ける【追記】4/17

タイトルの通り。初めは ruby 使ってて気づいたんですが、いわゆる全角円記号といわゆる全角オーバーラインが化ける気がする。

$ echo $LANG
ja_JP.eucJP
$ nkf --version
Network Kanji Filter Version 2.1.0 (2009-11-17)
Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa).
Copyright (C) 1996-2009, The nkf Project.

$ echo -n "¥" | od -x
0000000 efa1
0000002
# nkf で UTF-8 に変換
$ echo -n "¥" | nkf -Ew | od -x
0000000 a5c2
0000002
# iconv で UTF-8 に変換
$ echo -n "¥" | iconv -f EUC-JP -t UTF-8 | od -x
0000000 bfef 00a5
0000003
$ echo -n " ̄" | od -x
0000000 b1a1
0000002
# nkf で UTF-8 に変換
$ echo -n " ̄" | nkf -Ew | od -x
0000000 80e2 00be #=> いわゆる半角オーバーラインのコード
0000003
# iconv で UTF-8 に変換
$ echo -n " ̄" | iconv -f EUC-JP -t UTF-8 | od -x
0000000 bfef 00a3 #=> こっちが正しい
0000003

あれ? "¥"って 0xC2 0xA5 でいいんじゃなかったっけ?
もしかして変わったとか?

もうちょっと調べる。

【追記】4/17
「--ms-ucs-map」を付ければいいらしい。

$ echo $LANG
ja_JP.eucJP
$ echo -n "¥" | nkf -Ew --ms-ucs-map | xxd -g 1
0000000: ef bf a5
[02:42:59]bash:~/work
$ echo -n " ̄" | nkf -Ew --ms-ucs-map | xxd -g 1
0000000: ef bf a3

※ でも、そうすると今度は他の文字が化ける(「化ける」という言い方は不適切かも知れませんが)。

以下余談。
調べてて、こんなページを見つけました。
「Linux の16進ダンプツール(od,xxd)」

xxd なんて便利なコマンド、初めて知った。ずっとバカの一つ覚えで "od -x" してました…。

上記のサイトに書いてあることそのままですが、
xxd の凄い所は、16進から文字に戻せるところ。

$ echo "文字列" | xxd -p | xxd -r -p
文字列

こんな便利なコマンドを知らなかったとは…。悔しい。
ちなみに、 od でも

$ echo -n "¥" | od -tx1
0000000 ef bf a5
0000003

と、並び順を戻せるが、man od を見ると、「od は hexdump(1) に取って代わられています。」と思いっきり書かれてました。
今後は xxd を使います。
posted by vagus at 00:45| 東京 ☁| Comment(0) | TrackBack(0) | Linux | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。