まあ、最近やってたことでも書いて時間稼ぎ。
ランクの付け直しは動詞まで終わって、名詞を残すのみ。でも、名詞が過半数を占めるので、要するにまだ全体の半分も終わってないと。
その上、ちょっとミスって、2日分の作業を全部見直しとかしてて泣いた。
「コマンド履歴が見れれば…」と思って一縷の望みを託したが、bash なので欲しい履歴は綺麗さっぱり消えてた。
zsh だと、複数起動しててもコマンド履歴が共有できるらしいのは知ってましたが、新しく zsh 覚える気力がなく、ズルズルと bash を使い続けて早何年だろう。
でも、さすがに今回懲りたので、「bash でも何とかならんのか」と思って(zsh 覚える気はやはりない)検索したら、その物ズバリなのがあっさり見つかった。
bashにて複数端末間でコマンド履歴(history)を共有する方法
なるほどねー。多少、力技な気がしないでもないですが、賢いです。ありがたく使わせて頂きます。
これでもうミスっても怖くないぞ ← その前にミスるな
その他、anthy の corpus の例文から句読点、カッコ、疑問符、感嘆符を抹殺する作業などをやっておりました。
自分は句読点などを含めた状態で変換することはしないので、関係ないと言えば関係ないんですが、これ↓
どうやら、コーパスのは、さすがにあんまりだと思ったので。
calctrans/corpus.3.txt:2799:|あついかもねえ|。| |暑いかもねえ|。|
から『「暑」←「。」』の用例が自動生成されて、 それが 『|あつい|。|なつは|あつい|。|ほんは|あつい|。』の 『|あつい|。|』の部分と 『|。|(別の内容)|あつい|』の部分に適用されて、 「暑」がやたら優先されているらしい。
で、やってたら、まだ結構おかしな例文(辞書や付属語グラフが不足しているせいで正しく変換できないのを、区切りを入れることで表面上正しいように無理やり見せかけてる例文)が残ってるのを発見してちょっと鬱。
以前、区切りを depgraph改に合わせて修正した時にほぼ全部見直したと思ってたんだが…。
【関連する記事】