jisx0213_2004code-u8.txt.bz2
【変更点】
2010/04/18 update
・81行目 1-01-79 YEN SIGN の UTF-8 のコードを変更したと下に書いてあるのに、実際には変更されてなかったのを変更(e280be → efbfa3)
・763行目 1-09-09 soft hyphen の第10フィールド(文字そのもの)に、soft hyphen が 2つ入ってしまっていたのを 1つに
オリジナルは JISX0213 InfoCenter の「コード表-csv」です。
労作に感謝いたします。
infocenter のオリジナルから変更した点:
・jis x 0213:2004 に対応させた
・ファイルの文字コードを UTF-8 に、改行コードを LF に
・外字は削除した(コードは残してある)
・面句点コードは桁を揃えた
・UCS、UTF-8 のコードが未入力だった部分をすべて埋めた
(その行には行末に<add>の文字を付加)
・以下を修正した(修正した行には行末に<m>の文字を付加)
- 19行目 1-01-17 OVERLINE
ucs: 203e → ffe3
utf8: e280be → efbfa3
- 81行目 1-01-79 YEN SIGN
ucs: 00a5 → ffe5
utf8: c2a5 → efbfa5
※(1/24追記)上記 2 文字に関しては、元の infocenter のものが間違って
いるというわけではありません。むしろ正しいようです(規格票もそうなって
る)。ややこしい問題があるので、この辺とかこの辺を参照。
- 114行目 1-02-18 TILDE
utf8: efbc9e → efbd9e
- 998行目 1-11-56 UNDERTIE
ucs: 203F → 203f (大文字になっていたのを小文字に)
- 11121行目 2-93-27
ucs: 9b1d → 9b1c
utf8: e9ac9d → e9ac9c
※2004年の追補で変更された
sjis, ucs, utf8 についてはチェックしたつもり。
jis, euc については未チェック。
一応合ってるとは思いますが、自信はありません。
加工、再配布等ご自由にお使い頂いて構いません。
もちろん自己責任で。
<追記>
ふと「あれ?あんなテキストそのままアップロードして大丈夫なんだっけか?」と気になって確認してみたらやっぱ化けてますね。
すんません。戻ったら上げ直します。
<追記 2>
確認した環境にフォントがなくて化けただけだった orz
アホだ…