2007年01月20日

jisx0213:2004 コード一覧 - 【更新】2010/4/18

jisx0213:2004 コード一覧:
jisx0213_2004code-u8.txt.bz2

【変更点】
2010/04/18 update
・81行目 1-01-79 YEN SIGN の UTF-8 のコードを変更したと下に書いてあるのに、実際には変更されてなかったのを変更(e280be → efbfa3)
・763行目 1-09-09 soft hyphen の第10フィールド(文字そのもの)に、soft hyphen が 2つ入ってしまっていたのを 1つに

オリジナルは JISX0213 InfoCenter の「コード表-csv」です。
労作に感謝いたします。

infocenter のオリジナルから変更した点:

・jis x 0213:2004 に対応させた
・ファイルの文字コードを UTF-8 に、改行コードを LF に
・外字は削除した(コードは残してある)
・面句点コードは桁を揃えた
・UCS、UTF-8 のコードが未入力だった部分をすべて埋めた
 (その行には行末に<add>の文字を付加)
・以下を修正した(修正した行には行末に<m>の文字を付加)
 - 19行目 1-01-17 OVERLINE
  ucs: 203e → ffe3
  utf8: e280be → efbfa3

 - 81行目 1-01-79 YEN SIGN
  ucs: 00a5 → ffe5
  utf8: c2a5 → efbfa5

  ※(1/24追記)上記 2 文字に関しては、元の infocenter のものが間違って
   いるというわけではありません。むしろ正しいようです(規格票もそうなって
   る)。ややこしい問題があるので、この辺とかこの辺を参照。


 - 114行目 1-02-18 TILDE
  utf8: efbc9e → efbd9e

 - 998行目 1-11-56 UNDERTIE
  ucs: 203F → 203f (大文字になっていたのを小文字に)

 - 11121行目 2-93-27
  ucs: 9b1d → 9b1c
  utf8: e9ac9d → e9ac9c
  ※2004年の追補で変更された


sjis, ucs, utf8 についてはチェックしたつもり。
jis, euc については未チェック。
一応合ってるとは思いますが、自信はありません。

加工、再配布等ご自由にお使い頂いて構いません。
もちろん自己責任で。

<追記>
ふと「あれ?あんなテキストそのままアップロードして大丈夫なんだっけか?」と気になって確認してみたらやっぱ化けてますね。
すんません。戻ったら上げ直します。

<追記 2>
確認した環境にフォントがなくて化けただけだった orz
アホだ…
posted by vagus at 07:07| 東京 ☀| Comment(0) | TrackBack(0) | cannadic改 - 配布用 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック