2008-07-28から1日間の記事一覧

Unicode波型問題 CP932とShift_JISは同じエンコーディングではない

「〜」の文字コードはShift_JISで'\x81\x60'で、CP932でも同じコードです。が、Unicodeには、「波型」と「全角ティルダ」という二つの異なる「〜」が存在します。一般的には「波型」であるu'\u301c'が使われます。Shift_JISの「〜」'\x81\x60'はUnicodeの「…