EUC-JPな漢字

EUC-JPな漢字のバイト配列を取得したり、その逆で、バイト配列から文字列を取得する時、キャラクタセットに"EUC-JP"を指定して取得する。

"日本語".getBytes("EUC-JP");
new String('バイト配列', "EUC-JP")


まっ、普通はそれで良いんですが、拡張文字とか使われていると正しくマッピングされない…。はしご高とか…。

Java 5.0 からいくつか文字エンコーディングが追加されてる。"EUC_JP_LINUX" とか "EUC_JP_Solaris" とか。

で、"EUC-JP" の代わりに、"EUC_JP_Solaris" を使うと、うまくいくっぽい。