EUC-JPな漢字
EUC-JPな漢字のバイト配列を取得したり、その逆で、バイト配列から文字列を取得する時、キャラクタセットに"EUC-JP"を指定して取得する。
"日本語".getBytes("EUC-JP"); new String('バイト配列', "EUC-JP")
まっ、普通はそれで良いんですが、拡張文字とか使われていると正しくマッピングされない…。はしご高とか…。
Java 5.0 からいくつか文字エンコーディングが追加されてる。"EUC_JP_LINUX" とか "EUC_JP_Solaris" とか。