关于java汉文编码的一些小疑点-Java教程-爱易网页

关于java汉文编码的一些小疑点

日期：2014-05-20　浏览次数：21114 次

关于java汉文编码的一些小问题
一直以来都被字符集的编码嗦迷惑，只是有的时候想到其他办法绕开了。如今面临着更大的挑战，也只有硬着头皮上了，

关于中文编码，我有很多不明白的地方:

①java String有一个构造器为:String(byte[] bytes, Charset charset)
有一个方法为:public byte[] getBytes(String charsetName);

我有一事不明:
new String (t.getBytes("charsetName1") , "charsetName2");
以charsetName1获取原String的byte数组,再以charsetName2重编码.
那么就必须要求charsetName1是charsetName2的一个子集(大概意思是这个样子的:比如汉字"啊",其gb2312编码为0x00(假如),要想用GBK重编码，必须要求GBK中汉字"啊"的字符集也是0x00才可以)
而问题在于,除了编码们对ASCII全面兼容以外，各国对其他国家的编码都不算完全兼容。

对于一个未知的编码，怎么将其转化为另一个编码(如GBK或者UTF-8)

②java String 对getBytes是这么描述的:
public byte[] getBytes(Charset charset)
使用给定的 charset 将此 String 编码到 byte 序列，并将结果存储到新的 byte 数组。

我又有一事不明:
比如汉字:"中文"，GB2312以"0xD6D00xCEC4" 储存,转化成字节就是
d6 d0 ce c4.明显 d6>127 了转化为字节数组的时候不是得溢出么,还怎么再存放???求解！

------解决方案--------------------
比如汉字:"中文"，GB2312以"0xD6D00xCEC4" 储存,转化成字节就是
d6 d0 ce c4.明显 d6>127 了转化为字节数组的时候不是得溢出么,还怎么再存放???求解！

个人浅见：
转换成字节是：
-42，-48，-50，-60。
因为java的byte类型是有符号数。二进制表示时就是 11010110，110110000，11001110，11000100，你要是把他按int型看就是d6,d0,ce,c4.

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

为啥spring的注解得到值为null呢

[高分求解]怎么在portlet中获得动态生成的树的当前选中节点

java 多线程有关问题求教

现在的文思发展的如何样

struts2中标签tree在里面加链接和链接后面传值怎么处理

tomcat的服务，jsp怎么实现的一键索引一个网站内的所有文件夹的索引的呢

请问ByteArrayOutputStream字节流里的数据怎么存入一个文件中,

新手，求各路大神帮忙

关于java汉文编码的一些小疑点

相关资料更多>

推荐阅读更多>