怎么自动识别文件编码是用UTF-8或者GBK或其他字符级编码保存的-Java教程-爱易网页

怎么自动识别文件编码是用UTF-8或者GBK或其他字符级编码保存的

日期：2014-05-18　浏览次数：21283 次

如何自动识别文件编码是用UTF-8或者GBK或其他字符级编码保存的?
如题,我知道ASCII码文件前无前缀字符,UTF-8的文本文件前会有EFBBBF三个字节。Unicode文件前会FFFE两个字节,Unicode big endian文件前会有FEFF00三个字节,但是具体怎么样判断我就不知道了..
有没有哪个高手帮帮忙,谢谢谢谢.....
并且我现在可以得到文件的byte[]数组..但是我直接输出byte[0],byte[1]这样好象是不行的饿。..

------解决方案--------------------
byte [] buff = item.get();//把字符变成byte
if (buff[0]==-17 && buff[1]==-69 && buff[2]==-65){
this.str = new String(buff,"utf-8");//utf-8
}else if(buff[0]==-1 && buff[1]==-2){
this.str = new String(buff,"unicode");//unicode
}else if(buff[0]==-2 && buff[1]==-1){
this.str = new String(buff,"unicode big endian");//unicode big endian
}else{
this.str = new String(buff,"big5");
}

------解决方案--------------------
用头二个字节来判断
------解决方案--------------------
sorry 发错了一个链接

讨论继续
------解决方案--------------------
我这里有一段检测编码类型的代码，成功率很高！ http://www.java2000.net/viewthread.jsp?tid=1679

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

不同类的对象中具有相同名字的方法,怎么调用可以节省代码

struts2 下载文件有关问题

空指针错误，求真相

BufferWriter怎么从键盘输入多行数据到文本

想学J2me哪本书好啊！解决方法

透过正则表达式替换字符串报 java.lang.StackOverflowError

javascript 执行,该如何处理

j2me手机游戏中打怪场景，有没有高手共享一下源代码，本人只是借鉴，回复者皆给分,该如何处理

急java 键盘输入变量有关问题

怎么自动识别文件编码是用UTF-8或者GBK或其他字符级编码保存的

相关资料更多>

推荐阅读更多>