日期:2014-05-18  浏览次数:20786 次

远程抓取的页面内容为乱码
我在jsp页面中通过远程抓取页面内容,如果源文件没有乱码,抓取的内容也不会出现乱码.如果那个页面的源文件就有乱码的话,我用什么方法能把它转换过来呢.在线等,解决了马上给各位加分...........

------解决方案--------------------
你问的问题太专业了, 只能顶你一下好了
------解决方案--------------------
有个开源的东西你可以试试.httpParser.这个东西就是专门解析html页面的

------解决方案--------------------
你可以换你抽取的页面内容转换成xml格式!其实用nekohtml就可以抽网页并转成xml格式的!
然后你可以用jdom进行解析你所想要的了!