日期:2014-05-18  浏览次数:20440 次

网页显示.pdf文件文本出现乱码
我在后台中调用一个.exe文件,该文件将会截取一个.pdf文件中的一段文本,网页中要显示这段文本,现在在网页中这段文本显示出来的是乱码,网页中的其他字符是正常显示的:
就这样:

  Want   the   source   code   of   this   application?


(unknown)
y跮€?KOg鰧宍?琍粂c聈栕霚?畒鋈岘酖靣斨糔??C+?躱?+-_檰侻Z謍ME?`?&蕳PV糤4綟   冡=?Zr...?豁?j逡鰒i婯?刟睛弼窜R濆譺绝j   勍慥?X|閷?G錵弭`接Me堦馇禦蹬貊狽︳漄CcT0糊忹阚飶桦B騉Z??B︾J  
http://www.dotlucene.net/documentation/api/1.4/irpol10.pdf  

    那段乱码是从.pdf文件中截取的,我查过了,.pdf编码方式为ANSI,那段文本是英文,我本来是准备转换成utf8的,可是转完后,还是乱码。
    不知道怎么解决了,有人会吗,指导一下吧

------解决方案--------------------
网页不能直接显示pdf文档,pdf文档是解密的,你得用activeX控件,或者用pdfbox