C#读取PDF有关问题-C#教程-爱易网页

C#读取PDF有关问题

日期：2014-05-17　浏览次数：21387 次

C#读取PDF问题
最近在做一个项目，需要读取PDF文档，在网上找了很多相关资料，也做了不少demo，读取结果不是很理想，于是找到了PDFSharp开源项目，但是读取出来的东西全是乱码，Encoding的编码格式都不行，用PDFBox第三方控件有些文档依旧是读出报错，所以准备放弃PDFBox，想问问各位大侠，用PDFSharp读取PDF文档，最有效的方式是什么啊？我只读取文字，忽略图片的。
代码如下：

C# code


 private static String ReadPdf(String fileName)
        {



            Stream stream =new FileStream(fileName, FileMode.Open, FileAccess.Read);
            Byte[] buffer = new Byte[stream.Length];
            stream.Read(buffer,0,Convert.ToInt32(stream.Length));
        
            StringBuilder sb = new StringBuilder();
           
            CSequence sequence = ContentReader.ReadContent(buffer);
               
            sb.Append(Encoding.Unicode.GetString(sequence.ToContent()));
         
            return sb.ToString();
        }

------解决方案--------------------
没用过，只能帮你找找
------解决方案--------------------
用iTextSharp
------解决方案--------------------
还好我们项目中只需要convert成图片

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

C#读取PDF有关问题

相关资料更多>

推荐阅读更多>