日期:2014-05-20  浏览次数:20725 次

如何用java判断一个url是不是PDF类型的文件?
在我的java程序中得到了一个网页中的所有超链接,想把其中的PDF文档下载下来。请问该如何判断,仅以是不是以".pdf"结尾判断可以吗

------解决方案--------------------
我不知道该如何判断 但我有一个很笨的方法
如果是一个下载文件 后台会有下面的操作(J2EE,其他平台也一样,重点是括号里面的参数)
res.setContentType("application/x-download;charset=gbk");
res.setHeader("Content-Disposition" ,"attachment;filename=test.pdf");
得到链接之后需要访问每个链接 使用socket的输入流获取每个链接的头信息 根据头信息判断是否为pdf文件
但这样有一个bug 有些网站给文件取名字不一定就是以真正文件的后缀名结尾 
其次 一些压缩文件里面可能也有pdf文件 这样的pdf文件是搜索不出来的