日期:2014-05-17  浏览次数:20783 次

获取Url的所有连接并自动补全
现在获取网页源码的链接已经没问题了,就是在连接补全上还不知道该怎么弄.

获取到了连接有  xxx/a.html
../../a.html
../a.html


怎么去补全这些URL
------最佳解决方案--------------------
自己加上去啊
WubURL="http://..."+你获取到的链接;
------其他解决方案--------------------
引用:
现在获取网页源码的链接已经没问题了,就是在连接补全上还不知道该怎么弄.

获取到了连接有  xxx/a.html
../../a.html
../a.html


怎么去补全这些URL

获取到的,不全,
自己加他的域名和路径就补全了,
都获取出来了,补全没有什么难度的、
实在不知道怎么补,
在浏览器里打开,看看完整的地址跟你取出来的地址,有什么不同,
把浏览器里不同的部分补全到获取出来的地址前面就是了
------其他解决方案--------------------

如果是别人的网站你可以用爬虫去爬,或者索引去找。
自己的就直接遍历目录。
------其他解决方案--------------------
前缀不是网站域名的这些URL是否能完整抓取到,还是也需要补全???
------其他解决方案--------------------
有些URL的前缀不是网站域名向这个
http://www.discuz.net/archiver/?fid-22.html
------其他解决方案--------------------
找到了,谢谢大家,Uri中就有处理方法