爱易网
IT新闻
IT新闻
爱易资讯
网站搭建
云虚拟主机教程
云服务器教程
Apache教程
IIS教程
Nginx教程
网站策划
站长文章
推广教程
淘宝客教程
网页设计
HTML教程
XHTML教程
CSS教程
HTML5教程
CSS3教程
JavaSript基础
JQuery教程
Node.js教程
前端技术
Ajax教程
Js特效
Xml教程
平面设计
页面UI设计
photoshop教程
程序开发
AI人工智能
Asp教程
Php教程
Asp.Net教程
Net Core教程
C#教程
Java教程
Jsp教程
开发技术
微信小程序教程
Uniapp开发教程
微信公众号开发
Andriod教程
IOS教程
DOS教程
Python教程
Docker教程
Windows Container教程
数据库
MSSQL教程
MySQL教程
Redis教程
Access教程
Oracle教程
数据库教程
操作系统
Linux教程
Windows教程
MAC教程
Cisco教程
交换机教程
防火墙教程
搜索
爱易网页
HTML教程
施用HTMLPARSER和HTTPCLIENT制作网络爬虫,附赠相关技术文档
施用HTMLPARSER和HTTPCLIENT制作网络爬虫,附赠相关技术文档
日期:2014-05-17 浏览次数:20847 次
使用HTMLPARSER和HTTPCLIENT制作网络爬虫,附赠相关技术文档。
利用HTMLPARSER和HTTPCLIENT制作的网络爬虫,还不是很完善,过程是先输入网站及关键词,从google取得每页结果的内容,然后分析每个结果中的链接的网站的内容,取得其中的标题及head中的内容显示,以后可以增加智能分析的模块,软件使用java开发,需要安装java虚拟机,图形界面反应有点缓慢,请耐心等待。
1 楼 tywo45 2011-02-08
相当慢,可以用多线程解决界面无响应的问题
上一篇: 说说标准系列目录
下一篇: htmlparser 除了html标签体(获取body,title纯文本)
免责声明:
本文仅代表作者个人观点,与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
相关资料
更多>
如何了解语义化的html结构
怎么隐藏aspx文件格式,变成html
弹出窗口的安全警告,该如何处理
CSS 惯用代码
新工具征集-html解析
CSS课程10 CSS的Pseudo Classes 伪类
试发解决思路
网站web规范测试
html做成的chm无法打开
推荐阅读
更多>
innerHTML 跟 appendchild 的区别
怎么动态显示和隐藏 HTML 元素使用样式表属性
网站页面在不同的浏览器的显示有关问题.页面验证为正确的 XHTML
彻底弄懂CSS匣子模式一(DIV布局快速入门)
CSS初记
少用但适用js和css整理中
CSS实现页面风格的选择解决办法
web上显示wifi信号列表,并统制连接断开
HTML5 – 拖拽效能
怎么让鼠标移动到div块下就触发JS
一个小例证 关于oninput事件
HTML5 传略
怎么实现showModalDialog中Lable文字可以被选去
做过支付宝集成的兄弟们,在return_url,notify_url a如何做安全认证的
关于css中auto的作用,该如何处理
Dreanweaver里显示跟在浏览器中显示不一样,不知道错哪了,div加不上边框
css 去掉超链接式样
HTML 非一般符号编码 的转换方法
怎样才能使<ul>前的文字与<li>中的文字在同一行解决办法
驱除定位html