日期:2014-05-18  浏览次数:20627 次

用java实现提取指定网页中的表格数据
我想用java编程来实现抽取指定网站上的一些表格数据内容,比如买书的网站上,有新书发布,我想把所有的新书的信息提取出来,比如书名,作者,出版社等,请问如何实现?有谁有相关的源代码?谢谢

------解决方案--------------------
提供一个思路吧,这种都属于页面抓取程序,分析一下你要抓的页面的源文件,定义一个取数据的区域,自己解析就可以了,至于如何页面抓取,可以到网上搜索一下,很多的
------解决方案--------------------
把真个文件内容放入一个xml的document里,然后用做xml解析就行了。