日期:2014-05-18  浏览次数:20609 次

html页面检索
需要从一个html页面上的一个或者多个“表”中,提取出,某一个“列”中的所有数据。应该用什么工具或者方法?
我尝试了用lucene   但发现lucene好像没有这样的或间接的功能。
拜托各位给个实现这种功能的例子。

------解决方案--------------------
用js吧

var row = table.rows(i);
首先你要知道行的位置,或者你可以为你的tr定义一个id,用document.getElementById( "id ")得到
之后用row.cells[列名].innerText取出你的数据就可以了。

------解决方案--------------------
用正则最简单 , 但也可以用类似于htmlParser的工具,对页面进行解析.