日期:2014-05-20  浏览次数:20753 次

怎么用jsoup将网页中的正文提取成txt文本
想用jsoup将一个网页中的文字提取出来存储在另外一个txt文档中。
不知道该怎么用。
System.out.println(doc.title());  提取出来了网页的title。

正文不知道该怎么提取。。。

------解决方案--------------------
JS中可以用document.body.innerText取网页的文本,你看看jsoup中有没有类似的方法或属性。