高手！去页面所有标签！然后去掉只留内容-Java教程-爱易网页

高手！去页面所有标签！然后去掉只留内容

日期：2014-05-18　浏览次数：21038 次

请教各位高手！去页面所有标签！然后去掉只留内容！
我现在面临的困难是：现在别人给我一段代码（以html代码为例）,此段代码含有比较多的标签属性：例如有如下代码片段：
<body>
<h1>hello</h1>
<table name="tbName" border="1">
<tr id="trId">
<td>Cotent</td>
</tr>
</table>
</body>
我这是要获取其中的
<body>
<h1>
</h1>
<table name="tbName" border="1">
<tr id="trId">
<td>
</td>
</tr>
</table>
</body>
取出来这些标签之后再把这些标签去掉！也就是使之为空，只留其中的内容部分！有哪位高手有好的方法给与指教！小弟非常感激！

------解决方案--------------------
str.replaceAll("<.?*>","");
------解决方案--------------------
用正则应该可以,html,wml形式都差不多

Java code


 Pattern p = Pattern.compile("<[^>]+>|</[^>]+>",Pattern.CASE_INSENSITIVE );
 String htmlContent = "...<body>.....</body>..." 
 Matcher m = p.matcher(htmlContent);
 String content = m.replaceAll("");

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

数据库 jdbc连接有关问题？

一道很简单的求大于平均值的JAVA题,该如何处理

servlet怎么得到表单传递过来的信息

大家帮忙总结一上ie和火狐的样式或js不兼容的有关问题。

请教Applet能否调用webservice?

两个frame中间有空白，怎么处理啊

连不下mySQL数据库

怎么判断输入的是0-100的整数

有一本外文书专门讲map之类的书名是什么,该怎么解决

高手！去页面所有标签！然后去掉只留内容

相关资料更多>

推荐阅读更多>