日期:2014-05-20  浏览次数:20636 次

java正则匹配取HTML标签内容
现在有一个HTML标签的字符串类似:
"<p class='xxxx'> Content\n\r内容\t\n\n</p>"

现在在java里面,怎么用正则处理才能完整地拿到 这个P标签中间的内容,我试了很多都会或多或少有些问题,
希望大家 帮帮忙给个正确的,最好是自己测试一定能用啊.

------解决方案--------------------
	public static void main(String[] args) {
String str = "<p class='xxxx'> Content\n\r内容\t\n\n</p>";
Matcher m = Pattern.compile("<p.*?>([\\s\\S]*)</p>").matcher(str);
while(m.find()){
System.out.println(m.group(1));
}
}