日期:2014-05-20  浏览次数:20656 次

怎么通过正则表达式抓取html文本中的<img/>
假如我有一段html文本:

<p>
<img src="/upload/20130715210614730433.jpg" alt="" height="156" align="right" width="300" />
于此同时,那年参加高考的很多学生在“可
能取消高考”的谣言中放任自流,多年后悔不当初;那年很多大学封校,出不来和进不去也没能阻碍那些相会的情
侣,他们调侃为非典时期的爱情。在当时,社会医疗应急系统、政府部门应急能力、疫情控制经验和教训、被非典夺去的生命和他们的亲人、可歌可泣的医护人和媒
体人都是全民关注焦点,非典时期的爱情并不在列。在那个全民上下警戒恐慌的年代,谈爱情总有点儿不合时宜。
<p>
但十年后的今天,一段发生在非典时期的爱情故事,被很多人称之为“爱情存在的真实凭证”。承载这个故事的《藏地白皮书》现在已经买不到了,我一直等到《藏地白皮书·十年见证版》才能真正一睹为快。
</p>
</p>
我想把文本中的<img src="/upload/20130715210614730433.jpg" alt="" height="156" align="right" width="300" />抓取出来,正则表达式应该怎么写,求大神支招

------解决方案--------------------

String str = "<img src=\"/upload/20130715210614730433.jpg\" alt=\"\" height=\"156\" align=\"right\" width=\"300\" />asdf<dd/>";
Pattern p=Pattern.compile("(<img .*?/>)");
Matcher m=p.matcher(str);
while(m.find()){
System.out.println(m.group(1));
}