日期:2014-05-16  浏览次数:20517 次

请教大神 这个到底能不能用正则匹配到 死活弄不出来啊
一个页面有很多条微博 一条微博里面有很多层DIV 我想获取到每条微博里面的这两个DIV的数据:
<div class="content" title="2013-12-03 22:38:07"> 文字内容</div>
<div class="thumb">
   <a onclick="_hmt.push(['_trackEvent', 'post', 'click', 'signlePost'])" target="_blank" href="/article/53290047?list=8hr&s=4620390">
<img alt="结婚" src="http://pic.qiushibaike.com/system/pictures/5329/53290047/medium/app53290047.jpg">
   </a>
</div>
这两个DIV是同级的
我要抓到class=content里的内容 和 img的src;
需要注意的是要考虑到第二个DIV不是必须的 有些微博有图片 有些没有

------解决方案--------------------
建议你用phpquery吧,前两天看了一下蛮好...掌握方法之后就不需要再想那些正则表达式啦