正则除去一些DIV内的内容-PHP教程-爱易网页

正则除去一些DIV内的内容

日期：2014-05-17　浏览次数：20832 次

正则去除一些DIV内的内容。
我想正则去除一些DIV的内容。div id 或者class 带comment或者share的（comment和share是一个模糊匹配。），比如<div id="comment">， <div class="header-comment">， <div id="comment-footer">等等。

下面这段测试代码，保留Main content.去除后面的评论部分。

$htmls = <<<EOT

<div id="content">

     Main content.

</div>

<div id="comment">

	<ul>

		<li class="comment">

			<div class="header-comment">

				Comment:

				<span class="date-comment">8/11/2012, 21:25</span>

			</div>

			<h4>Some Text</h4>

			<p class="test-comment">Blah~~ Blah~~ Blah~~</p>

			<div class="share">

				<div class="vote">

					<a class="vota yes" title="Like">2</a>

					<a class="vota no" title="Unlike">0</a>

				</div>

			</div>

		</li>

		<li class="comment">

			<div class="header-comment">

				Comment:

				<span class="date-comment">8/11/2012, 23:08</span>

			</div>

			<h4>Other Text</h4>

			<p class="test-comment">Blah~~ Blah~~ Blah~~</p>

			<div class="share">

				<div class="vote">

					<a class="vota yes" title="Like">4</a>

					<a class="vota no" title="Unlike">0</a>

				</div>

			</div>

		</li>     

     </ul>

</div>

EOT;



$htmls = preg_replace('/<div[^>]*(comment|share)[^>]*>(.*?)<\/div>/is', '', $htmls);

echo $htmls;

------最佳解决方案--------------------
jordan102，有没有办法根据闭包分析并删除？
------其他解决方案--------------------

</div>

<div id="footer">

     Footer content.

</div>

EOT;

我是说如果后面再加一个#footer，这个footer也被去掉了。
------其他解决方案--------------------
$htmls = preg_replace('/<div[^>]*(comment
------其他解决方案--------------------
你可以下载一个simple_html来解析html代码
然后遍历所有的div，然后
1、获取div的id，检测是否包含comment或者share
1、获取div的class，检测是否包含comment或者share
有则删除这个div，最后输出处理后的html即可
------其他解决方案--------------------
share)[^>]*>(.*)<\/div>/is', '', $htmls); //贪婪匹配
------其他解决方案--------------------
jordan大哥，你确信？这样的话，什么都返回不了了……
------其他解决方案--------------------
那就没什么好办法了。除非你能知道 </div> 后面有些特殊字符。
------其他解决方案--------------------

引用:

PHP code12345</div><div id="footer"> Footer content.</div>EOT;
我是说如果后面再加一个#footer，这个footer也被去掉了。

正则不行可以使用一个字符一个字符的检查嘛。正则有时也不是万能的，只有在有规律的字符串中才有用。

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

正则除去一些DIV内的内容

相关资料更多>

推荐阅读更多>