日期:2014-05-17  浏览次数:20585 次

使用PHP 開源類來分析HTML

Sourceforge上有一个PHP的分析类,可以从这里下载 。??

?

采用PHP5+开发的一个简单的PHP HTML DOM分析,支持invalid HTML并提供非常简单的方式来操作HTML元素。在HMTL页面上查找标签所使用的语法与jQuery(一个轻量级,实用的javascript框架)相似。从页面中抽取内容只需要一行代码。

請參考 http://simplehtmldom.sourceforge.net/

特色


1. 只支持PHP5以上
2. 可以分析不怎么严谨(invalid)的HTML代码
3. 支持简单的CSS Selector.
4. 支持简单的DOM操作
5. 保持HTML中的原始格式

?

$html = file_get_html($url);

// Find all images
foreach($html->find('img') as $element)
       echo $element->src . '<br>';



// Find all links
foreach($html->find('a') as $element){
/* 出來的效果大概是這樣
http://www.phpfans.net/manu/javascript/    a   
 <a href="http://www.phpfans.net/manu/javascript/" target="_blank">javascript 手册</a>    
 javascript 手册    javascript 手册
 <br>http://www.phpchina.com/    a    <a href="http://www.phpchina.com/" target="_blank">PHPChina</a>    PHPChina    PHPChina<br>
http://www.phpfans.net/    a    <a href="http://www.phpfans.net/" target="_blank">php爱好者</a>    php爱好者    php爱好者 <br>http://www.phpv.net/    a    <a href="http://www.phpv.net/" target="_blank">PHP5研究室</a>    PHP5研究室    PHP5研究室<br><br> <br>http://www.phpx.co
*/
	 echo $element->href .'    '. $element->tag 
	 .'    '. $element->outertext .'    '. $element->innertext .'    '. $element->plaintext	 .'<br>'; 
       
}
?

deme頁:? http://wasa.sinaapp.com/demo/curl.php




參考轉載于 : 使用PHP简单分析HTML

?