日期:2014-05-17  浏览次数:20493 次

奇怪的抓取结果
我想抓取http://www.sctport.com.cn/newsctsite/sct/cntrnoplan.jsp?ToPage=1这个页面的表格内容,但奇怪了,为什么只能抓取中文的部分,不能抓取英文的部分?太奇怪了。 用SNOOPY类,代码如下: 高手帮忙看看啊,我郁闷死了。

include("Snoopy.class.php");  
$snoopy = new Snoopy;
$snoopy->fetch("http://www.sctport.com.cn/newsctsite/sct/cntrnoplan.jsp?ToPage=1"); 
preg_match_all('/<font\ size="2">(.*?)<\/font>/i',$snoopy->results,$d);
for ($i=0;$i<40;$i++){
echo $i; echo "----";
 ECHO $d[1][$i]."<br>";
}

只抓取了中文的部分,英文的,日期的,都没抓出来,不知道怎么回事?

------解决方案--------------------
探讨
PHP code
<?php
$str=file_get_contents('http://www.sctport.com.cn/newsctsite/sct/cntrnoplan.jsp?ToPage=1');
preg_match_all('/<font\ size="2">(.*?)<\/font>/is',$str,$matches);
print_r($matches);

------解决方案--------------------
preg_match_all('/<font size="2">(.*)<\/font>/isU',$snoopy->results,$d);