日期:2014-05-16  浏览次数:20434 次

带BOM的utf-8,用json_decode() 返回null的问题 --- 超过3个bom字符

PHP中file_get_contents函数获取URL文件内容时,带BOM的utf-8,用json_decode() 返回null的问题。

网上有二种处理方法:

1、正则

if(preg_match('/^\xEF\xBB\xBF/',$data))??? //去除可能存在的BOM
{
??? $data=substr($data,3);
}

?

2、自动检测目录下文件并移除BOM

?<?php
if (isset($_GET['dir'])){ //config the basedir
  $basedir=$_GET['dir'];
}else{
  $basedir = '.';
}
$auto = 1;
checkdir($basedir);
function checkdir($basedir){
  if ($dh = opendir($basedir)) {
    while (($file = readdir($dh)) !== false) {
      if ($file != '.' && $file != '..'){
        if (!is_dir($basedir."/".$file)) {
          echo "filename: $basedir/
$file ".checkBOM("$basedir/$file")." <br>";
        }else{
          $dirname = $basedir."/".
$file;
          checkdir($dirname);
        }
      }
    }
  closedir($dh);
  }
}
function checkBOM ($filename) {
  global $auto;
  $contents = file_get_contents($filename);
  $charset[1] = substr($contents, 0, 1);
  $charset[2] = substr($contents, 1, 1);
  $charset[3] = substr($contents, 2, 1);
  if (ord($charset[1]) == 239 && ord($charset[2]) == 187 &&
ord($charset[3]) == 191) {
    if ($auto == 1) {
      $rest = substr($contents, 3);
      rewrite ($filename, $rest);
      return ("<font color=red>BOM found,
automatically removed.</font>");
    } else {
      return ("<font color=red>BOM found.
</font>");
    }
  }
  else return ("BOM Not Found.");
}
function rewrite ($filename, $data) {
  $filenum = fopen($filename, "w");
  flock($filenum, LOCK_EX);
  fwrite($filenum, $data);
  fclose($filenum);
}
?>

?

?本人参考上面二种方法,均无效。

于是把?file_get_contents得到的内容(浏览器上显示的)复制出来,并粘贴进Netbeans空白PHP文件中,发现我的BOM内容根本不至3个字符。。。

于是修改如下:

。。。。//类其他文件,不用理

?

??? public static function checkBOM($contents) {????????
??????? $j=0;
??????? for($i=0;$i<strlen($contents);$i++){
??????????? $charset = ord(substr($contents, $i, 1));
??????????? if($charset==239 || $charset==187 || $charset==191 ){
??????????????? $j++;
??????????? }
??????? }
??????? $contents = substr($contents, $j);
??????? return $contents;
??? }

。。。。//类其他文件,不用理

?

调用页:

$data = file_get_contents(fileURL);

$data = func::checkBOM($data);??? //去除可能存在的BOM
$data = json_decode($data, true);

这样就OK了