PHP顶部有BOM空白行 \ufeff字符的处理方法

会飞的鱼 0 1466 2017年9月30日

今天在弄集合短网址的时候发现总是处理不了一个站的数据，一直以为姿势不对，换了很多姿势。

研究了两个钟头，json_decode死活解析不出数据，

在一次json_encode测试意外中发现了\ufeff\ufeff\ufeff 三个转码字符，百度了一下，发现这是BOM头的数据

于是想办法去过滤他，我正则测试了半天没有问题，可是一上PHP 代码就不行，于是继续百度。

我将最终的方法贴出来给大家

function DoBOM($text){
    if(substr($text, 0, 3) == pack("CCC", 0xEF, 0xBB, 0xBF)) $text = substr($text, 9);
    return $text;
}

这个可以过滤掉BOM 头，下面分享一个批量的

<?php
header('content-Type: text/html; charset=utf-8');
$auto=1;/*设置为1标示检测BOM并去除，设置为0标示只进行BOM检测，不去除*/
$basedir='.';
$loop=true;//www.phpernote.com
echo '当前查找的目录为：'.$basedir.'当前的设置是：';
echo '（1）',$loop?'检查当前目录以及当前目录的子目录':'只针对当前目录进行检测';
echo '（2）',$auto?'检测文件BOM同时去除检测到BOM文件的BOM<br />':'只检测文件BOM不执行去除BOM操作<br />';

checkdir($basedir,$loop);
function checkdir($basedir='',$loop=true){
    $basedir=empty($basedir)?'.':$basedir;
    if($dh=opendir($basedir)){
        while (($file=readdir($dh))!==false){
            if($file!='.'&&$file!='..'){
                if(!is_dir($basedir.'/'.$file)){
                    echo '文件: '.$basedir.'/'.$file .checkBOM($basedir.'/'.$file).' <br>';
                }else{
                    if(!$loop) continue;
                    $dirname=$basedir.'/'.$file;
                    checkdir($dirname);
                }
            }
        }
        closedir($dh);
    }
}
function checkBOM($filename){
    global $auto;
    $contents=file_get_contents($filename);
    $charset[1]=substr($contents,0,1);
    $charset[2]=substr($contents,1,1);
    $charset[3]=substr($contents,2,1);
    if(ord($charset[1])==239&&ord($charset[2])==187&&ord($charset[3])==191){
        if($auto==1){
            $rest=substr($contents,3);
            rewrite($filename,$rest);
            return (' <font color=red>找到BOM并已自动去除</font>');
        }else{
            return (' <font color=red>找到BOM</font>');
        }
    }else{
        return (' 没有找到BOM');
    }
}
function rewrite($filename,$data){
    $filenum=fopen($filename,'w');
    flock($filenum,LOCK_EX);
    fwrite($filenum,$data);
    fclose($filenum);
}

本文由 @会飞的鱼于 2017-9-30 发布在会飞的鱼Blog，如无特别说明，本博文章均为原创，转载请保留出处。

网友评论

暂无评论

会飞的鱼 V

一条会飞的鱼！

745 文章

7295 评论

1098 万阅读

9年博龄

最新文章

最新评论: 小妖精博客
3个月前 (2024-11-24)

还有最新下载地址吗

Emlog主题Media - V1.0.2 全新自媒体风格主题

鸿鹄小猿
4个月前 (2024-10-27)

感谢分享

FLY 1.4 开源美化V2极致版EMLOG主题

丢塔网
9个月前 (2024-06-04)

这个主题简介啊

Emlog主题Come - 20231105 v1.2

小磊
9个月前 (2024-05-30)

看看

FLY 1.4 开源美化V2极致版EMLOG主题

开箱挖掘机
9个月前 (2024-05-27)

大大请教一下fee主题现在还能下载吗？

emlog模板：fee主题商业版V2.1 功能介绍

标签

PHP顶部有BOM空白行 \ufeff字符的处理方法

网友评论

会飞的鱼 V

Emlog主题Media - V1.0.2 全新自媒体风格主题

FLY 1.4 开源美化V2极致版EMLOG主题

Emlog主题Come - 20231105 v1.2

FLY 1.4 开源美化V2极致版EMLOG主题

emlog模板：fee主题商业版V2.1 功能介绍