一堆的文件編碼都是ANSI的,本來想用linux shell批量修改文件編碼,卻不太熟悉,寫了個PHP腳本批量修改html文件的編碼,代碼如下:
- <?php
- //1.遍歷出所有html文件
- $dir = './jquery/jquery/'; //文件目錄、
- $move_to = './jquery/jquery_new/';
- foreach(glob($dir . '*.htm*') as $html)
- {
- //讀取文件
- $fp = fopen($html, 'a+');
- $html_string = fread($fp, filesize($html));
- //轉碼操作
- $html_string = str_replace('charset=gb2312', 'charset=UTF-8', $html_string);
- $file_code = mb_detect_encoding()($html_string, array('UTF-8','GBK','LATIN1','BIG5'));
- if($file_code = 'CP936')
- {
- $html_string = mb_convert_encoding($html_string ,'utf-8' , 'gbk');
- }
- //獲取文件名
- $slice = explode('/', $html);
- $file_name = end($slice);
- //移到新文件
- file_put_contents($move_to . $file_name, $html_string);
- fclose($fp);
- }
- echo 'ok, 執行完成';
其實主要用到mb_detect_encoding檢測編碼,使用mb_convert_encoding轉換編碼,這是mbstring擴展的函數,代碼如下:
- <?php
- /**
- * 檢測編碼
- * string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )
- *
- * @param $str 要檢測的字符串
- * @param $encoding_list 檢測編碼的順序
- * @param $strict 是否嚴格檢測編碼
- */
- $str = 'PHP點點通';
- echo $file_code = mb_detect_encoding($str, array('UTF-8','GBK','LATIN1','BIG5')); //UTF-8
- /**
- * 轉換編碼
- * string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
- *
- * @param $str 要轉換的字符串
- * @param $to_encoding 轉換后的字符串
- * @param $from_encoding
- */
- echo mb_convert_encoding($str, 'GBK', 'UTF-8');
新聞熱點
疑難解答