php substr函數(shù)截取中文出現(xiàn)亂碼是因?yàn)閟ubstr函數(shù)會(huì)把一個(gè)UTF-8的中文字符當(dāng)做3個(gè)字節(jié)來處理,其解決亂碼的方法就是更換使用mb_strlen和mb_substr函數(shù)即可。
本文操作環(huán)境:Windows7系統(tǒng)、PHP7.1、Dell G3電腦。
php substr函數(shù)截取中文亂碼怎么辦?
PHP中substr截取中文亂碼解決方案
在PHP中經(jīng)常使用substr來進(jìn)行字符串的截取,但是當(dāng)我們用它來實(shí)現(xiàn)對(duì)中文字符進(jìn)行截取的時(shí)候則會(huì)發(fā)生亂碼問題,比如說:
<?php $mystring="今天天氣真好"; $mysubstring=substr($mystring,0,2); echo $mysubstring; ?>
輸出結(jié)果為?;
原因分析:substr函數(shù)原型為:string substr ( string $string , int $start [, int $length ] ),其中$length表示返回字節(jié)長度,而一個(gè)中文占兩個(gè)字節(jié),對(duì)于一個(gè)UTF-8的中文字符,會(huì)把它當(dāng)做3個(gè)字節(jié)來處理。
<?php $length=strlen($mystring);echo $length;//輸出結(jié)果為18 ?>
也就是說我們可以用令$length為3,這樣就會(huì)成功返回一個(gè)“今”字。這樣的話如果中文和英文混雜的話則需要我們好好地計(jì)算一下$length了。
那么有更好的解決辦法嗎?Php給出了另外的函數(shù)mb_strlen和mb_substr
<?php $length=mb_strlen($mystring); $mysub=mb_substr($mystring,0,4); echo "the length is:$length,","the substr is:$mysub"; ?>
輸出結(jié)果為:the length is:6,the substr is:今天天氣
mb_strlen函數(shù)原型為int mb_strlen(string string_input, string encode);encode默認(rèn)為UTF-8,它會(huì)將為UTF-8編碼的中文字符算作一個(gè)
注意:mb_strlen與mb_substr并不是PHP的核心函數(shù),使用前需要打開php.ini中的extension=php_mbstring.dll這一項(xiàng)
推薦學(xué)習(xí):《PHP視頻教程》