根据字符数执行一个多字节安全的 substr() 操作。 位置是从 str
的开始位置进行计数。 第一个字符的位置是 0。第二个字符的位置是 1,以此类推。
参数
-
str
-
从该 string 中提取子字符串。
-
start
-
str
中要使用的第一个字符的位置。 -
length
-
str
中要使用的最大字符数。 If omitted or NULL is passed, extract all characters to the end of the string. -
encoding
-
encoding
参数为字符编码。如果省略,则使用内部字符编码。
采用PHP字符串mbstring可以较好地解决这个问题。mb_strlen的用法和strlen类似,只不过它有第二个可选参数用于指定字符编码。例如得到UTF-8的字符串$str长度,可以用mb_strlen($str,’UTF-8′)。如果省略第二个参数,则会使用PHP的内部编码。内部编码可以通过mb_internal_encoding()函数得到,设置有两种方式:
1. 在php.ini中设置mbstring.internal_encoding = UTF-8
2. 调用mb_internal_encoding(”GBK”)
除了PHP字符串mbstring,还有很多切割函数,其中mb_substr是按字来切分字符,而mb_strcut是按字节来切分字符,但是都不会产生半个字符的现象。而且从函数切割对长度的作用也不同,mb_strcut的切割条件是小于strlen, mb_substr是等于strlen,看下面的例子,
- < ?
- $str = ‘我是一串比较长的中文-www.jefflei.com’;
- echo “mb_substr:” . mb_substr($str, 0, 6, ‘utf-8′);
- echo ”
- “;
- echo “mb_strcut:” . mb_strcut($str, 0, 6, ‘utf-8′);
- ?>
输出如下:
mb_substr:我是一串比较
mb_strcut:我是
需要注意的是,PHP字符串mbstring并不是PHP核心函数,使用前需要确保在php编译模块时加入mbstring的支持:
(1)编译时使用–enable-mbstring
(2)修改/usr/local/lib/php.inc
default_charset = “zh-cn”
mbstring.language = zh-cn
mbstring.internal_encoding =zh-cn
PHP字符串mbstring类库内容比较多,还包括mb_ send_ mail 之类的email处理函数等