澳门新葡亰赌995577php中常用正则表达式总结

主要还是看ASCII码的值,
$str =~ m/[^\0-\127]/
$str =~ m/[^\x0-\x7f]/

匹配特定数字:

要注意反斜线的作用,转义符,一定不要少!

 代码如下

^[1-9]d*$    //匹配正整数
^-[1-9]d*$   //匹配负整数
^-?[1-9]d*$   //匹配整数
^[1-9]d*|0$  //匹配非负整数(正整数 + 0)
^-[1-9]d*|0$   //匹配非正整数(负整数 + 0)
^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数
^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数

  • 0)
    ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数
  • 0)

评注:处理大量数据时有用,具体应用时注意修正

匹配特定字符串:

 代码如下

^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
评注:最基本也是最常用的一些表达式

匹配中文字符的正则表达式: [u4e00-u9fa5]

 代码如下

$str = “php编程”;
if (preg_match(“/^[x{4e00}-x{9fa5}]+$/u”,$str)) {
print(“该字符串全部是中文”);
} else {
print(“该字符串不全部是中文”);
}

评注:匹配中文还真是个头疼的事,有了这个表达式就好办了

匹配双字节字符(包括汉字在内):[^x00-xff]

 代码如下

$str = “singlepoint单点日志”;
if (preg_match(“/^[x{4e00}-x{9fa5}]+$/u”,$str)) {
print(“该字符串全部是中文”);
} else {
print(“该字符串不全部是中文”);
}

$alias_len = mb_strlen($value[‘alias’], “utf-8”);
$temp_array = array();
for($i = 0;$i<$alias_len; $i++)
{
 $temp_array[$i] = mb_substr($value[‘alias’],$i,1,”utf-8″);
 if(ord(substr($temp_array[$i],0,1))>’0xe0′ &&
strlen($temp_array[$i])<3)
     $temp_array[$i] = ”;

}
$value[‘alias’] = implode(”,$temp_array);

评注:编码表 双字节字符编码范围 1. GBK (GB2312/GB18030) x00-xff
GBK双字节编码范围 x20-x7f ASCII

xa1-xff 中文 gb2312 x80-xff 中文 gbk 2. UTF-8 (Unicode) u4e00-u9fa5
(中文) x3130-x318F (韩文