正则表达式通常用于判断语句中,用来检查某一字符串是否满足特定格式。它包含一些具有特殊意义的字符,称为元字符。例如,\d 表示数字 0~9 中的任何一个。
常用元字符参考
| 元字符 | 正则写法 | 意义 |
|---|---|---|
| . | . | 任意一个字符 |
| \d | \d | 0~9 的任何一个数字 |
| \D | \D | 非数字字符 |
| \s | \s | 空白字符(如制表符、换行) |
| \S | \S | 非空白字符 |
| \w | \w | 标识符字符(字母、数字、下划线) |
| \W | \W | 非标识符字符 |
| \p{Lower} | \p{Lower} | 小写字母 a~z |
| \p{Upper} | \p{Upper} | 大写字母 A~Z |
| \p{ASCII} | \p{ASCII} | ASCII 字符 |
| \p{Alpha} | \p{Alpha} | 字母字符 |
| \p{Digit} | \p{Digit} | 十进制数字 |
| \p{Alnum} | \p{Alnum} | 数字或字母字符 |
| \p{Punct} | \p{Punct} | 标点符号 |
| \p{Graph} | \p{Graph} | 可见字符 |
| \p{Print} | \p{Print} | 可打印字符 |
| \p{Blank} | \p{Blank} | 空格或制表符 |
| \p{Cntrl} | \p{Cntrl} | 控制字符 |
注意:在正则表达式中,
.代表任何字符。如果想在匹配中使用普通意义的点字符,必须使用转义字符\。
方括号与组合规则
可以使用方括号括起若干个字符来表示一个元字符,该元字符可代表方括号中的任何一个字符。例如 "[abc]4",这样字符串 a4、b4、c4 都是和正则表达式匹配的字符串。
方括号元字符还支持其他格式:


