Python 正则表达式核心用法与实战技巧
引言
正则表达式(Regular Expression,简称 Regex)是用于描述字符串模式的一套语法规则。在 Python 中,通过内置的 re 模块,开发者可以高效地进行文本搜索、替换、提取和验证。本文将系统介绍正则表达式的基础语法、常用函数及高级技巧,帮助读者掌握文本处理的核心能力。
基础语法与元字符
正则表达式由普通字符和特殊字符(元字符)组成。理解元字符的含义是使用正则的前提。
| 元字符 | 含义 | 示例 |
|---|---|---|
. | 匹配除换行符以外的任意单个字符 | a.c 匹配 abc |
^ | 匹配字符串开头 | ^Hello 匹配以 Hello 开头 |
$ | 匹配字符串结尾 | world$ 匹配以 world 结尾 |
* | 匹配前一个字符 0 次或多次 | ab*c 匹配 ac, abc, abbc |
+ | 匹配前一个字符 1 次或多次 | ab+c 匹配 abc, abbc |
? | 匹配前一个字符 0 次或 1 次 | colou?r 匹配 color 或 colour |
{n} | 精确匹配 n 次 | \d{3} 匹配 3 位数字 |
{n,} | 至少匹配 n 次 | \d{3,} 匹配 3 位及以上数字 |
[] | 字符集合,匹配其中任意一个 | [abc] 匹配 a, b 或 c |
[^] | 否定字符集合 | [^0-9] 匹配非数字字符 |
\d | 匹配任意数字,等价于 [0-9] | \d+ |


