Python 正则

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import re
#返回pattern对象
re.compile(string[,flag])
#以下为匹配所用函数
re.match(pattern, string[, flags])
re.search(pattern, string[, flags])
re.split(pattern, string[, maxsplit])
re.findall(pattern, string[, flags])
re.finditer(pattern, string[, flags])
re.sub(pattern, repl, string[, count])
re.subn(pattern, repl, string[, count])



 re.I(全拼IGNORECASE): 忽略大小写括号内是完整写法下同
 re.M(全拼MULTILINE): 多行模式改变'^''$'的行为参见上图
 re.S(全拼DOTALL): 点任意匹配模式改变'.'的行为
 re.L(全拼LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
 re.U(全拼UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
 re.X(全拼VERBOSE): 详细模式这个模式下正则表达式可以是多行忽略空白字符并可以加入注释

总结: 尽量使用.*?匹配 使用()获取匹配目标 有换行用re.S 尽量用re.search 扫描整个字符串返回第一个匹配 不用match因为pattern参数里面第一个不匹配就直接None