2018-10-23正则表达式 2018-10-23正则表达式

正则表达式的语法用处：
1.判断某个字符串是否符合某个条件
---判断输入的字符串是否是邮箱/手机号码，是否是ip地址（判断某个字符串是否符合某个规则）
2.提取满足条件的字符串
3.字符串的替换
python中是通过re模块中相应的方法支持正则表达式的匹配，查找和替换功能
正则表达式包含两个部分，一个是正则语法对应的字符，一个是普通字符
正则表达式的特殊符号 1 . (匹配任意字符)
一个 . 只匹配一个任意字符

from re import fullmatch re_str = r'a.b' #匹配一个长度为三，第一个为a，第二个为任意字符，最后一个是b 的字符串result = fullmatch(re_str,'acv') print(result)

2 \w(匹配数字字母下划线)
一个\w匹配一个字符

re_str = r'\w...' #匹配一个第一个是字母数字下划线，后面三个为任意字符的长度为四的字符串result = fullmatch（re_str,'accb'） print(result)#<_sre.SRE_Match object; span=(0, 4), match='accb'>

3 \s（匹配任意一个空白字符）
一个\s 匹配一个空白字符

re_str = r'\w..\s.' result = fullmatch(re_str,'_qw r') print(result) #<_sre.SRE_Match object; span=(0, 5), match='_qw r'>

4 \d（匹配数字字符）

re_str = r'\w\s..\d' result = fullmatch(re_str,'1 er2') print(result) #<_sre.SRE_Match object; span=(0, 5), match='1 er2'>

5 \b (检测边界)
一个\b不会去匹配一个字符，而是单纯检测\b出现的位置是否是单词边界
单词边界：字符串的开始和结尾、空格、换行、标点符号等可以将两个单词隔开的字符都是单词边界

re_str = r'\b\w\s\b\d.' result = fullmatch(re_str,'r 34') print(result) #<_sre.SRE_Match object; span=(0, 4), match='r 34'>

6 ^(检测是否是字符串开头)

re_str = r'^\w\s\b.\d' result = fullmatch(re_str,'r l5') print(result) #<_sre.SRE_Match object; span=(0, 4), match='r l5'>

7 $(检测是否以字符串结尾)

re_str = r'^\w.\d\s\b.$' result = fullmatch(re_str,'wu3 r') print(result) #<_sre.SRE_Match object; span=(0, 5), match='wu3 r'>

8 \W ----匹配非字母数字下划线字符
\S --- 匹配非空格字符
\d ---- 匹配非数字字符
9 [] (匹配中括号中出现的任意一个字符)
[字符集] -- 匹配字符集中的任意一个字符
[字符1-字符2] --- 匹配字符1到字符2范围内的字符

注意： - 在中括号中，如果放在两个字符之间，表示范围。字符1的编码值要小于字符2的编码值

# 匹配一个第一个字符是a或者b或者c，后面是三个a re_str = r'[abc]aaa' result = fullmatch(re_str,'aaaa') print(result) result = fullmatch(re_str,'baaa') print(result)re_str = r'[1-4]\d\d\d' result = fullmatch(re_str,'1456') print(result) # <_sre.SRE_Match object; span=(0, 4), match='aaaa'> # <_sre.SRE_Match object; span=(0, 4), match='baaa'> # <_sre.SRE_Match object; span=(0, 4), match='1456'>

10 [^字符集] --- 匹配一个非中括号中字符的字符
11 * （匹配0次或者多次）

re_str = r'[1-9]*' result = fullmatch(re_str,'12123124141124') print(result) result = fullmatch(re_str,'') print(result) # <_sre.SRE_Match object; span=(0, 14), match='12123124141124'> # <_sre.SRE_Match object; span=(0, 0), match=''>

12 + (匹配一次或者多次)

re_str = r'[a-zA-Z_]+' result = fullmatch(re_str,'aW_weq') print(result) # <_sre.SRE_Match object; span=(0, 6), match='aW_weq'>

13 ?(匹配0次或者1次)

#练习：写一个正则表达式，匹配所有的整数 re_str = r'[-+]?[-1-9]+\b' result = fullmatch(re_str,'1234') print(result) #<_sre.SRE_Match object; span=(0, 4), match='1234'>

14 {} (匹配指定次数)
{n} ---- 匹配n次
{m，n} ---- 匹配m到n次
{m，} ---- 至少匹配m次
{，n} ---- 最多匹配n次

# 判断密码是否符合要求; 密码是由数字和字母组成，并且6-16位 re_str = r'[1-9a-zA-Z]{6,16}' result = fullmatch(re_str,'qwe123456') print(result) # <_sre.SRE_Match object; span=(0, 9), match='qwe123456'>

正则表达式的分之和分组 1 | （分之）
条件1 | 条件2 --- 先用条件1区匹配，如果匹配成功，就匹配成功。
如果条件1匹配失败，就用条件2匹配。
注意：如果条件1匹配成功就不会再用条件2再去匹配