re.finditer方法和groups() group() groupdict()

  

p='''bottle\r\nbag\r\nbig\napple'''
import re
regex=re.compile(r'\bb(?P<middle>\w)(?P<tail>g)')
mat=regex.finditer(p)
print(mat)
for m in mat:
    print(m.groups()) # 匹配到的所有分组(包括命名分组)
    # print(m.group()) # m.group() == m.group(0) 匹配到的所有内容,与分组无关
    print(m.group(0))
    print(m.group(1))
    print(m.group(2))
    print(m.groupdict())

 

迭代每个匹配到的整体

 

 

 

groups()取所有分组(包括命名分组)为一个元组

groupdict()取所有命名分组为dict

group()按编号取值(包括命名分组)

都是针对<re.Match object; span(0,6),match='bottle'>对象操作

 

import re
p='''bottle\r\nbag\r\nbig\napple'''

regex=re.compile('(b)(\w+)',re.M|re.I)
b=regex.match(p)
print(b)
print(b.groups(),b.group(0),p[b.start():b.end()])
print(b.groupdict())

 

 

 一个快速取值的方法是b.group()或b.group(0)

 

import re
p='''bottle\r\nbag\r\nbig\napple'''

regex=re.compile('(b)(\w+)',re.M|re.I)
b=regex.search(p,1)
print(b.groups())

 

 

 指定起始位置

 

import re
p='''bottle\r\nbag\r\nbig\napple'''

regex=re.compile(r'(b\w+)\r\n(?P<name1>b\w+)\r\n(?P<name2>b\w+)')
b=regex.match(p)
print(b)
print('''b.group()= {}'''.format(b.group(0)))
print(b.groups(),b.group(1),b.group(2),b.group(3))
print(b.groupdict())
print(b.groupdict()['name1'])
print(b.groupdict()['name2'])

 

 

 

import re
p='''bottle\r\nbag\r\nbig\napple'''

regex=re.compile(r'b\w+\r\n(?P<name1>b\w+)\r\n(?P<name2>b\w+)')

b=regex.findall(p)
print(b) # 只匹配到一个,为分组形成的元组
for m in b[0]:
    print(type(m),m)

 

 

 

import re
p='''bottle\r\nbag\r\nbig\napple'''

regex=re.compile(r'(b\w+)\r\n(?P<name1>b\w+)\r\n(?P<name2>b\w+)')

b=regex.findall(p)
print(b) # 只匹配到一个,为分组形成的元组
for m in b[0]:
    print(type(m),m)

 

 

 

import re
p='''bottle\r\nbag\r\nbig\napple'''


regex=re.compile('(?P<head>b\w+)')
b=regex.finditer(p)
print(b)
for m in b: # finditer找到一个匹配,就yield一个re.Match对象
    print(type(m),m,m.group(),m.group('head'),m.groupdict()['head'])

 

 

 

 

 

import re
p='''bottle\r\nbag\r\nbig\napple'''


regex=re.compile('(b)(\w+)')
b=regex.findall(p)
print(b) # 如果匹配中有分组,则元素为元组,忽略命名分组
for m in b:
print(m)

  

 

 

 

import re
s='''os.path([path])  sub-path'''
print(re.split('[^-\w]+',s)) # 将-作为连字符

 

 

posted @ 2020-10-05 13:51  ascertain  阅读(1151)  评论(0编辑  收藏  举报