Python 官方文档:入门教程 => 点击学习
这篇文章主要介绍“python正则表达re模块之findall()函数怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python正则表达re模块之findall()函数怎么使用”文章能帮助大
这篇文章主要介绍“python正则表达re模块之findall()函数怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python正则表达re模块之findall()函数怎么使用”文章能帮助大家解决问题。
它在re.py中有定义:
def findall(pattern, string, flags=0): """Return a list of all non-overlapping matches in the string. If one or more capturing groups are present in the pattern, return a list of groups; this will be a list of tuples if the pattern has more than one group. Empty matches are included in the result.""" return _compile(pattern, flags).findall(string)
返回string中所有与pattern匹配的全部字符串,返回形式为数组。
findall()函数的两种表示形式
import rekk = re.compile(r'\d+')kk.findall('one1two2three3four4')#[1,2,3,4] #注意此处findall()的用法,可传两个参数;kk = re.compile(r'\d+')re.findall(kk,"one123")#[1,2,3]
后面会讲解代码里的各个部分,先列出来~
import re str = 'aabbabaabbaa'# 一个"."就是匹配除 \n (换行符)以外的任意一个字符print(re.findall(r'a.b',str))#['aab', 'aab']# *前面的字符出现0次或以上print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']# 贪婪,匹配从.*前面为开始到后面为结束的所有内容print(re.findall(r'a.*b',str))#['aabbabaabb']# 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']# 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容print(re.findall(r'a(.*?)b',str))#['a', '', 'a'] str = '''aabbab aabbaa bb''' #后面多加了2个b# 没有把最后一个换行的aab算进来print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']# re.S不会对\n进行中断print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n b']
字符串是
str = 'aabbabaabbaa'
符号 . 就 是匹配除 \n (换行符)以外的任意一个字符
print(re.findall(r'a.b',str))#['aab', 'aab']
符号 * 前面的字符出现0次或以上
print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']
符号.* 贪婪,匹配从.*前面为开始到后面为结束的所有内容
print(re.findall(r'a.*b',str))#['aabbabaabb']
符号.*? 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
符号(.*?) 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容
print(re.findall(r'a(.*?)b',str))#['a', '', 'a']
关于带括号与不带括号的区别
import restring="abcdefg acbdgef abcdgfe cadbgfe"#不带括号regex=re.compile("((\w+)\s+\w+)")print(regex.findall(string))#输出:[('abcdefg acbdgef', 'abcdefg'), ('abcdgfe cadbgfe', 'abcdgfe')]regex1=re.compile("(\w+)\s+\w+")print(regex1.findall(string))#输出:['abcdefg', 'abcdgfe']regex2=re.compile("\w+\s+\w+")print(regex2.findall(string))#输出:['abcdefg acbdgef', 'abcdgfe cadbgfe']
第一个 regex 中带有2个括号,其输出list 中包含2个 tuple
第二个 regex 中带有1个括号,其输出内容是括号匹配到的内容,而不是整个表达式所匹配到的结果。
第三个 regex 中不带括号,其输出的内容就是整个表达式所匹配到的内容。
实际上这并不是python特有的,这是正则所特有的 , 任何一门高级语言使用正则都满足这个特点:有括号时只能匹配到括号中的内容,没有括号【相当于在最外层增加了一个括号】。在正则里面 "()" 代表的是分组的意思,一个括号代表一个分组,你只能匹配到 "()" 中的内容。
字符串变为(后面多加了2个b)
str = '''aabbab aabbaa bb'''
参数无re.S,没有把最后一个换行的aab算进来
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
参数有re.S,不会对\n进行中断
print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n b']
关于“Python正则表达re模块之findall()函数怎么使用”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网Python频道,小编每天都会为大家更新不同的知识点。
--结束END--
本文标题: Python正则表达re模块之findall()函数怎么使用
本文链接: https://lsjlt.com/news/342872.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0