首页 > 资讯 > 后端开发 > Python >Python3中的re.findall()方法及re.compile()

440

分享到

Python3中的re.findall()方法及re.compile()

2024-04-02 19:04:59 440人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录re.findall()方法及re.compile()1.例子2.re.compile()方法3.在使用findall()方法时的“坑”正则表达式find

re.findall()方法及re.compile()

re.findall()在字符串中找到正则表达式所匹配的所有子串，并返回一个列表；如果没有找到匹配的，则返回空列表。

返回结果是列表类型，需要遍历一下才能依次获取每组内容。

findall(patern, string, flags=0)

pattern : 正则中的模式字符串。
string : 要被查找替换的原始字符串。
flags : 标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

1.例子

import re 
content = 'Hello 123456789 Word_This is just a test 666 Test'
results = re.findall('\d+', content)    
 
print(results)
for result in results:
    print(result)

结果：

['123456789', '666']
123456789
666

Process finished with exit code 0

注意利用re.findall()函数没有group()和groups()，因为其返回结果是一个列表。

2.re.compile()方法

re.compile()方法可以将正则字符串编译成正则表达式对象，以便在后面的匹配中复用。

re.compile(pattern[, flags])

re.compile()中可以传入忽略换行等匹配模式，这样在search()、findall()方法中就不需要额外传入了。

因此，re.findall()方法有2种表达方式：

import re
 
content = 'one1two22three333four4444'
pattern = re.compile(r'\d+')
print('===方法1：===')
result1 = re.findall(pattern, content)
print(result1)
 
print('===方法2===')
result2 = pattern.findall(content)
print(result2)

结果：

===方法1：===
['1', '22', '333', '4444']
===方法2===
['1', '22', '333', '4444']

Process finished with exit code 0

3.在使用findall()方法时的“坑”

注意正则表达式中括号()的使用

（1）正则表达式中当没有括号时，正常匹配：

import re 
 
str1 = '2345  3456  4567  5678  6789'
pattern_1 = re.compile('\w+\s+\w+') # \w 表示匹配包括下划线的任何单词字符，等价于[A-Za-z0-9_]
print(pattern_1.findall(str1))

结果：

['2345 3456', '4567 5678']

Process finished with exit code 0

（2）正则表达式中有一个括号时，其输出的内容就是括号匹配到的内容，而不是整个表达式所匹配到的结果：

import re
 
str1 = '2345  3456  4567  5678  6789'
pattern_1 = re.compile('(\w+)\s+\w+') # \w 表示匹配包括下划线的任何单词字符，等价于[A-Za-z0-9_]
print(pattern_1.findall(str1))

结果：

['2345', '4567']

Process finished with exit code 0

整个正则表达式执行了，只不过只输出括号匹配到的内容，即输出的是第一个 (\w+) 匹配到的内容：

在第一次匹配时跟上述没有括号时一样，匹配到"2345 3456"，只不过只输出(/w+)匹配到的结果即"2345"；

第二次匹配同理，从"4567" 开始，匹配到"4567 5678"，但是还是只是输出(/w+)匹配到的结果即"4567"。

（3）当正则表达式中有两个括号时，其输出是一个list 中包含2个 tuple：

import re
 
str1 = '2345  3456  4567  5678  6789'
pattern_1 = re.compile('((\w+)\s+\w+)') # \w 表示匹配包括下划线的任何单词字符，等价于[A-Za-z0-9_]
print(pattern_1.findall(str1))

结果：

[('2345 3456', '2345'), ('4567 5678', '4567')]

Process finished with exit code 0

从输出的结果可以看出，结果中包含两个元组，每一个元组中有两个字符串。

第一个元组是第一次匹配的结果，其中的第一个字符串 "2345 3456" 是正则表达式最外面的括号

((\w+)\s+\w+)

匹配输出的结果；

第一个元组中的第二个字符串 "2345"是正则表达式里面括号

(\w+)

匹配输出的结果；

第二个元组是第二次匹配的结果，匹配原理与第一次匹配相同。

正则表达式findall函数问题

在写正则表达式的时候总会遇到不少的问题，特别是在表达式有多个元组的时候。下面看下re模块下的findall()函数和多个表达式元组相遇的时候会出现什么样的坑。

代码如下：

import re
str="a b c d"
regex0=re.compile("((\w )\s \w )")
print(regex0.findall(str))
regex1=re.compile("(\w )\s \w ")
print(regex1.findall(str))
regex2=re.compile("\w \s \w ")
print(regex2.findall(str))

结果：

[('a b', 'a'), ('c d', 'c')]
['a', 'c']
['a b', 'c d']

可能结果有点意外，下面解释一下

第一个正则表达式中是带有2个括号的，我们可以看到其输出是一个list 中包含2个 tuple
第二个正则表达式中带有1个括号，其输出的内容就是括号匹配到的内容，而不是整个表达式所匹配到的结果。
第三个正则表达式中不带有括号,其输出的内容就是整个表达式所匹配到的内容。

结论：findall()返回的是括号所匹配到的结果（如regex1），多个括号就会返回多个括号分别匹配到的结果（如regex），如果没有括号就返回就返回整条语句所匹配到的结果(如regex2)。所以在提取数据的时候就需要注意这个坑。

实际上是由其并不是python特有的，这是正则所特有的，任何一门高级语言使用正则都满足这个特点：有括号时只能匹配到括号中的内容，没有括号【相当于在最外层增加了一个括号】。在正则里面 “（）” 代表的是分组的意思，一个括号代表一个分组，你只能匹配到"()"中的内容

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。

您可能感兴趣的文档:

--结束END--

本文标题: Python3中的re.findall()方法及re.compile()

本文链接: https://lsjlt.com/news/118026.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python3中的re.findall()方法及re.compile()

目录

re.findall()方法及re.compile()

1.例子

2.re.compile()方法

3.在使用findall()方法时的“坑”

正则表达式findall函数问题

Python3中的re.findall()方法及re.compile()

Python3中的re.findall()及re.compile()方法怎么用

Python3中字符串的常用操作方法及查找方法

Python3中pip3的安装方法

python3的构造方法

python3的实例方法

Deepin 20.2中安装Python3和python3-pip的方法是什么

Mac版Python3安装及升级的方法是什么

Centos7安装Python3的方法

python3安装pyhanlp的方法

Centos安装python3与scapy模块的问题及解决方法

python3中dict（字典）的使用方法示例

python3中dict.keys().sort()用不了的解决方法

Python3内置模块中base64的解码方法

Python3的re.search方法怎么用

centos下安装python3的方法

Python3中goto 语句的使用及原

pandas.concat方法怎么在Python3中使用

CentOS7环境搭建python3以及与python2实现共存的方法

Python3中str、bytes、bytearray转化的方法是什么

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义