首页 > 资讯 > 后端开发 > Python >Python正则表达式re.compile()和re.findall()怎么使用

908

分享到

Python正则表达式re.compile()和re.findall()怎么使用

2023-07-02 15:07:26 908人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要介绍了python正则表达式re.compile()和re.findall()怎么使用的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇Python正则表达式re.compile()和re.findal

这篇文章主要介绍了python正则表达式re.compile()和re.findall()怎么使用的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇Python正则表达式re.compile()和re.findall()怎么使用文章都会有所收获，下面我们一起来看看吧。

前言

在使用爬虫提取网页中的部分信息时，采用到了re.compile()与re.findall()两种方法，目的：把网页中的“某某城市土地规划表”截取并打印出来.

网页中的代码：

 <span class='tab-details'>某某城市土地规划表</span>

提取的方法：

def parse_response(html):    pattern = re.compile('class=\'tab-details\'>(.*?)</span>',re.S)    items = re.findall(pattern,html)      print(items)        return items

结果：

['某某城市土地规划表']

这里主要讲解pattern，re.compile()与re.findall()的定义及用法：

pattern ：pattern 属性规定用于验证输入字段的正则表达式。

re.compile()：compile() 方法用于在脚本执行过程中编译正则表达式，也可用于改变和重新编译正则表达式。

举例：在字符串中全局搜索 "man"，并用 "person" 替换。然后通过 compile() 方法，改变正则表达式，用 "person" 替换 "man" 或 "woman"，：

<script type="text/javascript">var str="Every man in the world! Every woman on earth!"; patt=/man/g;str2=str.replace(patt,"person");//用person取代mandocument.write(str2+"<br />"); patt=/(wo)?man/g;patt.compile(patt);str2=str.replace(patt,"person");//用person取代man或者womandocument.write(str2); </script>

输出：（可见第一行中的man都被person取代，出现了woperson,第二行的的man和woman也被person取代，只有person，没有其他奇奇怪怪的字符串）

Every person in the world! Every woperson on earth!
Every person in the world! Every person on earth!

re.findall()：额，这个最难搞，主要是为了讲解（.*？)

re.findall()函数是返回某种形式(比如String)中所有与pattern匹配的全部字符串,返回形式为数组。

下面是findall()函数的两种表示形式:(上面的代码采取的便是第二种形式）：

import rekk = re.compile(r'\d+')kk.findall('one1two2three3four4')#[1,2,3,4] #注意此处findall()的用法，可传两个参数;kk = re.compile(r'\d+')re.findall(kk,"one123")#[1,2,3]

下面的是常用的正则表达式：

import re str = 'aabbabaabbaa' # 一个"."就是匹配除 \n (换行符)以外的任意一个字符print(re.findall(r'a.b',str))#['aab', 'aab'] # *前面的字符出现0次或以上print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b'] # 贪婪，匹配从.*前面为开始到后面为结束的所有内容print(re.findall(r'a.*b',str))#['aabbabaabb'] # 非贪婪，遇到开始和结束就进行截取，因此截取多次符合的结果，中间没有字符也会被截取print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab'] # 非贪婪，与上面一样，只是与上面的相比多了一个括号，只保留括号的内容print(re.findall(r'a(.*?)b',str))#['a', '', 'a'] str = '''aabbab         aabbaa         bb'''     #后面多加了2个b # 没有把最后一个换行的aab算进来print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab'] # re.S不会对\n进行中断print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n         b']

注意'.*?'是对它的前后部分作为开始结束部分进行截取，而'(.*?)'也是把其前后作为开始结束，但是只截取括号部分，不包含开始结束部分！！！（同时在对前后部分的选择时要注意特征明确点，就是与众不同的的嘛，防止截取出的是其他部分啊）

re.findall中参数re.S的意义：

字符串变为（后面多加了2个b）

str = '''aabbab         aabbaa         bb'''

参数无re.S，没有把最后一个换行的aab算进来

print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']

参数有re.S，不会对\n进行中断

print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n         b']

在我们一开始的代码中就有re.s,因为在爬取网页的内容时是按照一个一个块的来爬取，可以理解为并列部分，会存在/n分行符。

def parse_response(html):    pattern = re.compile('class=\'tab-details\'>(.*?)</span>',re.S)    items = re.findall(pattern,html)      print(items)        return items

关于“Python正则表达式re.compile()和re.findall()怎么使用”这篇文章的内容就介绍到这里，感谢各位的阅读！相信大家对“Python正则表达式re.compile()和re.findall()怎么使用”知识都有一定的了解，大家如果还想学习更多知识，欢迎关注编程网Python频道。

您可能感兴趣的文档:

--结束END--

本文标题: Python正则表达式re.compile()和re.findall()怎么使用

本文链接: https://lsjlt.com/news/342882.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python正则表达式re.compile()和re.findall()怎么使用

前言

网页中的代码：

提取的方法：

re.findall中参数re.S的意义：

Python正则表达式re.compile()和re.findall()怎么使用

Python正则表达式re.compile()和re.findall()详解

如何使用python正则表达式模块中的re.findall()函数

在python正则表达式中是怎样正确使用正则表达式

Python中怎么使用正则表达式及正则表达式匹配规则是什么

python 正则表达式的使用

Python的RegEx正则表达式怎么使用

python中的正则表达式怎么使用

Python中使用正则表达式及正则表达式匹配规则详解

python的正则表达式怎么用

怎么使用javascript正则表达式

js 怎么使用正则表达式

pcre正则表达式怎么使用

C++怎么使用正则表达式

Ruby正则表达式怎么使用

python 正则表达式

python正则表达式

python 中正则表达式的使用

python正则表达式re模块怎么使用

Python中的正则表达式怎么用

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义