返回顶部
首页 > 资讯 > 后端开发 > Python >Python知识点详解之正则表达式语法
  • 643
分享到

Python知识点详解之正则表达式语法

2024-04-02 19:04:59 643人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

目录python 正则表达式是什么怎么用正则表达式语法re 库基本用法re.search 函数re.match 函数re.findall 函数re.split 函数re.findit

Python 正则表达式是什么

学习 Python 正则表达式离不开 re 模块,所以本篇博客会配合 re 模块进行编写。

re 库是 Python 中处理正则表达式的标准库,本篇博客介绍 re 库的同时,会简单介绍一下正则表达式语法, 如果想深入学习正则表达式,还需要好好下一番功夫。

怎么用

正则表达式语法

正则表达式语法由字符和操作符构成,初期阶段掌握下述这些内容即可。

操作符说明例子
.任何单个字符,极少不能匹配 
[]字符集,对单个字符给出取值范围[abc] 表示匹配 a、b、c,[a-z] 表示 a 到 z 单个字符
[^]非字符集,对单个字符给出排除范围[^abc] 表示匹配 非 a、非 b、非 c 的单个字符
*前一个字符 0 次或无限次扩展abc* 表示 ab、abc、abcc、abccc 等
+前一个字符 1 次或无限次扩展abc+ 表示 abc、abcc、abccc 等
?前一个字符 0 次或 1 次abc? 表示 ab、abc
|左右表达式任意一个abc|def 表示 abc 或者 def
{m}扩展前 1 个字符 m 次ab{2}c,表示 abbc
{m,n}扩展前 1 个字符 m 到 n 次ab{1,2}c,表示 abc、abbc
^匹配字符串开头^abc 表示 abc 在字符串开头
$匹配字符串结尾abc$ 表示 abc 在字符串结尾
()分组标记,内部仅能使用 | 操作符(abc) 表示 abc,(a
\d数字,等价于 [0-9] 
\w字符,等价于 [A-Za-z0-9] 

以上表示仅仅为正则表达最基础部分内容,如果希望深入研究正则表达式,建议寻找更加全面的资料进行学习,本文只做药引。

re 库基本用法

re 库主要函数如下:

  • 基础函数:compile;
  • 功能函数:search、match、findall、split、finditer、sub。

在正式学习之前,先了解一下原生字符串。

在 Python 中,表示原生字符串,需要在字符串前面加上 r。 例如 my_str = 'i'am xiangpica' 在程序中会直接报错, 如果希望字符串中 ' 可以正常运行,需要加上转移字符 \,修改为 my_str = 'i\'am xiangpica'。 但这样结合上文正则表达式中的操作符,就会出现问题,因为 \ 在正则表达式中是有真实含义的, 如果你使用 re 库去匹配字符串中的 \,那需要使用 4 个反斜杠,为了避免这种情况出现,引入了原生字符串概念。

# 不使用原生字符串的正则表达式  "\\\\"
# 使用原生字符串的正则表达式 r"\\"

在后文会有实际的应用。

接下来在学习一个案例,例如下述代码:

my_str='C:\number'

print(my_str)
C:
umber

本段代码的输出效果如下,\n 被解析成了换行,如果想要屏蔽这种现象,使用 r 即可:

my_str=r'C:\number'

print(my_str)

输出 C:\number。

re.search 函数

该函数用于,在字符串中搜索正则表达式匹配到的第一个位置的值,返回 match 对象。 函数原型如下:

re.search(pattern,string,flags=0)

需求:在字符串 梦想橡皮擦 Good good 中匹配 橡皮擦。

import re
my_str='梦想橡皮擦 good good'
pattern = r'橡皮擦'

ret = re.search(pattern,my_str)
print(ret)

返回结果:<re.Match object; span=(2, 5), match='橡皮擦'>。

search 函数的第三个参数 flags 表示正则表达式使用时的控制标记。

  • re.I,re.IGNORECASE:忽略正则表达式的大小写;
  • re.M,re.MULTILINE:正则表达式中的 ^ 操作符能够将给定字符串的每行当做匹配的开始;
  • re.S,re.DOTALL:正则表达式中的 . 操作符能够匹配所有字符。

最后将匹配到的字符串进行输出,使用下述代码即可实现。

import re
my_str = '梦想橡皮擦 good good'
pattern = r'橡皮擦'

ret = re.search(pattern, my_str)
if ret:
    print(ret.group(0))

re.match 函数

该函数用于在目标字符串开始位置去匹配正则表达式,返回 match 对象,未匹配成功返回 None,函数原型如下:

re.match(pattern,string,flags=0)

一定要注意是目标字符串开始位置。

import re
my_str = '梦想橡皮擦 good good'
pattern = r'梦' # 匹配到数据
pattern = r'good' # 匹配不到数据

ret = re.match(pattern, my_str)
if ret:
    print(ret.group(0))

re.match 和 re.search 方法都是一次最多返回一个匹配对象,如果希望返回多个值, 可以通过在 pattern 里加括号构造匹配组返回多个字符串。

re.findall 函数

该函数用于搜索字符串,以列表格式返回全部匹配到的字符串,函数原型如下:

re.findall(pattern,string,flags=0)

测试代码如下:

import re
my_str = '梦想橡皮擦 good good'
pattern = r'good'
ret = re.findall(pattern, my_str)
print(ret)

re.split 函数

该函数将一个字符串按照正则表达式匹配结果进行分割,返回一个列表。 函数原型如下:

re.split(pattern, string, maxsplit=0, flags=0)

re.split 函数进行分割的时候,如果正则表达式匹配到的字符恰好在字符串开头或者结尾, 返回分割后的字符串列表首尾都多了空格,需要手动去除,例如下述代码:

import re
my_str = '1梦想橡皮擦1good1good1'

pattern = r'\d'

ret = re.split(pattern, my_str)

print(ret)

运行结果:

['', '梦想橡皮擦', 'good', 'good', '']

切换为中间的内容,则能正确的分割字符串。

import re
my_str = '1梦想橡皮擦1good1good1'

pattern = r'good'

ret = re.split(pattern, my_str)

print(ret)

如果在 pattern 中捕获到括号,那括号中匹配到的结果也会在返回的列表中。

import re
my_str = '1梦想橡皮擦1good1good1'

pattern = r'(good)'

ret = re.split(pattern, my_str)

print(ret)

运行结果,你可以对比带括号和不带括号的区别进行学习:

['1梦想橡皮擦1', 'good', '1', 'good', '1']

maxsplit 参数表示最多进行分割次数, 剩下的字符全部返回到列表的最后一个元素, 例如设置匹配 1 次,得到的结果是 ['1梦想橡皮擦1', '1good1']。

re.finditer 函数

搜索字符串,并返回一个匹配结果的迭代器,每个迭代元素都是 match 对象。 函数原型如下:

re.finditer(pattern,string,flags=0)

测试代码如下:

import re
my_str = '1梦想橡皮擦1good1good1'

pattern = r'good'

# ret = re.split(pattern, my_str,maxsplit=1)
ret =re.finditer(pattern, my_str)
print(ret)

re.sub 函数

在一个字符串中替换被正则表达式匹配到的字符串,返回替换后的字符串, 函数原型如下:

re.sub(pattern,repl,string,count=0,flags=0)

其中 repl 参数是替换匹配字符串的字符串,count 参数是匹配的最大替换次数。

import re
my_str = '1梦想橡皮擦1good1good1'

pattern = r'good'

ret = re.sub(pattern, "nice", my_str)
print(ret)

运行之后,得到替换之后的字符串:

1梦想橡皮擦1nice1nice1

re 库其它函数

其它比较常见的函数有:re.fullmatch(),re.subn(),re.escape(), 更多内容可以查阅 官方文档,获取一手资料。

扩展知识

使用 re 库匹配字符串之后,会返回 match 对象,该对象具备以下属性和方法。

你可以顺着这条线继续学习下去。

总结

到此这篇关于Python知识点详解之正则表达式语法的文章就介绍到这了,更多相关Python正则表达式语法内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python知识点详解之正则表达式语法

本文链接: https://lsjlt.com/news/118454.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python知识点详解之正则表达式语法
    目录Python 正则表达式是什么怎么用正则表达式语法re 库基本用法re.search 函数re.match 函数re.findall 函数re.split 函数re.findit...
    99+
    2024-04-02
  • Pyhton爬虫知识之正则表达式详解
    目录前言1、正则表达式基础2、正则表达式的基本符号2.1 点号 “.”2.2 星号 “*”2.3 问号 “”2...
    99+
    2024-04-02
  • python正则表达式常见的知识点汇总
    目录一、介绍二、查找方法的使用1、match方法(只匹配字符串开头)2、search方法(扫描整个字符串,找到第一个匹配)3、re.match与re.search的区别4、finda...
    99+
    2024-04-02
  • Python 正则表达式基础知识点及实例
    1. 什么是正则表达式 正则表达式(Regular Expressions),也称为 “regex” 或 “regexp” 是使用单个字符串来描述、匹配一系列匹配某个句法规则的字符...
    99+
    2024-04-02
  • Python中正则表达式的知识点有哪些
    这篇文章主要介绍了Python中正则表达式的知识点有哪些的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python中正则表达式的知识点有哪些文章都会有所收获,下面我们一起来看看吧。1.1正则表达式正则表达式(R...
    99+
    2023-06-30
  • python正则表达式常见的知识点有哪些
    本篇内容主要讲解“python正则表达式常见的知识点有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python正则表达式常见的知识点有哪些”吧!一、介绍正则表达式是一个特殊的字符序列,计算...
    99+
    2023-06-30
  • Python语法学习之正则表达式的使用详解
    目录正则表达式中的特殊字符正则表达式的使用正则小案例 - 1正则小案例 - 2正则小案例 - 3要想成功的进行字符串的匹配需要使用到正则表达式模块,正则表达式匹配规则以及需要被匹配的...
    99+
    2024-04-02
  • javascript正则表达式的知识点有哪些
    本篇内容介绍了“javascript正则表达式的知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!...
    99+
    2024-04-02
  • 正则表达式入门知识点有哪些
    这篇文章主要为大家展示了“正则表达式入门知识点有哪些”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“正则表达式入门知识点有哪些”这篇文章吧。1.正则表达式入门之什么是正则表达式基本说来,正则表达式...
    99+
    2023-06-17
  • java正则表达式的知识点有哪些
    这篇文章主要介绍“java正则表达式的知识点有哪些”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“java正则表达式的知识点有哪些”文章能帮助大家解决问题。字符x字符 x\\反斜线字符\0n...
    99+
    2023-06-29
  • C#正则表达式的知识点有哪些
    这篇“C#正则表达式的知识点有哪些”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“C#正则表达式的知识点有哪些”文章吧。一、简...
    99+
    2023-06-30
  • 正则表达式基础知识点有哪些
    这篇“正则表达式基础知识点有哪些”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“正则表达式基础知识点有哪些”文章吧。正则表达式...
    99+
    2023-07-05
  • Python 正则表达式详解
    目录1.正则表达式是什么2.1用正则表达式2.2匹配原理2.3常用函数总结1.正则表达式是什么 很简单就是一种字符串匹配,eg: 比如你在注册账户时我们需要对用户的用户名判断是否合法...
    99+
    2024-04-02
  • 正则表达式基本语法详解
    正则表达式是一种描述字符串模式的方法,可以用来匹配、查找和替换字符串。它是一种强大而灵活的工具,在文本处理和模式匹配中广泛应用。正则...
    99+
    2023-08-15
    正则表达式
  • 完整的正则表达式知识汇总(Python知
    ## 大纲: ## 一、正则概述 1.正则是什么 正则就是一套规则,或者语法 2.正则的作用 让我们判断是否符合我们的的规则,或者根据规则找到符合规则的数据 3.使用场景 可以用正则判断我们输入的邮箱是否合法 可以用正则去获取...
    99+
    2023-01-30
    完整 知识 正则表达式
  • Java 之正则表达式语法及常用正则表达式汇总
    正则表达式概念: 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为 regex、regexp 或 RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 正则表...
    99+
    2023-08-18
    正则表达式 java 开发语言
  • python模块之re正则表达式详解
    一、简单介绍 正则表达式是一种小型的、高度专业化的编程语言,并不是python中特有的,是许多编程语言中基础而又重要的一部分。在python中,主要通过re模块来实现。 正则表达式模式被编译成一系列的字节码...
    99+
    2022-06-04
    详解 模块 正则表达式
  • Python正则表达式re.search()用法详解
    re.search():匹配整个字符串,并返回第一个成功的匹配。如果匹配失败,则返回None  pattern: 匹配的规则, string : 要匹配的内容, flag...
    99+
    2024-04-02
  • Python正则表达式re.sub()用法详解
    目录1.匹配单个数字或字母2.匹配多个数字或字母3.匹配其他总结 源代码、参数及其意义: def sub(pattern, repl, string, count=0, f...
    99+
    2024-04-02
  • Python正则表达式基础知识有哪些
    本篇内容主要讲解“Python正则表达式基础知识有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python正则表达式基础知识有哪些”吧!1. 什么是正则表达式正则表达式(Regular E...
    99+
    2023-06-21
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作