返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >正则表达式量词与贪婪的使用详解
  • 813
分享到

正则表达式量词与贪婪的使用详解

2024-04-02 19:04:59 813人浏览 薄情痞子
摘要

目录0.写在前面1.量词2.贪婪模式前传2.1 使用 a+ 进行匹配2.2 使用 a* 进行匹配3.贪婪模式4.非贪婪模式5.独占模式5.1 贪婪匹配过程5.2 非贪婪匹配过程5.3

0.写在前面

在上一篇文章中,我们学习了正则的一些基础元字符,相信大家都已经忘却的差不多了,可以点击上面的链接再温习下。

今天我们一起来学习下正则中量词的三种匹配模式,贪婪模式、非贪婪模式、独占模式,这些模式会改变正则中量词的匹配行为,是每次贪婪的匹配到更多呢,还是不贪婪见好就收呢,如果不了解这些,我们写出的正则很可能是错误的,甚至会引发严重的线上性能问题。

1.量词

本篇文章所讲的内容和量词关系比较密切,先回顾下:

量词

我们还可以用 {m,n} 的方式来表示 * + ? 这3种元字符:

元字符 同义表示方法 示例
* {0,} ab*
可以匹配
a 或者 abb
+ {1,} ab+
可以匹配
ab 或者 abb
但不能匹配 a
? {0,1} ab?
可以匹配 a 或者 ab
但不能匹配 abb

2.贪婪模式前传

在正则中,表示次数的量词默认是贪婪的,在贪婪模式下,会尽可能最大长度的去匹配目标字符串,我们用正则 a+a* 来匹配字符串 aaabb 测试一下。

2.1 使用 a+ 进行匹配

可以看到只匹配到了1个结果 aaa

a+匹配

对应的 python 代码如下:


import re

print(re.findall(r'a+', 'aaabb'))

输出:['aaa']

2.2 使用 a* 进行匹配

可以看到匹配到了4个结果,其中还有3个是空字符串

a*匹配.jpg

对应的 Python 代码如下:


import re

print(re.findall(r'a*', 'aaabb'))

输出:['aaa', '', '', '']

为什么会匹配到空字符串呢?因为星号(*)代表匹配0到多次,匹配0次就是空字符串,那前面还有个 aaa 呢,为什么 aaa 之间的空字符串没有被匹配到?

这就引入到了我们今天要讲的,贪婪模式与非贪婪模式,从字面上很好理解,贪婪模式就是尽可能多的匹配,非贪婪模式就是尽可能少的匹配。

3.贪婪模式

一起来分析下上面正则 a* 的匹配过程:

字符串 a a a b b 空字符串
下标 0 1 2 3 4 5

匹配 开始 结束 说明 匹配内容
第一次 0 3 到第一个字母b发现不匹配,输出aaa aaa
第二次 3 3 匹配剩下的bb,发现匹配不上,输出空字符串 空字符串
第三次 4 4 匹配剩下的b,发现匹配不上,输出空字符串 空字符串
第四次 5 5 匹配剩下的空字符串,输出空字符串 空字符串

a* 在匹配字符串 aaabb 时,会尽可能多的把前面的 a 都匹配上,直到第一个字母 b 不满足要求为止,匹配上3个 a,后面每次匹配的都是空字符串。

看到这里,相信你已经对贪婪模式有了更深的印象,贪婪模式的特点就是尽可能进行最大长度匹配,就是有多少要多少,下面我们在一起来看下与它完全相反的匹配模式。

4.非贪婪模式

上面讲完了贪婪模式,贪婪模式是尽可能最大长度匹配,非贪婪模式就是尽可能最小长度匹配,在量词的后面加一个问号(?),就成了非贪婪模式,比如 a*?

非贪婪匹配

对应的 Python 代码如下:


import re

// 贪婪匹配
print(re.findall(r'a*', 'aaabb'))

输出:['aaa', '', '', '']

// 非贪婪匹配
print(re.findall(r'a*?', 'aaabb'))

输出:['', 'a', '', 'a', '', 'a', '', '', '']

学完了贪婪模式与非贪婪模式,你可能会问,我什么情况下会用到呢,下面举个栗子感受下:

贪婪匹配例子

非贪婪匹配例子

需求是查找一段字符串中,所有双引号括起来的内容,上面使用贪婪匹配与非贪婪匹配的对比,差别很明显对吧。

5.独占模式

不管是贪婪模式,还是非贪婪模式,匹配过程中都需要发生回溯才能完成想要的功能,但是在有一些场景,我们不需要回溯,匹配不上直接返回失败就可以了,因此正则匹配中还有另外一种模式,独占模式,它和贪婪模式很像,但匹配过程中不会发生回溯,在一些使用场景中性能会更好。

先来讲讲什么是回溯,再举个栗子,有一个正则表达式和目标字符串,我们分别看下在三种匹配模式下都发生了什么:

5.1 贪婪匹配过程

正则表达式:ab{1,3}c

目标字符串:abbc

在匹配时,b{1,3} 会尽可能长的去匹配目标字符串,匹配完 abb 之后,因为要尽可能长的匹配(3个 b),目标字符串中的c就会匹配不上,这个时候会发生向前回溯,吐出当前字符 c,用正则中的 c 去匹配,匹配成功。

贪婪匹配过程


import regex

print(regex.findall(r'ab{1,3}c', 'abbc'))

输出:['abbc']

5.2 非贪婪匹配过程

正则表达式:ab{1,3}?c

目标字符串:abbc

在匹配时,b{1,3} 会尽可能短的去匹配目标字符串,匹配完 ab 之后,会直接用正则 c 去匹配目标字符串剩下的 b,匹配不上,发生向前回溯,重新用正则 b{1,3} 匹配 目标字符串剩下的 b,然后正则 c 匹配 目标字符串剩下的 c,匹配成功。

非贪婪匹配过程


import regex

print(regex.findall(r'ab{1,3}?c', 'abbc'))

输出:['abbc']

5.3 独占匹配过程

在量词后面加上 + 就是独占模式。

正则表达式:ab{1,2}+bc

目标字符串:abbc

在匹配时,b{1,2} 会尽可能长的去匹配目标字符串,匹配完 abb 之后,会用正则 b 匹配目标字符串剩下的 c,匹配不上,不回溯,匹配失败。

独占匹配过程


import regex

print(regex.findall(r'ab{1,2}+bc', 'abbc'))

输出:[]

6.写在最后

最后在总结下上面讲到的内容:

思维导图

到这里,正则表达式的量词与贪婪就讲完了,如果有问题可以给我留言评论,谢谢。

正则表达式在线校验工具https://regex101.com/

到此这篇关于正则表达式量词与贪婪的使用详解的文章就介绍到这了,更多相关正则表达式 量词与贪婪内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 正则表达式量词与贪婪的使用详解

本文链接: https://lsjlt.com/news/131105.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 正则表达式量词与贪婪的使用详解
    目录0.写在前面1.量词2.贪婪模式前传2.1 使用 a+ 进行匹配2.2 使用 a* 进行匹配3.贪婪模式4.非贪婪模式5.独占模式5.1 贪婪匹配过程5.2 非贪婪匹配过程5.3...
    99+
    2024-04-02
  • python中的正则表达式,贪婪匹配与非贪婪匹配方式
    目录正则表达式,贪婪匹配与非贪婪匹配正则表达式前戏. ^ $* + { }字符集[][^]分组 ()与 或 |[^]转义符 \贪婪匹配re模块下的常用方法总结正则表达式,贪婪匹配与...
    99+
    2023-01-31
    python正则表达式 python贪婪匹配 python非贪婪匹配
  • Python正则表达式教程之三:贪婪/非贪婪特性
    之前已经简单介绍了Python正则表达式的基础与捕获,那么在这一篇文章里,我将总结一下正则表达式的贪婪/非贪婪特性。 贪婪 默认情况下,正则表达式将进行贪婪匹配。所谓“贪婪”,其实就是在多种长度的匹配字符...
    99+
    2022-06-04
    贪婪 之三 特性
  • JavaScript正则表达式的贪婪匹配和非贪婪匹配的区别
    这篇文章主要介绍“JavaScript正则表达式的贪婪匹配和非贪婪匹配的区别”,在日常操作中,相信很多人在JavaScript正则表达式的贪婪匹配和非贪婪匹配的区别问题上存在疑惑,小编查阅了各式资料,整理出...
    99+
    2024-04-02
  • 轻松入门正则表达式之非贪婪匹配篇详解
    非贪婪匹配 (.*?) import re a = '456qwe789rty123abc' re=re.findall('456(.*?)789',a) pri...
    99+
    2024-04-02
  • C#正则表达式引擎贪婪特性是什么
    本篇内容主要讲解“C#正则表达式引擎贪婪特性是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“C#正则表达式引擎贪婪特性是什么”吧!C#正则表达式引擎贪婪特性,只要模式允许,它将匹配尽可能多的...
    99+
    2023-06-18
  • JS之正则表达式懒惰性和贪婪性的示例分析
    这篇文章主要为大家展示了“JS之正则表达式懒惰性和贪婪性的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“JS之正则表达式懒惰性和贪婪性的示例分析”这篇文...
    99+
    2024-04-02
  • Python中使用正则表达式及正则表达式匹配规则详解
    目录1 导库2 使用模板3 说明4 示例5 正则表达式匹配规则1 导库 import re 2 使用模板 re_pattern = re.compile(pattern, flags...
    99+
    2023-03-22
    Python正则表达式匹配规则 Python正则表达式
  • C#正则表达式与HashTable详解
    目录1、正则表达匹配规则转义字符限定字符分组()2、C#中正则表达式构建与匹配正则表达式的替换正则表达式拆分HashTable概述及元素添加Hashtable遍历Hashtable元...
    99+
    2024-04-02
  • python正则表达式中匹配次数与贪心问题详解(+ ?*)
    python中正则表达式中的匹配次数问题网上有很多解释,最多的就是*匹配0或者无数次,+匹配1次或无数次,?匹配0次或者1次。可是虽然这个文字描述很简单,但是真正用起来的时候大家有没...
    99+
    2024-04-02
  • jmeter正则表达式提取器的用法与正则详解
    我们再使用jmeter请求接口时,碰到一些业务流程性的接口改怎么办,比如,我一个发布内容的接口需要用到登录接口返回的token加到请求上去才能发布内容,那在jmeter上该是如何实现...
    99+
    2024-04-02
  • MySQL正则表达式REGEXP使用详解
    目录LIKE 和 REGEXP之间的重要差别正则表达式匹配不区分大小写简单的正则表达式测试空白元字符(特殊含义的字符)匹配字符类正则表达式支持的其它语法约定正则表达式断言语法实例总结...
    99+
    2024-04-02
  • 正则表达式用法详解
    正则表达式之基本概念 在我们写页面时,往往需要对表单的数据比如账号、身份证号等进行验证,而最有效的、用的最多的便是使用正则表达式来验证。那什么是正则表达式呢? 正则表达式(Regul...
    99+
    2024-04-02
  • Python3的正则表达式详解
    目录1.简介2.切分字符串3.分组4.贪婪匹配5.编译总结1.简介 # 正则表达式:用来匹配字符串的武器; # 设计思想:用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符...
    99+
    2024-04-02
  • Ruby正则表达式详解
    目录Ruby 正则表达式语法实例正则表达式修饰符正则表达式模式 正则表达式实例字符 字符类 特殊字符类 重复 非贪婪重复 ...
    99+
    2023-05-15
    Ruby 正则表达式 Ruby 正则表达式详解 Ruby 正则表达式实例
  • Python 正则表达式详解
    目录1.正则表达式是什么2.1用正则表达式2.2匹配原理2.3常用函数总结1.正则表达式是什么 很简单就是一种字符串匹配,eg: 比如你在注册账户时我们需要对用户的用户名判断是否合法...
    99+
    2024-04-02
  • JavaScript 正则表达式详解
    目录1. 正则表达式创建2. 使用模式2.1 使用简单模式2.2 使用特殊字符3. 应用3.1 切分字符串3.2 分组3.3 贪婪匹配3.4 正则表达式标志3.5 test() 方法...
    99+
    2024-04-02
  • Java 正则表达式详解
    正则表达式(Regular Expression),又称为正规表达式、规则表达式、常规表示法等,是一种用来匹配、查找和替换字符串的工...
    99+
    2023-08-16
    Java
  • 正则表达式字符组/元字符/量词
    一.正则表达式能干什么   1.从大段的文字中找到符合规则的内容   2.判断某个字符串是否完全符合规则 二.字符组-- [] 写在中括号中的内容,都出现在下面的某一个字符的位置上都是符合规则的    [0-9] 匹配数字   [a-z]...
    99+
    2023-01-31
    字符 量词 正则表达式
  • Shell if中的正则表达式使用详解
    由于工作需要对用户提交的数据进行验证,这是一个简单的日期正则验证实例,有需要了解的同学可参考。 shell中的if语句需要做一个正则判断,查了一下语法记录之。 DATEPATTERN="^[0-9]...
    99+
    2022-06-04
    详解 正则表达式 Shell
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作