返回顶部
首页 > 资讯 > 后端开发 > Python >【python】re库 正则的一些过滤和
  • 487
分享到

【python】re库 正则的一些过滤和

正则python 2023-01-30 23:01:10 487人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

部分参考:https://www.cnblogs.com/edwardsun/p/4421773.html   match(string[, pos[, endpos]]) | re.match(pattern, string[,

部分参考:https://www.cnblogs.com/edwardsun/p/4421773.html

 

  • match(string[, pos[, endpos]]) | re.match(pattern, string[, flags]):       这个方法将从string的pos下标处起尝试匹配pattern;如果pattern结束时仍可匹配,则返回一个Match对象;如果匹配过程中pattern无法匹配,或者匹配未结束就已到达endpos,则返回None。     pos和endpos的默认值分别为0和len(string);re.match()无法指定这两个参数,参数flags用于编译pattern时指定匹配模式。     注意:这个方法并不是完全匹配。当pattern结束时若string还有剩余字符,仍然视为成功。想要完全匹配,可以在表达式末尾加上边界匹配符'$'。     示例参见2.1小节。
  • search(string[, pos[, endpos]]) | re.search(pattern, string[, flags]):       这个方法用于查找字符串中可以匹配成功的子串。从string的pos下标处起尝试匹配pattern,如果pattern结束时仍可匹配,则返回一个Match对象;若无法匹配,则将pos加1后重新尝试匹配;直到pos=endpos时仍无法匹配则返回None。     pos和endpos的默认值分别为0和len(string));re.search()无法指定这两个参数,参数flags用于编译pattern时指定匹配模式。    
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    # encoding: UTF-8
    import re
     
    # 将正则表达式编译成Pattern对象
    pattern = re.compile(r'world')
     
    # 使用search()查找匹配的子串,不存在能匹配的子串时将返回None
    # 这个例子中使用match()无法成功匹配
    match = pattern.search('hello world!')
     
    if match:
        # 使用Match获得分组信息
        print match.group()
     
    ### 输出 ###
    # world
  • split(string[, maxsplit]) | re.split(pattern, string[, maxsplit]):       按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数,不指定将全部分割。    
    1
    2
    3
    4
    5
    6
    7
    import re
     
    p = re.compile(r'\d+')
    print p.split('one1two2three3four4')
     
    ### output ###
    # ['one', 'two', 'three', 'four', '']
  • findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags]):       搜索string,以列表形式返回全部能匹配的子串。    
    1
    2
    3
    4
    5
    6
    7
    import re
     
    p = re.compile(r'\d+')
    print p.findall('one1two2three3four4')
     
    ### output ###
    # ['1', '2', '3', '4']
  • finditer(string[, pos[, endpos]]) | re.finditer(pattern, string[, flags]):       搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器。    
    1
    2
    3
    4
    5
    6
    7
    8
    import re
     
    p = re.compile(r'\d+')
    for m in p.finditer('one1two2three3four4'):
        print m.group(),
     
    ### output ###
    # 1 2 3 4
  • sub(repl, string[, count]) | re.sub(pattern, repl, string[, count]):       使用repl替换string中每一个匹配的子串后返回替换后的字符串。     当repl是一个字符串时,可以使用\id或\g<id>、\g<name>引用分组,但不能使用编号0。     当repl是一个方法时,这个方法应当只接受一个参数(Match对象),并返回一个字符串用于替换(返回的字符串中不能再引用分组)。     count用于指定最多替换次数,不指定时全部替换。    
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    import re
     
    p = re.compile(r'(\w+) (\w+)')
    s = 'i say, hello world!'
     
    print p.sub(r'\2 \1', s)
     
    def func(m):
        return m.group(1).title() + ' ' + m.group(2).title()
     
    print p.sub(func, s)
     
    ### output ###
    # say i, world hello!
    # I Say, Hello World!
  • subn(repl, string[, count]) |re.sub(pattern, repl, string[, count]):       返回 (sub(repl, string[, count]), 替换次数)。    
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    import re
     
    p = re.compile(r'(\w+) (\w+)')
    s = 'i say, hello world!'
     
    print p.subn(r'\2 \1', s)
     
    def func(m):
        return m.group(1).title() + ' ' + m.group(2).title()
     
    print p.subn(func, s)
     
    ### output ###
    # ('say i, world hello!', 2)
    # ('I Say, Hello World!', 2)

需要对前端传来的

然后传给数据库

原数据:

{"value":"123","isEditing":false,"isActive":false,"isChecked":false},{"value":"2","isEditing":false,"isActive":false,"isChecked":false},{"value":"32","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"123","isEditing":false,"isActive":false,"isChecked":false},{"value":"32","isEditing":false,"isActive":false,"isChecked":false},{"value":"23","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"321","isEditing":false,"isActive":false,"isChecked":false},{"value":"21","isEditing":false,"isActive":false,"isChecked":false}]

过滤:

str = text
def checkFilter(keyWords,text):
    return re.sub('|'.join(keywords),'',str)
keywords = ('\'','"','\[{','\}]','\{')
a = checkFilter(keywords,text)
print (checkFilter(keywords,text))

输出结果:

<class 'str'>
******************
value:123,isEditing:false,isActive:false,isChecked:false},value:2,isEditing:false,isActive:false,isChecked:false},value:32,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:123,isEditing:false,isActive:false,isChecked:false},value:32,isEditing:false,isActive:false,isChecked:false},value:23,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:321,isEditing:false,isActive:false,isChecked:false},value:21,isEditing:false,isActive:false,isChecked:false

 

拆分:

b = a.split('},')
print(b)

输出结果:

******************
['value:123,isEditing:false,isActive:false,isChecked:false', 'value:2,isEditing:false,isActive:false,isChecked:false', 'value:32,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:123,isEditing:false,isActive:false,isChecked:false', 'value:32,isEditing:false,isActive:false,isChecked:false', 'value:23,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:321,isEditing:false,isActive:false,isChecked:false', 'value:21,isEditing:false,isActive:false,isChecked:false']
******************

源码

import re
input = open('I:\\python_test\\JSON_Mysql\\jsondata.txt','r')
text=input.read()
print (text)
print ('******************')
print (type(text))
print ('******************')
str = text
def checkFilter(keywords,text):
    return re.sub('|'.join(keywords),'',str)
keywords = ('\'','"','\[{','\}]','\{')
a = checkFilter(keywords,text)
print (checkFilter(keywords,text))
print ('******************')


b = a.split('},')
print(b)
print ('******************')
print (type(b))
print ('******************')
print (b[0])
print ('******************')
str1 = b[0]
b1 = str1.split(':')

print (b1[0])

输出:

[{"value":"123","isEditing":false,"isActive":false,"isChecked":false},{"value":"2","isEditing":false,"isActive":false,"isChecked":false},{"value":"32","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"123","isEditing":false,"isActive":false,"isChecked":false},{"value":"32","isEditing":false,"isActive":false,"isChecked":false},{"value":"23","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"321","isEditing":false,"isActive":false,"isChecked":false},{"value":"21","isEditing":false,"isActive":false,"isChecked":false}]
******************
<class 'str'>
******************
value:123,isEditing:false,isActive:false,isChecked:false},value:2,isEditing:false,isActive:false,isChecked:false},value:32,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:123,isEditing:false,isActive:false,isChecked:false},value:32,isEditing:false,isActive:false,isChecked:false},value:23,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:321,isEditing:false,isActive:false,isChecked:false},value:21,isEditing:false,isActive:false,isChecked:false
******************
['value:123,isEditing:false,isActive:false,isChecked:false', 'value:2,isEditing:false,isActive:false,isChecked:false', 'value:32,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:123,isEditing:false,isActive:false,isChecked:false', 'value:32,isEditing:false,isActive:false,isChecked:false', 'value:23,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:321,isEditing:false,isActive:false,isChecked:false', 'value:21,isEditing:false,isActive:false,isChecked:false']
******************
<class 'list'>
******************
value:123,isEditing:false,isActive:false,isChecked:false
******************
value

2910.1.14-------------------------------------------------------------------------------------------------------

拼接dict类型 json

----------------------------------------------------------------------------------------------------------------

b = a.split('},')
print(b)
print ('******************')
print (type(b))
print ('******************')
print (b[0])
print (type(b[0]))
print ('******************')
lines_json = b[0].replace(',', '","')#替换字符;;;;;具体b[i] for输出到数据库
lines_json1 = lines_json.replace(':','":"')
lines_json2 = ('{"'+lines_json1+'"}')
print (lines_json2)
print ('******************')
j = json.loads(lines_json2)
print (j)
print (j["value"])
print(type(j))  

 

输出:

******************
<class 'list'>
******************
value:123,isEditing:false,isActive:false,isChecked:false
<class 'str'>
******************
{"value":"123","isEditing":"false","isActive":"false","isChecked":"false"}
******************
{'isActive': 'false', 'value': '123', 'isEditing': 'false', 'isChecked': 'false'}
123
<class 'dict'>

 

 

-------

--结束END--

本文标题: 【python】re库 正则的一些过滤和

本文链接: https://lsjlt.com/news/180789.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 【python】re库 正则的一些过滤和
    部分参考:https://www.cnblogs.com/edwardsun/p/4421773.html   match(string[, pos[, endpos]]) | re.match(pattern, string[, ...
    99+
    2023-01-30
    正则 python
  • python re库-----学习(正则
    #!/usr/bin/env python #-*- coding:UTF-8 -*- ##################################################### # Author: sunfx   xing...
    99+
    2023-01-31
    正则 python
  • python正则-re的用法详解
    Python中的re模块是用来进行正则表达式操作的工具包。re模块提供了很多函数和方法,用于对字符串进行匹配、查找、替换等操作。1. re.match(pattern, string, flags=0)从字符串的起始位置开始匹配patt...
    99+
    2023-08-11
    Python
  • python的正则表达式和re模块详解
    目录一、正则表达式基础二、python re模块三、进阶总结一、正则表达式基础 二、python re模块 注意:正则表达式 != re eg: 注意:如果返回的是对象,则需要...
    99+
    2024-04-02
  • python正则表达中的re库常用方法总结
    元字符 : 预定义字符集: 我进行组合一些复杂的正则表达式的时候是为了快捷去晚上找一些现成的模式,然后再自己进行修改,变成符合自己需要的一些正则表达式。 import ...
    99+
    2024-04-02
  • Python标准库re的使用举例(正则化匹配)
    目录常用正则表达式一,必备知识1.修饰符(flag)2.匹配模式3. r的作用4. 贪婪与非贪婪—通配符后面加?5.转义匹配的使用6. group(num = 0)和gr...
    99+
    2024-04-02
  • Python中的re正则表达式模块
    一、re模块的基本使用 Python里数量词默认是贪婪的,总是尝试匹配尽可能多的字符。正则表达式是用来匹配处理字符串的。 假如你需要匹配文本中的字符\,Python里的使用原生字符串...
    99+
    2024-04-02
  • python通过re正则表达式切割中英文的操作
    我就废话不多说了,大家还是直接看代码吧~ import re s = 'alibaba阿里巴巴' # 待分割字符串 en_letter = '[\u0041-\u005a|\u...
    99+
    2024-04-02
  • python如何通过re正则表达式切割中英文
    这篇文章主要介绍python如何通过re正则表达式切割中英文,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!import re s = 'alibaba阿里巴巴'...
    99+
    2023-06-14
  • Python的re模块正则表达式操作
    这个模块提供了与 Perl 相似l的正则表达式匹配操作。Unicode字符串也同样适用。 正则表达式使用反斜杠" "来代表特殊形式或用作转义字符,这里跟Python的语法冲突,因此,Python用" \...
    99+
    2022-06-04
    模块 操作 正则表达式
  • Python正则表达中re模块的使用
    目录01、正则表达式1.1、限定匹配数量规则1.2、原生字符串1.3、分组匹配1.4、编译函数compile1.5贪婪模式和非贪婪模式01、正则表达式 学习正则表达式操作字符串,re...
    99+
    2024-04-02
  • python正则表达式(re模块)的使用详解
    目录前言re.match函数匹配单个字符匹配多个字符匹配开头结尾匹配分组re.compile 函数re.search函数re.findall函数re.finditer函数re.sub...
    99+
    2024-04-02
  • Python正则获取、过滤或者替换HTML标签的方法
    本文实例介绍了Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法,具体内容如下 python正则表达式关键内容: python正则表达式转义符: . 匹配除换行符以外的任意字符...
    99+
    2022-06-04
    正则 标签 方法
  • python正则一些简单匹配
    元字符的使用re.findall(regex,string)功能:在string字符串中,匹配regex正则表达式能够匹配的项,放到一个列表中返回* 普通字符串 元字符 :abc  匹配规则 : 匹配字符串的值匹配示例 :abc In [3...
    99+
    2023-01-31
    正则 简单 python
  • 怎么理解并掌握python正则表达式和re模块
    这篇文章主要介绍“怎么理解并掌握python正则表达式和re模块”,在日常操作中,相信很多人在怎么理解并掌握python正则表达式和re模块问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么理解并掌握pyth...
    99+
    2023-06-01
  • re正则表达式库的简介、入门、使用方法
      re正则表达式库的简介  正则表达式在很多语言里都支持,python也不例外,re模块就是正则表达式的应用 正则表达式对字符串的逻辑操作,主要是对字符串的一种过滤,用“元字符” 与“普通字符”组成一个字符串规则对已知的字符串或文本过滤出...
    99+
    2023-06-02
  • python学习(六)--正则的一些例子
    import re#正则表达式#compile函数,--将正则表达式转变为内部函数,提高执行效率strr = "python123456"pattern = "Python"res = re.compile(pattern)#当忽略匹配大小...
    99+
    2023-01-31
    正则 例子 python
  • JAVA正则表达式过滤文件的实现方法
    JAVA正则表达式过滤文件的实现方法  正则表达式过滤文件列表,听起来简单,如果用java实现,还真需要一番周折,本文简析2种方式 1、适用于路径确定,文件名时正则表达式的情况(jdk6的写法)String filePa...
    99+
    2023-05-31
    java 正则 ava
  • python中对正则表达式re包的简单引用方式
    目录对正则表达式re包的简单引用一、re.match(pattern,string,flags=0)二、re.search(pattern,string,flags=0)三、检索和替...
    99+
    2024-04-02
  • 关于java正则?:、?=、?!的一些理解
    官方文档如图:上图是官方文档的介绍,总结一下讲了两个知识点:(学习视频推荐:java视频教程)是否获取匹配并保存匹配的值;正向预查和反向预查。一、解释是否获取匹配并保存匹配的值()表示捕获分组,获取匹配,()把每个分组里的匹配的值保存起来;...
    99+
    2017-09-20
    java入门 java 正则 理解 ?: ?= ?!
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作