返回顶部
首页 > 资讯 > 后端开发 > Python >python通过re正则表达式切割中英文的操作
  • 796
分享到

python通过re正则表达式切割中英文的操作

2024-04-02 19:04:59 796人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

我就废话不多说了,大家还是直接看代码吧~ import re s = 'alibaba阿里巴巴' # 待分割字符串 en_letter = '[\u0041-\u005a|\u

我就废话不多说了,大家还是直接看代码吧~


import re 
s = 'alibaba阿里巴巴' # 待分割字符串
en_letter = '[\u0041-\u005a|\u0061-\u007a]+' # 大小写英文字母
zh_char = '[\u4e00-\u9fa5]+' # 中文字符
 
print(re.findall(zh_char,s) + re.findall(en_letter,s))
 
# 输出: ['阿里巴巴', 'alibaba']
范围 说明
\u4e00-\u9fa5 汉字的unicode范围
\u0030-\u0039 数字的unicode范围
\u0041-\u005a 大写字母unicode范围
\u0061-\u007a 小写字母unicode范围

补充:python--中英文混合字符串的切分(中文按字断开,英文按单词分开,数字按空格等特殊符号断开)

待切分句子:

s = "12、China's Legend Holdings will split its several business arms to Go public on stock markets, the group's president Zhu Linan said on Tuesday.该集团总裁朱利安周二表示,haha中国联想控股将分拆其多个业务部门在股市上市,。"

切分结果:

['12', 'china', 's', 'legend', 'holdings', 'will', 'split', 'its', 'several', 'business', 'arms', 'to', 'go', 'public', 'on', 'stock', 'markets', 'the', 'group', 's', 'president', 'zhu', 'linan', 'said', 'on', 'tuesday', '该', '集', '团', '总', '裁', '朱', '利', '安', '周', '二', '表', '示', 'haha', '中', '国', '联', '想', '控', '股', '将', '分', '拆', '其', '多', '个', '业', '务', '部', '门', '在', '股', '市', '上', '市']

代码:


import re
def get_Word_list(s1):
  # 把句子按字分开,中文按字分,英文按单词,数字按空格
  regEx = re.compile('[\\W]*')  # 我们可以使用正则表达式来切分句子,切分的规则是除单词,数字外的任意字符串
  res = re.compile(r"([\u4e00-\u9fa5])")  # [\u4e00-\u9fa5]中文范围
  p1 = regEx.split(s1.lower())
  str1_list = []
  for str in p1:
    if res.split(str) == None:
      str1_list.append(str)
    else:
      ret = res.split(str)
      for ch in ret:
        str1_list.append(ch)
  list_word1 = [w for w in str1_list if len(w.strip()) > 0] # 去掉为空的字符
  return list_word1
if __name__ == '__main__':
  s = "12、China's Legend Holdings will split its several business arms to go public on stock markets, the group's president Zhu Linan said on Tuesday.该集团总裁朱利安周二表示,haha中国联想控股将分拆其多个业务部门在股市上市。"
  list_word1=get_word_list(s)
  print(list_word1)

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。如有错误或未考虑完全的地方,望不吝赐教。

--结束END--

本文标题: python通过re正则表达式切割中英文的操作

本文链接: https://lsjlt.com/news/121794.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python通过re正则表达式切割中英文的操作
    我就废话不多说了,大家还是直接看代码吧~ import re s = 'alibaba阿里巴巴' # 待分割字符串 en_letter = '[\u0041-\u005a|\u...
    99+
    2024-04-02
  • python如何通过re正则表达式切割中英文
    这篇文章主要介绍python如何通过re正则表达式切割中英文,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!import re s = 'alibaba阿里巴巴'...
    99+
    2023-06-14
  • Python的re模块正则表达式操作
    这个模块提供了与 Perl 相似l的正则表达式匹配操作。Unicode字符串也同样适用。 正则表达式使用反斜杠" "来代表特殊形式或用作转义字符,这里跟Python的语法冲突,因此,Python用" \...
    99+
    2022-06-04
    模块 操作 正则表达式
  • Python中的re正则表达式模块
    一、re模块的基本使用 Python里数量词默认是贪婪的,总是尝试匹配尽可能多的字符。正则表达式是用来匹配处理字符串的。 假如你需要匹配文本中的字符\,Python里的使用原生字符串...
    99+
    2024-04-02
  • python3中的RE(正则表达式)-总
    1.引入正则模块(Regular Expression)     要使用python3中的RE则必须引入 re模块 import re #引入正则表达式 2.主要使用的方法 match(), 从左到右进行匹配 #pattern 为要校...
    99+
    2023-01-31
    正则表达式
  • Python使用re模块实现正则表达式操作指南
    目录一、前言二、匹配字符串1.使用match()方法进行匹配2.使用search()方法进行匹配3.使用findall()方法进行匹配三、替换字符串四、使用正则表达式分割字符串总结&...
    99+
    2024-04-02
  • python的正则表达式和re模块详解
    目录一、正则表达式基础二、python re模块三、进阶总结一、正则表达式基础 二、python re模块 注意:正则表达式 != re eg: 注意:如果返回的是对象,则需要...
    99+
    2024-04-02
  • Python正则表达中re模块的使用
    目录01、正则表达式1.1、限定匹配数量规则1.2、原生字符串1.3、分组匹配1.4、编译函数compile1.5贪婪模式和非贪婪模式01、正则表达式 学习正则表达式操作字符串,re...
    99+
    2024-04-02
  • Oracle如何通过正则表达式分割字符串REGEXP_SUBSTR
    这篇文章主要介绍Oracle如何通过正则表达式分割字符串REGEXP_SUBSTR,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!REGEXP_SUBSTR函数格式如下: functi...
    99+
    2024-04-02
  • python正则表达式(re模块)的使用详解
    目录前言re.match函数匹配单个字符匹配多个字符匹配开头结尾匹配分组re.compile 函数re.search函数re.findall函数re.finditer函数re.sub...
    99+
    2024-04-02
  • python中对正则表达式re包的简单引用方式
    目录对正则表达式re包的简单引用一、re.match(pattern,string,flags=0)二、re.search(pattern,string,flags=0)三、检索和替...
    99+
    2024-04-02
  • PHP中的正则表达式操作指南
    PHP是一种非常流行的服务器端编程语言,其内置了强大的正则表达式操作功能,使得开发人员能够使用正则表达式轻松地对字符串进行处理和匹配。本文将介绍PHP中的正则表达式操作指南,包括如何创建正则表达式、如何使用正则表达式对字符串进行匹配和替换,...
    99+
    2023-05-21
    PHP 正则表达式 操作指南
  • Python中的正则表达式
    正则表达式 是包含文本和特殊字符的字符串, 为高级的文本模式匹配, 抽取, 与文本形式的搜索和替换功能提供了基础 Python通过标准库re模块来支持正则表达式 模式匹配的两种方法完成匹配(模式匹配) 搜索(search())...
    99+
    2023-01-31
    正则表达式 Python
  • Python匹配中文的正则表达式
    正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里...
    99+
    2022-06-04
    中文 正则表达式 Python
  • python中怎么对正则表达式re包进行引用
    这篇文章主要介绍“python中怎么对正则表达式re包进行引用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“python中怎么对正则表达式re包进行引用”文章能帮助大家解决问题。对正则表达式re包的...
    99+
    2023-06-29
  • Python正则表达式中字符串的实际操作方式
    本篇内容介绍了“Python正则表达式中字符串的实际操作方式”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Python正则表达式字符串方法 ...
    99+
    2023-06-17
  • 如何使用.NET正则表达式区分中英文
    这篇文章主要介绍“如何使用.NET正则表达式区分中英文”,在日常操作中,相信很多人在如何使用.NET正则表达式区分中英文问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何使用.NET正则表达式区分中英文”的疑...
    99+
    2023-06-18
  • Redis在PHP应用中的正则表达式操作
    Redis是一个高性能的key-value存储系统,它支持多种数据结构,其中包括字符串、哈希表、列表、集合、有序集合等。同时,Redis也支持对字符串数据进行正则表达式的匹配和替换操作,这使得它在开发PHP应用中具有很大的灵活性和便捷性。在...
    99+
    2023-05-16
    redis PHP应用 正则表达式操作
  • python正则表达中的re库常用方法总结
    元字符 : 预定义字符集: 我进行组合一些复杂的正则表达式的时候是为了快捷去晚上找一些现成的模式,然后再自己进行修改,变成符合自己需要的一些正则表达式。 import ...
    99+
    2024-04-02
  • 编译Python正则表达式的具体操作方法
    这期内容当中小编将会给大家带来有关编译Python正则表达式的具体操作方法,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。现在我们已经看了一些简单的正则表达式,那么我Python正则表达式在实际应用中如何使...
    99+
    2023-06-17
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作