返回顶部
首页 > 资讯 > 后端开发 > Python >Python string中删除(过滤)
  • 875
分享到

Python string中删除(过滤)

Pythonstring 2023-01-31 02:01:22 875人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

最近做了一个需求,把公众号的用户信息同步到服务端,发现很多用户的昵称里面都有表情符号(emoji), 一般的处理方式是把Mysql的编码改成 utf8mb4,后来讨论了下,这些表情也没什么用,入库的时候直接删除就好了。 过滤

最近做了一个需求,把公众号的用户信息同步到服务端,发现很多用户的昵称里面都有表情符号(emoji), 一般的处理方式是把Mysql的编码改成 utf8mb4,后来讨论了下,这些表情也没什么用,入库的时候直接删除就好了。

过滤方法

python怎么过滤 emoji表情符号呢? 下面是剔除表情字符串的代码片段 Python2.7 下测试

import re

emoji_pattern = re.compile(
    u"(\ud83D[\ude00-\ude4f])|"  # emoticons
    u"(\ud83c[\udf00-\uffff])|"  # symbols & pictographs (1 of 2)
    u"(\ud83d[\u0000-\uddff])|"  # symbols & pictographs (2 of 2)
    u"(\ud83d[\ude80-\udeff])|"  # transport & map symbols
    u"(\ud83c[\udde0-\uddff])"  # flags (iOS)
    "+", flags=re.UNICODE)

def remove_emoji(text):
    return emoji_pattern.sub(r'', text)

参考 removing-emojis-from-a-string-in-python , 如果正则没有写对 还可以遇到 sre_constants.error: bad character range 之类的错误 。

这里根据 unicode 范围来删除表情符号,通用的和ioS中的,应该不是很全,也没找到非常全的list。后面证实还是有写过滤不掉,最好还是把字段改成utf8mb4。。如果有更全的过滤方法,欢迎分享

修改字符编码

不能完全过滤又要存储,只好修改 带有 emoji 表情字段 的编码设置 (mysql5.6测试)

ALTER TABLE `table_name` MODIFY `nickname` VARCHAR(40) CHARSET utf8mb4 COLLATE utf8mb4_unicode_ci;

因为Mysql 存储 utf8mb4 时候使用 4 个字节,比直接使用utf8占用的空间更多 charset-unicode-utf8mb4,所以请重新考虑下字段的长度 , 否则可能会出现 (1406, "Data too long for column 'nickname' at row 1") 之类的错误。

其他

  • js中怎样删除 emoji 表情符号

--结束END--

本文标题: Python string中删除(过滤)

本文链接: https://lsjlt.com/news/185711.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python string中删除(过滤)
    最近做了一个需求,把公众号的用户信息同步到服务端,发现很多用户的昵称里面都有表情符号(emoji), 一般的处理方式是把MySQL的编码改成 utf8mb4,后来讨论了下,这些表情也没什么用,入库的时候直接删除就好了。 过滤...
    99+
    2023-01-31
    Python string
  • vue3删除过滤器的原因
    目录什么是vue的过滤器why?举例分析需求描述HTML结构和data数据如下使用filter实现使用computed实现使用methods实现总结什么是vue的过滤器 过滤器可以...
    99+
    2024-04-02
  • EntityFrameworkCore实现软删除与查询过滤器
    注意:我使用的是 Entity Framework Core 2.0 (2.0.0-preview2-final)。正式版发布后,功能可能存在变动。 继续探索Entity Frame...
    99+
    2024-04-02
  • 使用jquery怎么过滤被删除的元素
    这篇文章给大家介绍使用jquery怎么过滤被删除的元素,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。jquery是什么jquery是一个简洁而快速的JavaScript库,它具有独特的链式语法和短小清晰的多功能接口、高...
    99+
    2023-06-14
  • python中有哪些过滤器
    python中有哪些过滤器?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、...
    99+
    2023-06-14
  • java过滤器中Filter的ChainFilter过滤链
    在Java过滤器中,FilterChain是一种过滤链,用于按照一定顺序依次调用多个过滤器对请求进行处理。FilterChain接口定义了一个doFilter方法,该方法接受ServletRequest和ServletResponse作...
    99+
    2023-08-11
    java
  • Angular如何实现较为复杂的表格过滤,删除功能
    这篇文章主要介绍了Angular如何实现较为复杂的表格过滤,删除功能,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。具体如下:先来看看运行效果...
    99+
    2024-04-02
  • Redis中过期键怎么删除
    这篇“Redis中过期键怎么删除”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Redis中过期键怎么删除”文章吧。前言Red...
    99+
    2023-06-30
  • 怎么在python中停用词过滤
    这篇文章将为大家详细讲解有关怎么在python中停用词过滤,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。python有哪些常用库python常用的库:1.requesuts;2.scrapy...
    99+
    2023-06-14
  • python过滤 Kubernetes api数据
    Kubernetes endpoints api地址http://ip地址:端口/api/v1/namespaces/default/endpointsservices api地址http://ip地址:端口/api/v1/nam...
    99+
    2023-01-31
    数据 python Kubernetes
  • String中删除空格的方法有哪些
    本篇内容主要讲解“String中删除空格的方法有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“String中删除空格的方法有哪些”吧!在java中从字符串中删除空格的不同方法首先,我们来看一...
    99+
    2023-06-27
  • Python中怎么过滤字符串列表
    今天就跟大家聊聊有关Python中怎么过滤字符串列表,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。使用另一个列表过滤字符串列表本示例说明了如何在不使用任何方法的情况下过滤字符串列表中...
    99+
    2023-06-16
  • Python中如何删除文件
    这篇“Python中如何删除文件”除了程序员外大部分人都不太理解,今天小编为了让大家更加理解“Python中如何删除文件”,给大家总结了以下内容,具有一定借鉴价值,内容详细步骤清晰,细节处理妥当,希望大家通过这篇文章有所收获,下面让我们一起...
    99+
    2023-06-14
  • springboot中使用过滤器,jsoup过滤XSS脚本详解
    目录springboot使用过滤器,jsoup过滤XSS脚本1.把可能包含脚本的参数位置分析一下2.分析实现过程3.代码实现过程使用jsoup防止XSS攻击springboot使用过...
    99+
    2024-04-02
  • python实现过滤敏感词
    简述: 关于敏感词过滤可以看成是一种文本反垃圾算法,例如  题目:敏感词文本文件 filtered_words.txt,当用户输入敏感词语,则用 星号 * 替换,例如当用户输入「北京是个好城市」,则变成「...
    99+
    2022-06-02
    python 敏感词 python 过滤敏感词
  • python调用tcpdump抓包过滤
    之前在linux用python脚本写一个抓包分析小工具,实在不想用什么libpcap、pypcap所以,简单来了个tcpdump加grep搞定。基本思路是分别起tcpdump和grep两个进程,进程直接通过pipe交换数据,简单代码如下:...
    99+
    2023-01-31
    python tcpdump
  • Python过滤不可见字符
    import  re def confir(str):     for i in range(0,32):         str = str.r...
    99+
    2023-01-31
    字符 Python
  • python列表过滤的方法
    在python中,对列表这样的数据结构进行过滤,提取自己需要的元素,组成新的列表,是很常见的操作,这就要自然而然的用到列表过滤了,而常用的过滤当然就是循环后通过if进行,但是这样子,显然就是代码的开支有些大。python中,提供了一个列表...
    99+
    2023-01-31
    方法 列表 python
  • Python实现布隆过滤器
    转载自:http://blog.csdn.net/demon24/article/details/8537665 http://blog.csdn.net/u013402746/article/details/28414901      ...
    99+
    2023-01-31
    过滤器 Python
  • Angular如何实现搜索、过滤、批量删除、添加、表单验证功能
    这篇文章将为大家详细讲解有关Angular如何实现搜索、过滤、批量删除、添加、表单验证功能,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。具体代码如下所示;<!DOC...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作