返回顶部
首页 > 资讯 > 后端开发 > Python >8个数据清洗Python代码,复制可用,
  • 358
分享到

8个数据清洗Python代码,复制可用,

代码数据Python 2023-01-30 23:01:45 358人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

最近,大数据工程师Kin Lim Lee在Medium上发表了一篇文章,介绍了8个用于数据清洗的python代码。 数据清洗,是进行数据分析和使用数据训练模型的必经之路,也是最耗费数据科学家/程序员精力的地方。 这些用于数据清洗的代码有两

最近,大数据工程师Kin Lim Lee在Medium上发表了一篇文章,介绍了8个用于数据清洗的python代码。

数据清洗,是进行数据分析和使用数据训练模型的必经之路,也是最耗费数据科学家/程序员精力的地方。

这些用于数据清洗的代码有两个优点:一是由函数编写而成,不用改参数就可以直接使用。二是非常简单,加上注释最长的也不过11行。

在介绍每一段代码时,Lee都给出了用途,也在代码中也给出注释。

大家可以把这篇文章收藏起来,当做工具箱使用。

这些数据清洗代码,一共涵盖8个场景,分别是:

删除多列、更改数据类型、将分类变量转换为数字变量、检查缺失数据、删除列中的字符串、删除列中的空格、用字符串连接两列(带条件)、转换时间戳(从字符串到日期时间格式)

删除多列

在进行数据分析时,并非所有的列都有用,用df.drop可以方便地删除你指定的列。

转换数据类型

当数据集变大时,需要转换数据类型来节省内存。

将分类变量转换为数值变量

一些机器学习模型要求变量采用数值格式。这需要先将分类变量转换为数值变量。同时,你也可以保留分类变量,以便进行数据可视化

检查缺失数据

如果你要检查每列缺失数据的数量,使用下列代码是最快的方法。可以让你更好地了解哪些列缺失的数据更多,从而确定怎么进行下一步的数据清洗和分析操作。

删除列中的字符串

有时候,会有新的字符或者其他奇怪的符号出现在字符串列中,这可以使用df[‘col_1’].replace很简单地把它们处理掉。

删除列中的空格

数据混乱的时候,什么情况都有可能发生。字符串开头经常会有一些空格。在删除列中字符串开头的空格时,下面的代码非常有用。

用字符串连接两列(带条件)

当你想要有条件地用字符串将两列连接在一起时,这段代码很有帮助。比如,你可以在第一列结尾处设定某些字母,然后用它们与第二列连接在一起。

根据需要,结尾处的字母也可以在连接完成后删除。

转换时间戳(从字符串到日期时间格式)

在处理时间序列数据时,我们很可能会遇到字符串格式的时间戳列。

这意味着要将字符串格式转换为日期时间格式(或者其他根据我们的需求指定的格式) ,以便对数据进行有意义的分析。

 

--结束END--

本文标题: 8个数据清洗Python代码,复制可用,

本文链接: https://lsjlt.com/news/180990.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 8个数据清洗Python代码,复制可用,
    最近,大数据工程师Kin Lim Lee在Medium上发表了一篇文章,介绍了8个用于数据清洗的Python代码。 数据清洗,是进行数据分析和使用数据训练模型的必经之路,也是最耗费数据科学家/程序员精力的地方。 这些用于数据清洗的代码有两...
    99+
    2023-01-30
    代码 数据 Python
  • Python 八个数据清洗实例代码详解
    如果你经历过数据清洗的过程,你就会明白我的意思。而这正是撰写这篇文章的目的——让读者更轻松地进行数据清洗工作。 事实上,我在不久前意识到,在进行数据清洗时,有...
    99+
    2024-04-02
  • 使用Python怎么清洗数据
    今天就跟大家聊聊有关使用Python怎么清洗数据,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。下面我们用一副待清洗的扑克牌作为示例,假设它保存在代码文件相同的目录下,在 Jupyte...
    99+
    2023-06-16
  • 如何用Python进行数据清洗
    这篇文章主要介绍“如何用Python进行数据清洗”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“如何用Python进行数据清洗”文章能帮助大家解决问题。 数据清洗是...
    99+
    2024-04-02
  • 怎么使用Python进行数据清洗
    这篇文章主要讲解了“怎么使用Python进行数据清洗”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python进行数据清洗”吧!缺失值当数据集中包含缺失数据时,在填充之前可以先进行一...
    99+
    2023-07-06
  • 三个Python常用的数据清洗处理方式总结
    目录1. strip函数清除空格2. duplicated函数清除重复数据3. 数据缺失值补全4. 数据保存关于python数据处理过程中三个主要的数据清洗说明,分别是缺失值/空格/...
    99+
    2022-12-20
    Python数据清洗处理 Python数据清洗
  • 如何用python清洗文件中的数据
    目录简单版使用filter读取utf-8带bom的文件多文件清洗清洗数据同时记录订单号并排序清洗sql文件,将数据表名放入excel中总结简单版 直接打开日志文件,往另外一个文件中按照要过滤的要求进行过滤 im...
    99+
    2022-06-02
    python 数据清洗
  • 怎么在Python中使用numpy清洗数据
    这篇文章给大家介绍怎么在Python中使用numpy清洗数据,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、网络爬虫;4、嵌入式应用...
    99+
    2023-06-14
  • 利用Python进行数据清洗的操作指南
    目录缺失值异常值数据不一致无效数据重复数据数据泄漏问题你一定听说过这句著名的数据科学名言: 在数据科学项目中, 80% 的时间是在做数据处理。 如果你没有听过,那么请记住:数据清洗是...
    99+
    2024-04-02
  • 怎么在Python中使用Pandas进行数据清洗
    怎么在Python中使用Pandas进行数据清洗?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。python的五大特点是什么python的五大特点:1.简单易学,...
    99+
    2023-06-14
  • 使用Python进行数据清洗的完整指南
    你一定听说过这句著名的数据科学名言:在数据科学项目中, 80% 的时间是在做数据处理。如果你没有听过,那么请记住:数据清洗是数据科学工作流程的基础。 机器学习模型会根据你提供的数据执行,混乱的数据会导致性能下降甚至错误的结果,而干净的数据是...
    99+
    2023-05-14
    Python 数据集 数据清洗
  • Python怎么利用Pandas与NumPy进行数据清洗
    本文小编为大家详细介绍“Python怎么利用Pandas与NumPy进行数据清洗”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python怎么利用Pandas与NumPy进行数据清洗”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一...
    99+
    2023-06-30
  • 用Python实现网易云音乐的数据进行数据清洗和可视化分析
    目录Python实现对网易云音乐的数据进行一个数据清洗和可视化分析对音乐数据进行数据清洗与可视化分析对音乐数据进行数据清洗与可视化分析歌词文本分析总结Python实现对网易云音乐的数据进行一个数据清洗和可视化分析 对...
    99+
    2022-06-02
    Python 数据清洗 数据可视化分析
  • 50 行 Python 代码制作一个数据大屏!
    PywebIO介绍Python当中的PywebIO模块可以帮助开发者在不具备HTML和JavaScript的情况下也能够迅速构建Web应用或者是基于浏览器的GUI应用,PywebIO还可以和一些常用的可视化模块联用,制作成一个可视化大屏。我...
    99+
    2023-05-14
    代码 工具 Python
  • 详解Python如何利用Pandas与NumPy进行数据清洗
    目录准备工作DataFrame 列的删除DataFrame 索引更改DataFrame 数据字段整理str 方法与 NumPy 结合清理列apply 函数清理整个数据集DataFra...
    99+
    2024-04-02
  • python复制的代码怎么用
    在 python 中使用复制的代码的步骤如下:将代码复制并粘贴到文本编辑器中。创建一个 python 文件。在命令行中运行代码。理解代码的用途和工作原理。根据需要修改代码并重新运行它。 ...
    99+
    2024-04-20
    python sublime
  • 如何使用C++实现复杂的数据转换和清洗任务?
    使用 c++++ 处理复杂的数据转换和清洗任务:读取和转换数据:加载原始数据并使用库或函数进行类型转换。清洗数据:通过函数删除无效或不一致的记录。标准化数据:使用规则将数据转换为标准格式...
    99+
    2024-05-15
    数据清洗 数据转换 c++
  • 如何使用MySQL和Java实现一个简单的数据清洗功能
    如何使用MySQL和Java实现一个简单的数据清洗功能概述:在进行数据分析和机器学习之前,数据清洗是一个非常重要的步骤。数据清洗可以帮助我们处理缺失值、异常值和重复值等问题,从而提高我们对数据的准确性和可靠性。本文将介绍如何使用MySQL和...
    99+
    2023-10-22
    MySQL Java 数据清洗
  • 如何使用MySQL和Ruby实现一个简单的数据清洗功能
    如何使用MySQL和Ruby实现一个简单的数据清洗功能在数据分析和处理的过程中,数据清洗是一个非常重要的步骤。数据清洗可以帮助我们处理不完整、不一致或者错误的数据,使数据能够更好地被分析和使用。本文将介绍如何使用MySQL和Ruby语言实现...
    99+
    2023-10-22
    MySQL Ruby 数据清洗
  • 111个Python数据分析实战项目,代码已跑通,数据可下载
    写在前面: 这里整理了111个数据分析的案例,每一个都进行了严格的筛选,筛选标准如下: 有干货:杜绝纯可视化、统计性分析,有一定比例的讲解性文字 可跑通:所有代码均经过测试,(大概率)可以一键跑通(因为库包更新,或者链接有效性问题,...
    99+
    2023-08-31
    python 数据挖掘 数据分析
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作