返回顶部
首页 > 资讯 > 后端开发 > Python >怎么使用Python pandas找出删除重复的数据
  • 759
分享到

怎么使用Python pandas找出删除重复的数据

2023-07-02 17:07:02 759人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍了怎么使用python pandas找出删除重复的数据的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇怎么使用Python pandas找出删除重复的数据文章都会有所收获,下面

这篇文章主要介绍了怎么使用python pandas找出删除重复的数据的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇怎么使用Python pandas找出删除重复的数据文章都会有所收获,下面我们一起来看看吧。

前言

当我们使用pandas处理数据的时候,经常会遇到数据重复的问题,如何找出重复数据进而分析重复原因,或者如何直接删除重复的数据是一个关键的步骤,pandas提供了很方便的方法:duplicated()和drop_duplicates()。

一、duplicated()

duplicated()可以被用在DataFrame的三种情况下,分别是pandas.DataFrame.duplicated、pandas.Series.duplicated和pandas.Index.duplicated。他们的用法都类似,前两个会返回一个布尔值的Series,最后一个会返回一个布尔值的numpy.ndarray。

DataFrame.duplicated(subset=None, keep=‘first’)

subset:默认为None,需要标记重复的标签或标签序列

keep:默认为‘first’,如何标记重复标签

  • first:将除第一次出现以外的重复数据标记为True

  • last:将除最后一次出现以外的重复数据标记为True

  • False:将所有重复的项都标记为True(不管是不是第一次出现)

Series.duplicated(keep=‘first’)

keep:与DataFrame.duplicated的keep相同

Index.duplicated(keep=‘first’)

keep:与DataFrame.duplicated的keep相同

例子:

import pandas as pddf = pd.DataFrame({    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],    'rating': [4, 4, 3.5, 15, 5]})df

    brand style  rating
0  Yum Yum   cup     4.0
1  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0 

df.duplicated()

0    False
1     True
2    False
3    False
4    False
dtype: bool

df.duplicated(keep='last')

0     True
1    False
2    False
3    False
4    False
dtype: bool

df.duplicated(keep=False)

0     True
1     True
2    False
3    False
4    False
dtype: bool

df.duplicated(subset=['brand'])

0    False
1     True
2    False
3     True
4     True
dtype: bool

关于Index的重复标记:

df = df.set_index('brand')df

        style  rating
brand                
Yum Yum   cup     4.0
Yum Yum   cup     4.0
Indomie   cup     3.5
Indomie  pack    15.0
Indomie  pack     5.0

df.index.duplicated()
array([False,  True, False,  True,  True])

二、drop_duplicates()

与duplicated()类似,drop_duplicates()是直接把重复值给删掉。下面只会介绍一些含义不同的参数。

DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)

  • subset:与duplicated()中相同

  • keep:与duplicated()中相同

  • inplace:与pandas其他函数的inplace相同,选择是修改现有数据还是返回新的数据

Series.drop_duplicates()相比Series.duplicated()也是多了一个inplace参数,和上诉介绍一样,Index.drop_duplicates()与Index.duplicated()参数相同就不做赘述。下面是例子:

df = pd.DataFrame({    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],    'rating': [4, 4, 3.5, 15, 5]})df

     brand style  rating
0  Yum Yum   cup     4.0
1  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0

df.drop_duplicates()

     brand style  rating
0  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0

df.drop_duplicates(inplace = True)df

     brand style  rating
0  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0

关于“怎么使用Python pandas找出删除重复的数据”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“怎么使用Python pandas找出删除重复的数据”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注编程网Python频道。

--结束END--

本文标题: 怎么使用Python pandas找出删除重复的数据

本文链接: https://lsjlt.com/news/343250.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 怎么使用Python pandas找出删除重复的数据
    这篇文章主要介绍了怎么使用Python pandas找出删除重复的数据的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇怎么使用Python pandas找出删除重复的数据文章都会有所收获,下面...
    99+
    2023-07-02
  • Python pandas找出、删除重复的数据实例
    目录前言一、duplicated()二、drop_duplicates()总结前言 当我们使用pandas处理数据的时候,经常会遇到数据重复的问题,如何找出重复数据进而分析重复原因,...
    99+
    2024-04-02
  • pandas删除重复数据
     1、pandas中重复索引问题 df = df[~df.index.duplicated()] 2、pandas删除重复数据行 # 首先导入常用的两个包import pandas as pdimport numpy as np# 1.删除...
    99+
    2023-09-01
    pandas python 数据分析
  • Python Pandas中DataFrame.drop_duplicates()怎么删除重复值
    这篇“Python Pandas中DataFrame.drop_duplicates()怎么删除重复值”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能...
    99+
    2023-07-02
  • php怎么查找和删除数组中的重复数据
    在Web开发中,经常会遇到需要对大量数据进行查找和操作的情况,例如从数据库中查询某些特定记录或者对数据进行删除操作。在这样的情景下,PHP作为一种广泛应用的Web开发语言,其内置的函数和库往往可以方便地完成这些任务。本文将介绍如何使用PHP...
    99+
    2023-05-14
    php php数组
  • MySQL数据库中怎么查找删除重复行
    这篇文章给大家介绍MySQL数据库中怎么查找删除重复行,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。当你对b字段排序(分组),相同值的c被分到不同的组,因此不能用COUNT(DISTI...
    99+
    2024-04-02
  • sql怎么找出重复的数据
    要找出重复的数据,可以使用SQL语句中的GROUP BY和HAVING子句。 下面是一个示例,假设有一个名为employee...
    99+
    2023-10-22
    sql
  • mysql怎么删除重复数据
    这篇文章主要讲解了“mysql怎么删除重复数据”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“mysql怎么删除重复数据”吧!sku对应的重量表,应该一个sk...
    99+
    2024-04-02
  • SQL怎么删除重复数据
    这篇文章主要介绍“SQL怎么删除重复数据”,在日常操作中,相信很多人在SQL怎么删除重复数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”SQL怎么删除重复数据”的疑惑有所帮助!接下来,请跟着小编一起来学习吧...
    99+
    2023-07-02
  • mongodb怎么删除重复数据
    在MongoDB中删除重复数据可以使用聚合管道和$group操作符来实现。以下是一种常见的方法:1. 使用聚合管道和$group操作...
    99+
    2023-10-20
    mongodb
  • pgsql怎么删除重复数据
    要删除重复数据,可以使用以下步骤: 找出重复数据的所有记录: SELECT *, COUNT(*) FROM tabl...
    99+
    2024-04-02
  • oracle怎么删除重复数据
    oracle 提供了三种删除重复数据的方法:使用 delete 语句根据指定列分组,保留每组中 rowid 最小的行。使用 merge 语句根据指定列分组,使用 merge 语...
    99+
    2024-05-21
    oracle
  • 怎么用Python的Pandas删除列
    这篇文章主要介绍“怎么用Python的Pandas删除列”,在日常操作中,相信很多人在怎么用Python的Pandas删除列问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python的Pandas删除列...
    99+
    2023-06-29
  • SQLServer中怎么删除重复数据
    这篇文章将为大家详细讲解有关SQLServer中怎么删除重复数据,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。方法一declare @max integer...
    99+
    2024-04-02
  • mysql中怎么删除重复数据
    在MySQL中,可以使用以下两种方法来删除重复数据: 方法1:使用DISTINCT关键字和INSERT INTO SELECT...
    99+
    2024-04-09
    mysql
  • 怎么删除mysql重复数据库
    如何删除 mysql 重复数据库查找重复数据库(使用 show databases 命令)。连接到要删除的数据库(使用 use database 命令)。删除数据库中所有表(使用 dro...
    99+
    2024-08-05
    mysql
  • mysql数据库怎么删除重复
    在 MySQL 数据库中删除重复项的方法有:SELECT DISTINCT column1, column2, ...FROM table_name;SELECT col...
    99+
    2024-08-05
    mysql
  • Python pandas怎么删除指定行/列数据
    Python pandas怎么删除指定行/列数据,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。1.滤除缺失数据dropna()import pandas&n...
    99+
    2023-06-29
  • 使用shell脚本怎么删除mysql中的重复数据
    这期内容当中小编将会给大家带来有关使用shell脚本怎么删除mysql中的重复数据,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。#!/bin/sh# delete all&n...
    99+
    2023-06-09
  • 怎么在mongodb中删除重复的数据
    在mongodb中删除重复数据的方法:1.启动mongodb;2.登录mongodb数据库;3.使用数据库;4.为数据建立唯一索引实现去重;具体步骤如下:首先,在命令行中启动mongodb服务;net start MongoDBmongod...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作