返回顶部
首页 > 资讯 > 后端开发 > Python >Python中常用探索性数据分析方法有哪些
  • 375
分享到

Python中常用探索性数据分析方法有哪些

2023-06-25 16:06:39 375人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍了python中常用探索性数据分析方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。常用探索性数据分析方法很多,比如常用的 pandas DataFra

这篇文章主要介绍了python中常用探索性数据分析方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

常用探索性数据分析方法很多,比如常用的 pandas DataFrame 方法有 .head()、.tail()、.info()、.describe()、.plot() 和 .value_counts()。

import pandas as pdimport numpy as npdf = pd.DataFrame( {     "Student" : ["Mike", "Jack", "Diana", "Charles", "Philipp", "Charles", "Kale", "Jack"] ,           "City" : ["London", "London", "Berlin", "London", "London", "Berlin", "London", "Berlin"] ,"Age" : [20, 40, 18, 24, 37, 40, 44, 20 ],"Maths_Score" : [84, 80, 50, 36, 44, 24, 41, 35],"Science_Score" : [66, 83, 51, 35, 43, 58, 71, 65]} ) df

在 Pandas 中创建 groupby() 对象

在许多情况下,我们希望将数据集拆分为多个组并对这些组进行处理。 Pandas 方法 groupby() 用于将 DataFrame 中的数据分组。

与其一起使用 groupby() 和聚合方法,不如创建一个 groupby() 对象。 理想的情况是,我们可以在需要时直接使用此对象。

让我们根据列“City”将给定的 DataFrame 分组

df_city_group = df.groupby("City")

我们创建一个对象 df_city_group,该对象可以与不同的聚合相结合,例如 min()、max()、mean()、describe() 和 count()。 一个例子如下所示。

Python中常用探索性数据分析方法有哪些


要获取“City”是Berlin的 DataFrame 子集,只需使用方法 .get_group()

Python中常用探索性数据分析方法有哪些


这不需要为每个组创建每个子 DataFrame 的副本,比较节省内存。

另外,使用 .groupby() 进行切片比常规方法快 2 倍!!

Python中常用探索性数据分析方法有哪些

使用 .nlargest()

通常,我们根据特定列的值了解 DataFrame 的 Top 3 或 Top 5 数据。例如,从考试中获得前 3 名得分者或从数据集中获得前 5 名观看次数最多的电影。使用 Pandas .nlargest() 是最简单的方式。

df.nlargest(N, column_name, keep = ‘first' )

使用 .nlargest() 方法,可以检索包含指定列的 Top ‘N' 值的 DataFrame 行。

在上面的示例中,让我们获取前 3 个“Maths_Score”的 DataFrame 的行。

Python中常用探索性数据分析方法有哪些

如果两个值之间存在联系,则可以修改附加参数和可选参数。 它需要值“first”、“last”和“all”来检索领带中的第一个、最后一个和所有值。这种方法的优点是,你不需要专门对 DataFrame 进行排序

使用 .nsmallest()

与Top 3 或5 类似,有时我们也需要DataFrame 中的Last 5 条记录。例如,获得评分最低的 5 部电影或考试中得分最低的 5 名学生。使用 Pandas .nsmallest() 是最简单的方式

df.nsmallestst(N, column_name, keep = ‘first' )

使用 .nsmallest() 方法,可以检索包含指定列的底部“N”个值的 DataFrame 行。

在同一个示例中,让我们获取 DataFrame“df”中“Maths_Score”最低的 3 行。

Python中常用探索性数据分析方法有哪些

逻辑比较

比较运算符 <、>、<=、>=、==、!= 及其包装器 .lt()、.gt()、.le()、.ge()、.eq() 和 .ne() 分别在以下情况下非常方便将 DataFrame 与基值进行比较,这种比较会产生一系列布尔值,这些值可用作以后的指标。

  • 基于比较对 DataFrame 进行切片

  • 可以基于与值的比较从 DataFrame 中提取子集。

  • 根据两列的比较在现有 DataFrame 中创建一个新列。

所有这些场景都在下面的示例中进行了解释

# 1. Comparing the DataFrame to a base value# Selecting the columns with numerical values onlydf.iloc[:,2:5].gt(50)df.iloc[:,2:5].lt(50)# 2. Slicing the DataFrame based on comparison# df1 is subset of df when values in "Maths_Score" column are not equal or equal to '35'df1 = df[df["Maths_Score"].ne(35)]df2 = df[df["Maths_Score"].eq(35)]# 3. Creating new column of True-False values by comparing two columnsdf["Maths_Student"] = df["Maths_Score"].ge(df["Science_Score"])df["Maths_Student_1"] = df["Science_Score"].le(df["Maths_Score"])

感谢你能够认真阅读完这篇文章,希望小编分享的“Python中常用探索性数据分析方法有哪些”这篇文章对大家有帮助,同时也希望大家多多支持编程网,关注编程网Python频道,更多相关知识等着你来学习!

--结束END--

本文标题: Python中常用探索性数据分析方法有哪些

本文链接: https://lsjlt.com/news/305701.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python中常用探索性数据分析方法有哪些
    这篇文章主要介绍了Python中常用探索性数据分析方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。常用探索性数据分析方法很多,比如常用的 Pandas DataFra...
    99+
    2023-06-25
  • Python 数据分析教程探索性数据分析
    目录什么是探索性数据分析(EDA)?描述性统计分组数据方差分析相关性和相关性计算什么是探索性数据分析(EDA)? EDA 是数据分析下的一种现象,用于更好地理解数据方面,例如:&nb...
    99+
    2024-04-02
  • Python 更快进行探索性数据分析的四个方法
    大家好,常用探索性数据分析方法很多,比如常用的 Pandas DataFrame 方法有 .head()、.tail()、.info()、.describe()、.plot() 和 ...
    99+
    2024-04-02
  • 电商数据分析的常用方法有哪些
    电商数据分析的常用方法有市场分析、用户行为分析、商品分析、营销策略分析、供应链分析、用户满意度分析和大数据分析等。详细介绍:1、市场分析方法,通过分析市场数据,企业可以了解目标市场的规模、增长趋势,以及竞争对手的策略;2、用户行为分析方法,...
    99+
    2023-08-10
  • Python中Sweetviz如何实现探索性数据分析
    小编给大家分享一下Python中Sweetviz如何实现探索性数据分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!Sweetviz 是一个开源 Python 库,它只需三行代码就可以生成漂亮的高精度可视化效果来启动EDA...
    99+
    2023-06-25
  • Python数据分析常用工具有哪些
    Python数据分析常用工具有以下几种:1. NumPy:用于高性能数值计算和数组操作的库。2. Pandas:用于数据分析和数据处...
    99+
    2023-10-12
    Python
  • 数据分析方法有哪些
    数据分析方法有:1、描述性统计分析,对数据集的基本统计项进行计算和总结,来描述数据的特征和分布;2、探索性数据分析,对数据集进行初步探索,以发现数据中潜藏的模式,异常和趋势等信息;3、假设检验,使用统计方法来评估某个假设是否成立;4、回归分...
    99+
    2023-08-07
  • Python Sweetviz轻松实现探索性数据分析
    Sweetviz 是一个开源 Python 库,它只需三行代码就可以生成漂亮的高精度可视化效果来启动EDA(探索性数据分析)。输出一个HTML。文末提供技术交流群,喜欢点赞支持,收藏...
    99+
    2024-04-02
  • Python常见的数据分析库有哪些
    这篇文章主要介绍“Python常见的数据分析库有哪些”,在日常操作中,相信很多人在Python常见的数据分析库有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python常见的数据分析库有哪些”的疑惑有所...
    99+
    2023-06-02
  • 大数据分析中,Python的常用关键字有哪些?
    大数据分析是当今互联网时代中极为重要的领域,而Python作为一种高效、易学易用的编程语言,也成为了数据分析领域中的热门工具之一。在Python的使用过程中,有一些常用的关键字,下面我们来详细介绍一下。 import 在Python中,...
    99+
    2023-11-06
    leetcode 大数据 关键字
  • 搜索引擎优化SEO常用分析方法有哪些
    这篇文章将为大家详细讲解有关搜索引擎优化SEO常用分析方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。如何分析竞争对手网站外部因素分析:雅虎查反向链接数量。百度谷歌查询收录量。查询域名使用时间.内...
    99+
    2023-06-10
  • spss数据分析方法有哪些
    这篇文章主要讲解了“spss数据分析方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“spss数据分析方法有哪些”吧!spss数据分析的五种方法:1、线性模型;点击分析,一般线性模型,...
    99+
    2023-06-20
  • pandas数据分析有哪些方法
    pandas数据分析的方法有:1、数据读取与处理;2、数据筛选与选择;3、数据排序与整理;4、数据聚合与分组;5、数据透视与透视表;6、合并与连接数据;7、数据持久化与保存。Pandas库提供了丰富的数据分析和处理功能,涵盖了数据的读取、处...
    99+
    2023-11-22
    Pandas
  • pandas数据分析常用函数有哪些
    小编给大家分享一下pandas数据分析常用函数有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧! 导入模块import pandas as pd   ...
    99+
    2023-06-01
  • 大数据处理中,Python有哪些常见的数据分析库?
    在当今信息化时代,大数据处理已经成为了各行各业必不可少的工作。而在大数据处理的过程中,数据分析是至关重要的一步。为了更加高效地完成数据分析工作,很多人都会使用Python编程语言进行数据处理。而Python作为一种非常流行的编程语言,其拥有...
    99+
    2023-11-06
    leetcode 大数据 关键字
  • 查看Python中常用的数据类型有哪些方法
    Python是一种简洁而强大的编程语言,它支持多种数据类型。在编写Python程序时,我们经常需要查看数据的类型,以便了解数据的结构和特征,进而进行相应的操作和处理。本文将介绍Python中常用的数据类型查看方法,并提供相应的代...
    99+
    2024-01-20
    方法 数据类型 查看
  • 探索Golang中常用的数据类型转换方法
    探索Golang中常用的数据类型转换方法前言在Golang编程中,经常会遇到不同数据类型之间的转换问题。本文将介绍一些常用的数据类型转换方法,并附上具体的代码示例,以供大家参考。字符串与整数之间的转换在Golang中,字符串与整数之间的转换...
    99+
    2023-12-23
    数据类型 Golang 转换方法
  • 使用pandas进行数据可视化和探索性数据分析的技巧及方法
    如何使用pandas进行数据可视化和探索性分析 导语:在数据分析的过程中,可视化和探索性分析是不可或缺的环节。pandas是Python中一个非常强大的数据分析库,除了具有数据处理功能外,还提供了一系列用于数据可视化和探索性分析...
    99+
    2024-01-13
    数据探索 探索性分析
  • Python数据分析Numpy中常用相关性函数
    目录摘要:一、股票相关性分析二、多项式三、求极值的知识摘要: NumPy中包含大量的函数,这些函数的设计初衷是能更方便地使用,掌握解这些函数,可以提升自己的工作效率。这些函数包括数组...
    99+
    2024-04-02
  • JavaScript中有哪些常用的属性方法
    JavaScript中有哪些常用的属性方法?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。JavaScript常用属性方法有:document.write(&qu...
    99+
    2023-06-14
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作