首页 > 资讯 > 后端开发 > Python >Python中常用探索性数据分析方法有哪些

375

分享到

Python中常用探索性数据分析方法有哪些

2023-06-25 16:06:39 375人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要介绍了python中常用探索性数据分析方法有哪些，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。常用探索性数据分析方法很多，比如常用的 pandas DataFra

这篇文章主要介绍了python中常用探索性数据分析方法有哪些，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。

常用探索性数据分析方法很多，比如常用的 pandas DataFrame 方法有 .head()、.tail()、.info()、.describe()、.plot() 和 .value_counts()。

import pandas as pdimport numpy as npdf = pd.DataFrame( {     "Student" : ["Mike", "Jack", "Diana", "Charles", "Philipp", "Charles", "Kale", "Jack"] ,           "City" : ["London", "London", "Berlin", "London", "London", "Berlin", "London", "Berlin"] ,"Age" : [20, 40, 18, 24, 37, 40, 44, 20 ],"Maths_Score" : [84, 80, 50, 36, 44, 24, 41, 35],"Science_Score" : [66, 83, 51, 35, 43, 58, 71, 65]} ) df

在 Pandas 中创建 groupby() 对象

在许多情况下，我们希望将数据集拆分为多个组并对这些组进行处理。 Pandas 方法 groupby() 用于将 DataFrame 中的数据分组。

与其一起使用 groupby() 和聚合方法，不如创建一个 groupby() 对象。理想的情况是，我们可以在需要时直接使用此对象。

让我们根据列“City”将给定的 DataFrame 分组

df_city_group = df.groupby("City")

我们创建一个对象 df_city_group，该对象可以与不同的聚合相结合，例如 min()、max()、mean()、describe() 和 count()。一个例子如下所示。

Python中常用探索性数据分析方法有哪些

要获取“City”是Berlin的 DataFrame 子集，只需使用方法 .get_group()

Python中常用探索性数据分析方法有哪些

这不需要为每个组创建每个子 DataFrame 的副本，比较节省内存。

另外，使用 .groupby() 进行切片比常规方法快 2 倍！！

Python中常用探索性数据分析方法有哪些

使用 .nlargest()

通常，我们根据特定列的值了解 DataFrame 的 Top 3 或 Top 5 数据。例如，从考试中获得前 3 名得分者或从数据集中获得前 5 名观看次数最多的电影。使用 Pandas .nlargest() 是最简单的方式。

df.nlargest(N, column_name, keep = ‘first' )

使用 .nlargest() 方法，可以检索包含指定列的 Top ‘N' 值的 DataFrame 行。

在上面的示例中，让我们获取前 3 个“Maths_Score”的 DataFrame 的行。

Python中常用探索性数据分析方法有哪些

如果两个值之间存在联系，则可以修改附加参数和可选参数。它需要值“first”、“last”和“all”来检索领带中的第一个、最后一个和所有值。这种方法的优点是，你不需要专门对 DataFrame 进行排序。

使用 .nsmallest()

与Top 3 或5 类似，有时我们也需要DataFrame 中的Last 5 条记录。例如，获得评分最低的 5 部电影或考试中得分最低的 5 名学生。使用 Pandas .nsmallest() 是最简单的方式

df.nsmallestst(N, column_name, keep = ‘first' )

使用 .nsmallest() 方法，可以检索包含指定列的底部“N”个值的 DataFrame 行。

在同一个示例中，让我们获取 DataFrame“df”中“Maths_Score”最低的 3 行。

Python中常用探索性数据分析方法有哪些

逻辑比较

比较运算符 <、>、<=、>=、==、!= 及其包装器 .lt()、.gt()、.le()、.ge()、.eq() 和 .ne() 分别在以下情况下非常方便将 DataFrame 与基值进行比较，这种比较会产生一系列布尔值，这些值可用作以后的指标。

基于比较对 DataFrame 进行切片
可以基于与值的比较从 DataFrame 中提取子集。
根据两列的比较在现有 DataFrame 中创建一个新列。

所有这些场景都在下面的示例中进行了解释

# 1. Comparing the DataFrame to a base value# Selecting the columns with numerical values onlydf.iloc[:,2:5].gt(50)df.iloc[:,2:5].lt(50)# 2. Slicing the DataFrame based on comparison# df1 is subset of df when values in "Maths_Score" column are not equal or equal to '35'df1 = df[df["Maths_Score"].ne(35)]df2 = df[df["Maths_Score"].eq(35)]# 3. Creating new column of True-False values by comparing two columnsdf["Maths_Student"] = df["Maths_Score"].ge(df["Science_Score"])df["Maths_Student_1"] = df["Science_Score"].le(df["Maths_Score"])

感谢你能够认真阅读完这篇文章，希望小编分享的“Python中常用探索性数据分析方法有哪些”这篇文章对大家有帮助，同时也希望大家多多支持编程网，关注编程网Python频道，更多相关知识等着你来学习!

您可能感兴趣的文档:

--结束END--

本文标题: Python中常用探索性数据分析方法有哪些

本文链接: https://lsjlt.com/news/305701.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python中常用探索性数据分析方法有哪些

在 Pandas 中创建 groupby() 对象

使用 .nlargest()

使用 .nsmallest()

逻辑比较

Python中常用探索性数据分析方法有哪些

Python 数据分析教程探索性数据分析

Python 更快进行探索性数据分析的四个方法

电商数据分析的常用方法有哪些

Python中Sweetviz如何实现探索性数据分析

Python数据分析常用工具有哪些

数据分析方法有哪些

Python Sweetviz轻松实现探索性数据分析

Python常见的数据分析库有哪些

大数据分析中，Python的常用关键字有哪些？

搜索引擎优化SEO常用分析方法有哪些

spss数据分析方法有哪些

pandas数据分析有哪些方法

pandas数据分析常用函数有哪些

大数据处理中，Python有哪些常见的数据分析库？

查看Python中常用的数据类型有哪些方法

探索Golang中常用的数据类型转换方法

使用pandas进行数据可视化和探索性数据分析的技巧及方法

Python数据分析Numpy中常用相关性函数

JavaScript中有哪些常用的属性方法

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义