返回顶部
首页 > 资讯 > 后端开发 > Python >Python中如何Pandas代码助数据从业人员开启新征程
  • 100
分享到

Python中如何Pandas代码助数据从业人员开启新征程

2023-06-02 06:06:59 100人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

这期内容当中小编将会给大家带来有关python中如何pandas代码助数据从业人员开启新征程,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。摘要Pandas 是基于NumPy 的一种工具,该工具是为了解决数

这期内容当中小编将会给大家带来有关python中如何pandas代码助数据从业人员开启新征程,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

摘要

Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。不少利用Python做数据分析的朋友应该对Pandas不陌生,这里给大家总结了20个常用的Pandas代码帮助大家更快速的理解数据。

我这里将这20个Pandas代码分成三类:

  • 基本数据信息

  • 基本数据处理

  • 操作Data frames

基本数据信息

基本读写数据集(CSV、Execl)

# csv# 读pd.DataFrame.from_csv(“csv_file”) pd.read_csv(“csv_file”)# 写df.to_csv("data.csv", sep=",", index=False) # 逗号分隔,没有下标# execlpd.read_excel("excel_file")df.to_execl("data.xlsx",sheet_name='a')

基本数据集特征

df.info()

基本数据统计

df.describe()

将data frames输出到一张表里(tabulate模块)

from tabulate import tabulateprint(tabulate(print_table, headers=headers))# print_table 为包含列表的列表# headers 为表头所包含的字段

列出所有的字段

df.columns

得到前后n行

df.head(n) #前n行df.tail(n) #后n行

通过特征、位置定位数据

df.loc[feature_name]#选择“size”列的第一行df.loc([0], ['size'])df.iloc[n] # 位置

基本数据处理

去除缺失值

df.dropna(axis=0, how='any')

替换缺失值

df.replace(to_replace=None, value=None)# 将“to_replace”中的值替换为“value”

检查缺失值

pd.isnull(object)# 检测缺失值(数值数组中的NaN,对象数组中的None/NaN)

删除一个字段

df.drop('feature_variable_name', axis=1)# 轴对于行是0,对于列是1

将对象类型转换为数值

pd.to_numeric(df["feature_name"], errors='coerce')# 将对象类型转换为numeric以便能够执行计算(如果它们是字符串)

将Dataframe转换为numpy数组

df.as_matrix()

操作Data frames

将函数应用于dataframe

# 这个将把数据的“height”列中的所有值乘以21、df["height"].apply(lambda height: 2 * height)2、def multiply(x): return x * 2df["height"].apply(multiply)

从命名一列

# 这里,将把数据的第三列重命名为“size”df.rename(columns = {df.columns[2]:'size'}, inplace=True)

获取某列的唯一项

# 这里将得到列“name”的唯一条目df["name"].unique()

多级访问

# 在这里,将从数据中获取列的选择,“name”和“size”new_df = df[["name", "size"]]

数据的一些统计量df.sum()

df.min()df.max()df.idxmin()df.idxmax() #返回最大值索引df.mean()df.median()df.corr() # 不同列之间的相关系数df["size"].median

数据排序

df.sort_values(ascending = False)

布尔索引

df[df["size"] == 5] #布尔型索引

上述就是小编为大家分享的Python中如何Pandas代码助数据从业人员开启新征程了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注编程网Python频道。

--结束END--

本文标题: Python中如何Pandas代码助数据从业人员开启新征程

本文链接: https://lsjlt.com/news/229130.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python中如何Pandas代码助数据从业人员开启新征程
    这期内容当中小编将会给大家带来有关Python中如何Pandas代码助数据从业人员开启新征程,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。摘要Pandas 是基于NumPy 的一种工具,该工具是为了解决数...
    99+
    2023-06-02
  • 从入门到精通Python教程:如何使用git来load你的代码和数据?
    Python是一种高级编程语言,广泛应用于数据科学、机器学习、人工智能等领域。而git则是一种版本控制工具,可以让你轻松地管理你的代码和数据。本篇文章将向大家介绍如何使用git来load你的代码和数据,从入门到精通Python教程。 一、G...
    99+
    2023-06-26
    教程 load git
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作