首页 > 资讯 > 后端开发 > Python >pandas DataFrame的创建方

628

分享到

pandas DataFrame的创建方

pandas DataFrame 2023-01-30 22:01:23 628人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

pandas DataFrame的增删查改总结系列文章： pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pandas DataFrame的修改方法

pandas DataFrame的增删查改总结系列文章：

pandas DaFrame的创建方法
pandas DataFrame的查询方法
pandas DataFrame行或列的删除方法
pandas DataFrame的修改方法

在pandas里，DataFrame是最经常用的数据结构，这里总结生成和添加数据的方法：
①、把其他格式的数据整理到DataFrame中；
②在已有的DataFrame中插入N列或者N行。

1. 字典类型读取到DataFrame（dict to DataFrame）

假如我们在做实验的时候得到的数据是dict类型，为了方便之后的数据统计和计算，我们想把它转换为DataFrame，存在很多写法，这里简单介绍常用的几种：
方法一：直接使用pd.DataFrame(data=test_dict)即可,括号中的data=写不写都可以，具体如下：

test_dict = {'id':[1,2,3,4,5,6],'name':['Alice','Bob','Cindy','Eric','Helen','Grace '],'math':[90,89,99,78,97,93],'english':[89,94,80,94,94,90]}
#[1].直接写入参数test_dict
test_dict_df = pd.DataFrame(test_dict)
#[2].字典型赋值
test_dict_df = pd.DataFrame(data=test_dict)

那么，我们就得到了一个DataFrame，如下：

应该就是这个样子了。
方法二：使用from_dict方法：

test_dict_df = pd.DataFrame.from_dict(test_dict)

结果是一样的，不再重复贴图。
其他方法：如果你的dict变量很小，例如{'id':1,'name':'Alice'},你想直接写到括号里：

test_dict_df = pd.DataFrame({'id':1,'name':'Alice'}) # wrong style

这样是不行的，会报错ValueError: If using all Scalar values, you must pass an index,是因为如果你提供的是一个标量，必须还得提供一个索引Index，所以你可以这么写：

test_dict_df = pd.DataFrame({'id':1,'name':'Alice'},pd.Index(range(1)))

后面的可以写多个pd.Index(range(3)，就会生成三行一样的，是因为前面的dict型变量只有一组值，如果有多个，后面的Index必须跟前面的数据组数一致，否则会报错：

pd.DataFrame({'id':[1,2],'name':['Alice','Bob']},pd.Index(range(2)))  #must be 2 in range function.

关于选择列，有些时候我们只需要选择dict中部分的键当做DataFrame的列，那么我们可以使用columns参数，例如我们只选择'id'，'name'列：

test_dict_df = pd.DataFrame(data=test_dict,columns=['id','name']) #only choose 'id' and 'name' columns

这里就不在多写了，后续变更颜色添加内容。

2. csv文件构建DataFrame（csv to DataFrame）

我们实验的时候数据一般比较大，而csv文件是文本格式的数据，占用更少的存储，所以一般数据来源是csv文件，从csv文件中如何构建DataFrame呢？ txt文件一般也能用这种方法。
方法一：最常用的应该就是pd.read_csv('filename.csv')了，用 sep指定数据的分割方式，默认的是','

df = pd.read_csv('./xxx.csv')

如果csv中没有表头，就要加入head参数

3. 在已有的DataFrame中，增加N列或者N行

加入我们已经有了一个DataFrame，如下图:

3.1 添加列
此时我们又有一门新的课physics，我们需要为每个人添加这门课的分数，按照Index的顺序，我们可以使用insert方法，如下：

new_columns = [92,94,89,77,87,91]
test_dict_df.insert(2,'pyhsics',new_columns)
#test_dict_df.insert(2,'pyhsics',new_columns,allow_duplicates=True)

此时，就得到了添加好的DataFrame，需要注意的是DataFrame默认不允许添加重复的列，但是在insert函数中有参数allow_duplicates=True，设置为True后，就可以添加重复的列了，列名也是重复的：

3.2 添加行
此时我们又来了一位新的同学Iric，需要在DataFrame中添加这个同学的信息，我们可以使用loc方法：

new_line = [7,'Iric',99]
test_dict_df.loc[6]= new_line

但是十分注意的是，这样实际是改的操作，如果loc[index]中的index已经存在，则新的值会覆盖之前的值。

当然也可以把这些新的数据构建为一个新的DataFrame，然后两个DataFrame拼起来。可以用append方法，不过不太会用，提供一种方法：

test_dict_df.append(pd.DataFrame([new_line],columns=['id','name','physics']))

本想一口气把CURD全写完，没想到写到这里就好累。。。其他后续新开篇章在写吧。
相关代码：（https://GitHub.com/dataSnail/bloGCode/blob/master/python_curd/Python_curd_create.ipynb）（在DataFrame中删除N列或者N行）（在DataFrame中查询某N列或者某N行）（在DataFrame中修改数据）

您可能感兴趣的文档:

--结束END--

本文标题: pandas DataFrame的创建方

本文链接: https://lsjlt.com/news/179660.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

pandas DataFrame的创建方

1. 字典类型读取到DataFrame（dict to DataFrame）

2. csv文件构建DataFrame（csv to DataFrame）

3. 在已有的DataFrame中，增加N列或者N行

pandas DataFrame的创建方

pandas创建DataFrame的方式小结

pandas创建DataFrame对象失败的解决方法

pyspark创建DataFrame的几种方法

在 Python 中创建DataFrame的方法

Python 之 Pandas DataFrame 数据类型的简介、创建的列操作

Pandas数据结构详细说明及如何创建Series，DataFrame对象方法

Pandas DataFrame转换为字典的方法

Pandas DataFrame数据修改值的方法

Python pandas DataFrame数据拼接方法

Pandas实现Dataframe的合并

pythonnumpy中array与pandas的DataFrame转换方式

pandas进阶教程之Dataframe的apply方法

如何在Python中创建Dataframe

如何在pyspark中创建DataFrame

pandas创建series的三种方法小结

PythonPandas创建Dataframe数据框的六种方法汇总

pandas取dataframe特定行列的实现方法

pandas中DataFrame重置索引的几种方法

pandas给dataframe添加列名的两种方法

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义