返回顶部
首页 > 资讯 > 精选 >Pandas库是什么及怎么使用
  • 683
分享到

Pandas库是什么及怎么使用

2023-07-05 04:07:08 683人浏览 薄情痞子
摘要

今天小编给大家分享一下pandas库是什么及怎么使用的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Pandas的介绍pand

今天小编给大家分享一下pandas库是什么及怎么使用的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。

Pandas的介绍

pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使python成为强大而高效的数据分析环境的重要因素之一。

数据处理的时候经常性需要整理出表格,在这里介绍pandas常见使用:

参考链接:10 minutes to pandas https://pandas.pydata.org/docs/user_guide/10min.html#min

数据结构

Pandas常见的就两种数据类型:Series和DataFrame,可以对应理解为向量和矩阵,前者是一维的,后者是二维的。在DF中类似统计学中的数据组织方式,一行代表一项数据,一列代表一种特征,用这种方式记忆能够帮你更好理解DF。需要注意的是:在DF中index是行,column是列。

Pandas库是什么及怎么使用

Pandas库是什么及怎么使用

导入导出数据

常使用.csv格式的文件,我们在导入数据的时候使用pd.read_csv(),在导出数据的时候用df.write_csv(“/data/ymz.csv”).

# 读入数据In [144]: pd.read_csv("foo.csv")Out[144]:      Unnamed: 0          A          B          C          D0    2000-01-01   0.350262   0.843315   1.798556   0.7822341    2000-01-02  -0.586873   0.034907   1.923792  -0.5626512    2000-01-03  -1.245477  -0.963406   2.269575  -1.6125663    2000-01-04  -0.252830  -0.498066   3.176886  -1.2755814    2000-01-05  -1.044057   0.118042   2.768571   0.386039..          ...        ...        ...        ...        ...995  2002-09-22 -48.017654  31.474551  69.146374 -47.541670996  2002-09-23 -47.207912  32.627390  68.505254 -48.828331997  2002-09-24 -48.907133  31.990402  67.310924 -49.391051998  2002-09-25 -50.146062  33.716770  67.717434 -49.037577999  2002-09-26 -49.724318  33.479952  68.108014 -48.822030[1000 rows x 5 columns]
# 写出数据In [143]: df.to_csv("foo.csv")

对数据进行操作

对数据操作包括增(创建),删,改,查。

增加数据(创建数据)

相比较Series,我们更常使用DataFrame数据类型,常使用的创建DataFrame类型有两种,一种是使用data创建(注意data得是一个二维list/array等),一种是使用字典创建。

1. 使用data创建DF
# 使用data导入In [5]: dates = pd.date_range("20130101", periods=6)In [6]: datesOut[6]: DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',               '2013-01-05', '2013-01-06'],              dtype='datetime64[ns]', freq='D')In [7]: df = pd.DataFrame(data=np.random.randn(6, 4), index=dates, columns=list("ABCD"))In [8]: dfOut[8]:                    A         B         C         D2013-01-01  0.469112 -0.282863 -1.509059 -1.1356322013-01-02  1.212112 -0.173215  0.119209 -1.0442362013-01-03 -0.861849 -2.104569 -0.494929  1.0718042013-01-04  0.721555 -0.706771 -1.039575  0.2718602013-01-05 -0.424972  0.567020  0.276232 -1.0874012013-01-06 -0.673690  0.113648 -1.478427  0.524988
2. 使用字典创建DF
# 使用字典In [9]: df2 = pd.DataFrame(   ...:     {   ...:         "A": 1.0,   ...:         "B": pd.Timestamp("20130102"),   ...:         "C": pd.Series(1, index=list(range(4)), dtype="float32"),   ...:         "D": np.array([3] * 4, dtype="int32"),   ...:         "E": pd.CateGorical(["test", "train", "test", "train"]),   ...:         "F": "foo",   ...:     }   ...: )   ...: In [10]: df2Out[10]:      A          B    C  D      E    F0  1.0 2013-01-02  1.0  3   test  foo1  1.0 2013-01-02  1.0  3  train  foo2  1.0 2013-01-02  1.0  3   test  foo3  1.0 2013-01-02  1.0  3  train  foo
3. 增加一行数据

1)使用loc在行尾增加

增加一行数据的方法有loc, iloc, append, concat, merge。这里介绍一下loc,loc[index]是在一行的最后增加数据。但是你需要注意loc[index]中的index,如果与已出现过的index相同,则会覆盖原先index行,若不相同则才会增加一行数据。

Pandas库是什么及怎么使用

2)使用concat将两个DF合并

concat()也是一个增加数据常用的方法,常见于两个表的拼接与爬虫使用中,作用类似于append(),但是append()将在不久后被pandas舍弃,所以还是推荐使用concat()。

Pandas库是什么及怎么使用

Pandas库是什么及怎么使用

4. 增加一列数据

增加一列数据的方法直接用[]便可,例子如下:

Pandas库是什么及怎么使用

Series用的比较少,案例如下:

In [3]: s = pd.Series([1, 3, 5, np.nan, 6, 8])In [4]: sOut[4]: 0    1.01    3.02    5.03    NaN4    6.05    8.0dtype: float64

删除数据

对于删除数据,我们使用drop()方法,并指定参数为index(行)或者column(列)

1. 删除一行数据

Pandas库是什么及怎么使用

2. 删除一列数据

Pandas库是什么及怎么使用

改动数据

改动一行,列数据常用loc()和[]方法。

1. 改动一行数据

改动一行我们使用loc[]=[…]进行更改。

Pandas库是什么及怎么使用

2. 改动一列数据

改动一列数据我们使用[]进行更改。

Pandas库是什么及怎么使用

查找数据

在查找数据的时候,我们常使用[]来查看行列数据,配合.T来将矩阵转置。也可以使用head(),tail()来查看前几行和后几行数据。

1. 查看特定行数据

使用.loc[index]来查看特定行数据,或者[]。建议使用.loc[]方法或者.iloc[]方法,loc[]通过行的名字寻找,iloc[]通过索引寻找。

使用类似[0:2]来查看特定行数据,和python中list使用类似。这个方法其实是调用了__getitem__()方法

Pandas库是什么及怎么使用

2. 查看特定列数据

我们需要使用两层[]嵌套来访问数据,例如[ [“j”, “i”] ]。

Pandas库是什么及怎么使用

3. 查看特定元素

确定第几行第几列后,使用.loc()方法或者.iloc()方法查找。

b = a.loc[ 1, "dir_name" ]

常用操作

数据分析时常用的两个操作,转置和计算统计量。

1. 转置

使用.T便可以完成。

Pandas库是什么及怎么使用

2. 计算统计量

使用.describe()。

Pandas库是什么及怎么使用

3. 舍弃一列中多余重复数据

使用.drop_duplicates()

id_df = self.frames_meta_sub[['time_idx', 'pos_idx', 'slice_idx']].drop_duplicates()
4. 将特定列转成numpy后处理

使用.to_numpy()方法将你所选择的数据全部转成二维的或者一维的ndarray,需要注意的是to_numpy()并不仅仅局限于数字,字符串也是可以转换的(虽然这样开销比较大),ndarray能存储字符串,这会让你处理数据的过程变得异常简单。有几个维度取决于你取了几行或者几列。

df = df[ ["channel"] ]ar = df.to_numpy()
5. 取出dataframe中特定位置的值

要取出 DataFrame 中特定位置的值,可以使用 .loc 或 .iloc 方法,具体取决于您想要使用的索引类型。

如果您使用标签索引(例如,行和列都使用标签名称),则可以使用 .loc 方法。例如,如果您有一个名为 df 的 DataFrame,它具有行标签为 row_label,列标签为 column_label 的元素,则可以使用以下代码获取该元素的值:

value = df.loc[row_label, column_label]

如果您使用整数位置索引(例如,行和列都使用整数位置),则可以使用 .iloc 方法。例如,如果您有一个名为 df 的 DataFrame,它具有第一个行和第一个列的元素,则可以使用以下代码获取该元素的值:

value = df.iloc[0, 0]

请注意,索引从零开始,因此第一个行和第一个列的位置为 0。

以上就是“Pandas库是什么及怎么使用”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注编程网精选频道。

--结束END--

本文标题: Pandas库是什么及怎么使用

本文链接: https://lsjlt.com/news/349620.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Pandas库是什么及怎么使用
    今天小编给大家分享一下Pandas库是什么及怎么使用的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Pandas的介绍pand...
    99+
    2023-07-05
  • python中的pandas库怎么安装及使用
    要安装pandas库,可以使用pip命令。在命令行中输入以下命令来安装pandas:```pip install pandas```...
    99+
    2023-09-25
    python pandas
  • airodump是什么及怎么使用
    airodump-ng是一款用于无线网络分析的开源工具,它可以扫描周围的无线网络并显示相关的信息,如SSID、MAC地址、加密方式、...
    99+
    2023-09-26
    airodump
  • LINQ是什么及怎么使用
    本文小编为大家详细介绍“LINQ是什么及怎么使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“LINQ是什么及怎么使用”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。一、为什么要使用LINQ要理解为什么使用LIN...
    99+
    2023-06-29
  • JSONObject是什么及怎么使用
    JSONObject是Java中的一个类,它可以用来表示一个JSON对象。JSON(JavaScript Object Notati...
    99+
    2023-09-12
    JSONObject
  • JumpServer是什么及怎么使用
    JumpServer是一款开源的堡垒机软件,用于管理和控制服务器远程访问权限。它可以帮助管理员集中管理服务器账号和权限,实现对服务器...
    99+
    2023-10-23
    JumpServer
  • ​thrift是什么及怎么使用
    Thrift是一个软件框架,用于跨语言的服务开发。它由Apache软件基金会开发和维护,旨在帮助开发人员编写高效和可扩展的客户端-服...
    99+
    2023-10-21
    ​thrift
  • ChatGPT是什么及怎么使用
    这篇“ChatGPT是什么及怎么使用”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“ChatGPT是什么及怎么使用”文章吧。C...
    99+
    2023-07-04
  • Vuex是什么及怎么使用
    这篇文章主要讲解了“Vuex是什么及怎么使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Vuex是什么及怎么使用”吧!一.Vuex是什么?为什么要用它?vuex官方解释Vuex 是一个专为...
    99+
    2023-07-04
  • Xterm.js是什么及怎么使用
    这篇文章主要介绍“Xterm.js是什么及怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Xterm.js是什么及怎么使用”文章能帮助大家解决问题。xterm.js是什么xterm是一个使用T...
    99+
    2023-07-04
  • Mybatis是什么及怎么使用
    这篇文章主要介绍“Mybatis是什么及怎么使用”,在日常操作中,相信很多人在Mybatis是什么及怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Mybatis是什么及怎么使用”的疑惑有所帮助!接下来...
    99+
    2023-07-05
  • jQuery是什么及怎么使用
    这篇文章主要介绍“jQuery是什么及怎么使用”,在日常操作中,相信很多人在jQuery是什么及怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”jQuery是什么及怎么使用”的疑惑有所帮助!接下来,请跟...
    99+
    2023-07-05
  • Pandas库中iloc[ ]函数怎么使用
    本篇内容主要讲解“Pandas库中iloc[ ]函数怎么使用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Pandas库中iloc[ ]函数怎么使用”吧!1 iloc[]函数...
    99+
    2023-07-06
  • Java NIO是什么及怎么使用
    Java NIO(New IO)是Java 1.4版本中引入的一种用于替代传统Java IO的新的输入输出API。NIO提供了更高效...
    99+
    2023-09-27
    Java
  • mybatis plus是什么及怎么使用
    这篇文章主要介绍“mybatis plus是什么及怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“mybatis plus是什么及怎么使用”文章能帮助大家解决问题。一、什么...
    99+
    2023-06-30
  • JavaBean作用是什么及怎么使用
    JavaBean是一种符合特定约定的Java类,用于封装数据和提供访问和操作这些数据的方法。它的作用是提供一种标准化的方式来组织和操...
    99+
    2023-08-15
    JavaBean
  • python中怎么安装和使用pandas库
    要安装和使用pandas库,可以按照以下步骤进行操作:1. 安装pandas库:- 使用pip安装:在终端或命令提示符中运行以下命令...
    99+
    2023-10-11
    python pandas
  • SpringBoot框架是什么及怎么使用
    这篇文章主要介绍“SpringBoot框架是什么及怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“SpringBoot框架是什么及怎么使用”文章能帮助大家解决问题。一、SpringBoot是什...
    99+
    2023-06-08
  • update语法是什么及怎么使用
    UPDATE语法用于修改表中的数据。它的基本语法如下:```UPDATE table_nameSET column1 = value...
    99+
    2023-06-13
    update语法
  • linux管道是什么及怎么使用
    本文小编为大家详细介绍“linux管道是什么及怎么使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“linux管道是什么及怎么使用”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。...
    99+
    2023-04-27
    linux
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作