首页 > 资讯 > 后端开发 > Python >python Pandas之DataFrame索引及选取数据

189

分享到

python Pandas之DataFrame索引及选取数据

2024-04-02 19:04:59 189人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

目录1.索引是什么1.1 认识索引1.2 自定义索引2. 索引的简单使用2.1 列索引2.2 行索引2.2.1 使用[ ]2.2.2 使用.loc()和.iloc()1.索引是什么

1.索引是什么

1.1 认识索引

先创建一个简单的DataFrame。

myList = [['a', 10, 1.1],
	  ['b', 20, 2.2],
	  ['c', 30, 3.3],
	  ['d', 40, 4.4]]
df1 = pd.DataFrame(data = myList)
print(df1)
--------------------------------
[out]:
   0   1    2
0  a  10  1.1
1  b  20  2.2
2  c  30  3.3
3  d  40  4.4

DataFrame中有两种索引：

行索引(index)：对应最左边那一竖列
列索引(columns)：对应最上面那一横行

两种索引默认均为从0开始的自增整数。

# 输出行索引
print(df1.index)
[out]:
RangeIndex(start=0, stop=4, step=1)
---------------------------------------
# 输出列索引
print(df1.columns)
[out]:
RangeIndex(start=0, stop=3, step=1)
---------------------------------------
# 输出所有的值
print(df1.values)
[out]:
array([['a', 10, 1.1],
       ['b', 20, 2.2],
       ['c', 30, 3.3],
       ['d', 40, 4.4]], dtype=object)

1.2 自定义索引

可以使用 index 这个参数指定行索引，columns 这个参数指定列索引。

df2 = pd.DataFrame(myList, 
		           index = ['one', 'two', 'three', 'four'], 
		           columns = ['char', 'int', 'float'])
print(df2)
-----------------------------------------------------------
[out]:
      char  int  float
one      a   10    1.1
two      b   20    2.2
three    c   30    3.3
four     d   40    4.4

输出此时的行索引和列索引：

# 输出行索引
print(df2.index)
[out]:
Index(['one', 'two', 'three', 'four'], dtype='object')
--------------------------------------------------------
# 输出列索引
print(df2.columns)
[out]:
Index(['char', 'int', 'float'], dtype='object')

2. 索引的简单使用

2.1 列索引

选择一列：

print(df2['char'])
print(df2.char)
# 两种方式输出一样
[out]:
one      a
two      b
three    c
four     d
Name: char, dtype: object

注意此时方括号里面只传入一个字符串’char’，这样选出来的一列，结果的类型为Series

print(df2['char'])
print(df2.char)
# 两种方式输出一样
[out]:
one      a
two      b
three    c
four     d
Name: char, dtype: object

选择多列：

print(df2[['char', 'int']])
[out]: 
      char   int
one      a   10
two      b   20
three    c   30
four     d   40

注意此时方括号里面传入一个列表 [‘char’, ‘int’]，选出的结果类型为 DataFrame。
如果只想选出来一列，却想返回 DataFrame 类型怎么办？

print(df2[['char']])
[out]:
      char
one      a
two      b
three    c
four     d
---------------------------------------
type(df2[['char']])
[out]：pandas.core.frame.DataFrame

注意直接使用df2[0]取某一列会报错，除非columns是由下标索引组成的，比如df1那个样子，df1[0]就不会报错。

print(df1[0])
[out]:
0    a
1    b
2    c
3    d
Name: 0, dtype: object
-----------------------
print(df2[0])
[out]: 
KeyError: 0

2.2 行索引

2.2.1 使用[ ]

区别于选取列，此种方式[ ]中不再单独的传入一个字符串，而是需要使用冒号切片。

选取行标签从 ’two’ 到 ’three’ 的多行数据

print(df2['two': 'three'])
[out]:
      char  int  float
two      b   20    2.2
three    c   30    3.3

选取行标签为’two’这一行数据

# 此时返回的类型为DataFrame
print(df2['two': 'two'])
[out]:
      char  int  float
two      b   20    2.2

在[ ]中不仅可以传入行标签，还可以传入行的编号。

选取从第1行到第3行的数据(编号从0开始)

print(df2[1:4])
[out]:
      char  int  float
two      b   20    2.2
three    c   30    3.3
four     d   40    4.4

可以看到选取的数据是不包含方括号最右侧的编号所对应的数据的。

选取第1行的数据

print(df2[1:2])
[out]:
    char  int  float
two    b   20    2.2

2.2.2 使用.loc()和.iloc()

区别就是.loc()是根据行索引和列索引的值来选取数据，而.iloc()是根据从0开始的下标位置来进行索引的。

选取行：

使用.loc()

print(df2.loc['one'])
[out]:
char       a
int       10
float    1.1
Name: one, dtype: object
-------------------------------------------
print(df2.loc[['one', 'three']])
[out]:
      char  int  float
one      a   10    1.1
three    c   30    3.3

使用.iloc()

print(df2.iloc[0])
[out]:
char       a
int       10
float    1.1
Name: one, dtype: object
-------------------------------------------
print(df2.iloc[[0, 2]])
[out]:
      char  int  float
one      a   10    1.1
three    c   30    3.3

到此这篇关于python Pandas之DataFrame索引及选取数据的文章就介绍到这了,更多相关Python DataFrame索引内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

--结束END--

本文标题: python Pandas之DataFrame索引及选取数据

本文链接: https://lsjlt.com/news/119591.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

python Pandas之DataFrame索引及选取数据

目录1.索引是什么1.1 认识索引1.2 自定义索引2. 索引的简单使用2.1 列索引2.2 行索引2.2.1 使用[ ]2.2.2 使用.loc()和.iloc()1.索引是什么 ...

99+

2024-04-02
利用Pandas索引和选取数据方法详解

目录1. 导入数据集2. 列选择3. 行选择数字Index字符串Index4. 行+列选择，找到元素获取北汽2019年11月的销量获取前5个品牌从2019年10月到12月的销量5. ...

99+

2024-04-02
Python数据分析之 Pandas Dataframe条件筛选遍历详情

目录一、条件筛选二、Dataframe数据遍历for...in...语句iteritems()方法iterrows()方法itertuples()方法一、条件筛选查询Pandas ...

99+

2024-04-02
Python数据分析之Pandas Dataframe条件筛选遍历的方法

这篇文章主要介绍“Python数据分析之Pandas Dataframe条件筛选遍历的方法”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“Python数据分析之Pandas Dat...

99+

2023-06-30
Python数据分析之Pandas Dataframe怎么修改、删除及查询

这篇文章主要介绍“Python数据分析之Pandas Dataframe怎么修改、删除及查询”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“Python数据分析之Pandas Da...

99+

2023-06-30
Python数据分析之 Pandas Dataframe应用自定义

目录前言:应用函数apply 方法applymap 方法前言: 在进行数据分析时，难免需要对数据集应用一些我们自定义的一些函数，或者其他库的函数，得到我们想要的数据，这种情况下，可能...

99+

2024-04-02
Python数据分析之Pandas Dataframe如何自定义

今天小编给大家分享一下Python数据分析之Pandas Dataframe如何自定义的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们...

99+

2023-06-30
Pandas中DataFrame的基本操作之重新索引讲解

目录Pandas DataFrame之重新索引1.reindex可以对行和列索引2.reindex插值处理Pandas DataFrame重置索引案例Pandas DataFrame...

99+

2024-04-02
python数据分析之pandas数据选

　　Pandas是作为Python数据分析著名的工具包，提供了多种数据选取的方法，方便实用。本文主要介绍Pandas的几种数据选取的方法。　　Pandas中，数据主要保存为Dataframe和Series是数据结构，这两种数据结构数据...

99+

2023-01-30

数据 python pandas
Python数据分析之 Pandas Dataframe修改和删除及查询操作

目录一、查询操作元素的查询二、修改操作行列索引的修改元素值的修改三、行和列的删除操作一、查询操作可以使用Dataframe的index属性和columns属性获取行、列索引。 im...

99+

2024-04-02
Python pandas DataFrame数据拼接方法

目录前言DataFrame数据拼接方法一：使用.append()方法。DataFrame数据拼接方法二：使用.concat()方法。补充：Python同时合并多个DataF...

99+

2024-04-02
Python数据分析之pandas读取数据

一、三种数据文件的读取二、csv、tsv、txt 文件读取 1）CSV文件读取：语法格式：pandas.read_csv(文件路径) CSV文件内容如下： import pandas as pd file...

99+

2022-06-02

python pandas读取数据 pandas数据读取
Python数据分析之 Pandas Dataframe合并和去重操作

目录一、之 Pandas Dataframe合并二、去重操作一、之 Pandas Dataframe合并在数据分析中，避免不了要从多个数据集中取数据，那就避免不了要进行数据的合并，...

99+

2024-04-02
Python数据分析之Pandas Dataframe怎么合并和去重

这篇文章主要介绍“Python数据分析之Pandas Dataframe怎么合并和去重”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“Python数据分析之Pandas Dataf...

99+

2023-06-30
Pandas数据分析-pandas数据框的多层索引

目录前言创建多层索引多层索引操作索引名称的查看索引的层级索引内容的查看数据查询数据分组前言 pandas数据框针对高维数据...

99+

2024-04-02
Python数据分析Pandas Dataframe排序操作

目录1.索引的排序2.值的排序前言：数据的排序是比较常用的操作，DataFrame 的排序分为两种，一种是对索引进行排序，另一种是对值进行排序，接下来就分别介绍一下。 1.索引的排...

99+

2024-04-02
Python 之 Pandas DataFrame 数据类型的简介、创建的列操作

文章目录一、DataFrame 结构简介二、DataFrame 对象创建1. 使用普通列表创建2. 使用嵌套列表创建3 指定数值元素的数据类型为 float4. 字典嵌套列表创建5. 添加自...

99+

2023-08-31

pandas python 数据分析
Pandas筛选DataFrame含有空值的数据行的实现

目录数据准备1.筛选指定单列中有空值的数据行2.筛选指定多列中/全部列中满足所有列有空值的数据行 3.筛选指定多列中/全部列中满足任意一列有空值的数据行数据准备...

99+

2024-04-02
【Python】【pandas】打印 DataFrame 的每一列数据类型。

方法一：可以使用 dtypes 属性来打印 DataFrame 的每一列数据类型。dtypes 属性返回一个 Series，其中包含每个列的名称和对应的数据类型。以下是打印 DataFrame 每一列数据类型的示例代码： print(d...

99+

2023-09-04

python pandas 开发语言
python Pandas 读取数据，写

pandas 选取数据 iloc和 loc的用法不太一样，iloc是根据索引， loc是根据行的数值>>> import pandas as pd >>> import os >>> o...

99+

2023-01-31

数据 python Pandas