返回顶部
首页 > 资讯 > 后端开发 > Python >Python groupby函数图文详解
  • 300
分享到

Python groupby函数图文详解

2024-04-02 19:04:59 300人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

一、分组原理 核心: 1、不论分组键是数组、列表、字典、Series、函数,只要其与待分组变量的轴长度一致都可以传入groupby进行分组。 2、默认axis=0按行分组,可指定ax

一、分组原理

核心:

1、不论分组键是数组、列表、字典、Series、函数,只要其与待分组变量的轴长度一致都可以传入groupby进行分组。

2、默认axis=0按行分组,可指定axis=1对列分组。

groupby()语法格式

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, group_keys=True, squeeze=False,  observed=False, **kwargs)

groupby原理

groupby就是按XX分组,比如将一个数据集按A进行分组,效果如下

使用groupby实现功能

import numpy as np
import pandas as pd
 
data = pd.DataFrame({
    'name': ['Tom', 'Kaggle', 'Litter', 'Sam', 'Sam', 'Sam'],
    'race': ['B', 'C', 'D', 'E', 'B', 'C'],
    'age': [37.0, 61.0, 56.0, 87.0, 58.0, 34.0],
    'signs_of_mental_illness': [True, True, False, False, False, False]
})
 
data.groupby('race')

 返回结果如上  得到一个叫DataFrameGroupBy的东西,pandas不能直接显示出来 可以调用list显示出来

groupby()的配合函数 函数 适用场景备注.mean()均值.count()计数.min()最小值.mean().unstack()求均值,聚合表的层次索引不堆叠.size()计算分组大小GroupBy的size方法,将返回一个含有分组大小的Series.apply().agg()

这里演示.mean()和.count()

# mean()
data.groupby('name')['age'].mean()
# count()
data.groupby('name')['age'].count()
data.groupby('age').count()

 也可以根据单键多列进行聚合

# 单键多列聚合
data.groupby('name')[['race','age',]].count()

 .agg操作 可以取多个函数进行选择 有时候我们既需要平均值,有需要计数(也可是取一个)

agg为列表

print(data.groupby('name')['age'].agg(['mean']))
 
print(data.groupby('name')['age'].agg(['mean','count']))

也可以传入字典,对组内不同列采取不同的操作

print(data.groupby('race').agg({'age': np.median, 'signs_of_mental_illness': np.mean}))

.apply()

可以使用我们自己所创建的函数

print('apply之前')
grouped = data.groupby('name')
for name, group in grouped:
    print(name)
    print(group)
print('\n')
print('apply之后')
print(data.groupby('name').apply(lambda x: x.head(2)))

 简单操作基本介绍完成

有时候需要将聚合的另一列放到一起 并且取消键的重复值 这个时候可以这样做

上面是构建的数据,需要对订购时间进行处理,这里我们是将月份+天数/30,然后对ID列进行去重,并将后面Time列计算的结果放到一起

import numpy as np
import pandas as pd
 
 
data = pd.read_excel('订购时间预测2.xlsx')
def cut_m_d(x):
	return round(x.month + x.day / 30, 2)
 
data['m_d'] = data['Time'].apply(cut_m_d)
grouped = data.groupby('ID')
# 这一步是去重(ID),不去重会出现错误
result = grouped['m_d'].unique()
result2 = result.reset_index()
print(result2)

总结

到此这篇关于python groupby函数详解的文章就介绍到这了,更多相关groupby函数详解内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python groupby函数图文详解

本文链接: https://lsjlt.com/news/119239.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python groupby函数图文详解
    一、分组原理 核心: 1、不论分组键是数组、列表、字典、Series、函数,只要其与待分组变量的轴长度一致都可以传入groupby进行分组。 2、默认axis=0按行分组,可指定ax...
    99+
    2024-04-02
  • python中groupby()函数讲解
    # -*- coding: utf-8 -*- import pandas as pd import numpy as np df = pd.DataFrame({'key1':list('aabba'), ...
    99+
    2023-01-31
    函数 python groupby
  • Python中groupby函数详解(非常容易懂)
    目录:Python中的groupby函数 一、groupby 能做什么?二、单类分组2.1 创建数据集 三、多类分组 一、groupby 能做什么? groupby函数主要的作用是进行...
    99+
    2023-09-12
    python pandas groupby
  • 聚合函数和groupby的关系详解
    目录前言聚合函数介绍group by介绍解释聚合函数和group by的关系使用group by和聚合函数需要注意的地方总结前言 world:世界表格continent:大洲名称na...
    99+
    2024-04-02
  • python中groupby函数如何使用
    在Python中,groupby函数是通过pandas库的DataFrame对象使用的。该函数用于根据一个或多个列对数据进行分组。下...
    99+
    2023-09-20
    python
  • Pandas数据分析之groupby函数用法实例详解
    目录正文一、了解groupby二、数据文件简介三、求各个商品购买量四、求各个商品转化率五、转化率最高的30个商品及其转化率小小の总结正文 今天本人在赶学校课程作业的时候突然发现gro...
    99+
    2024-04-02
  • pytorch中的torch.nn.Conv2d()函数图文详解
    目录一、官方文档介绍二、torch.nn.Conv2d()函数详解参数dilation——扩张卷积(也叫空洞卷积)参数groups——...
    99+
    2024-04-02
  • Oracle中pivot函数图文实例详解
    目录【基本介绍】【准备样例数据】【样例展示1】【样例展示2】【样例展示3】【样例展示4】【样例展示5】【样例展示6】总结【基本介绍】 【格式】:pivot(聚合函数 for 需要转为列的字段名 in(需要转为列的字段值)...
    99+
    2023-05-12
    oracle行转列函数pivot oracle pivot oracle pivot函数
  • 图文详解Python中最神秘的一个魔法函数
    目录前言1、有点价值的missing()2、神出鬼没的missing()3、被施魔法的missing()4、小结5、总结前言 一个非常神秘的魔术方法。 这个方法非常不起眼,用途狭窄,...
    99+
    2024-04-02
  • Python文件读写open函数详解
    前言: open()函数的定义:def open(file, mode='r', buffering=None, encoding=None, errors=None...
    99+
    2024-04-02
  • 一文详解Python中的super 函数
    目录实战场景实战编码单继承使用实战场景 经常有朋友问,学 Python 面向对象时,翻阅别人代码,会发现一个 super() 函数,那这个函数的作用到底是什么? super() 函数...
    99+
    2024-04-02
  • python函数详解
    结构:    def  函数名():        函数体执行:    函数名()返回值:    return    一,函数中,遇到return终止函数    二,返回值,返回给了函数的调用者:函数名()    return单个值,返回单...
    99+
    2023-01-31
    详解 函数 python
  • C++函数重载的细节图文详解
    前言:如果不想看论证,可以直接点击总结,跳转到最后 1、使用重载函数时,如果数据类型不匹配,C++尝试使用类型转换与形参进行匹配,如果转换后有多个函数能匹配上,编译器将报错; 论证如...
    99+
    2022-12-10
    c++函数重载例子 C++函数重载是什么 重载函数怎么写
  • 图文详解vue中proto文件的函数调用
    1、编译proto 在src文件夹下新建proto文件夹用以存放所有的.proto文件。在proto文件夹下打开终端,输入如下命令: //进入proto文件夹执行下列编译,将he...
    99+
    2024-04-02
  • Python Matplotlib绘制箱线图boxplot()函数详解
    目录箱线图boxplot()函数还提供了丰富的自定义选项箱线图通常用在多组数据比较时补充:plt.boxplot()函数绘制箱图、常用方法实战常用方法总结 箱线图 箱线图一...
    99+
    2024-04-02
  • python DataFrame数据分组统计groupby()函数的使用
    目录groupby()函数1. groupby基本用法1.1 一级分类_分组求和1.2 二级分类_分组求和1.3 对DataFrameGroupBy对象列名索引(对指定列统计计算)2...
    99+
    2024-04-02
  • Python数据库sqlite3图文实例详解
    目录前言SQLite3数据库1.需要的模块(只有一个)2.模块的使用2.1创建与数据库的连接2.2创建游标2.3创建 table2.4插入数据2.5查找数据快乐的coding时间!最后前言 提到数据库,大家第一时间想到的...
    99+
    2024-04-02
  • SQL注入报错注入函数图文详解
    目录前言常用报错函数用法详解updateXML()函数实例extractvalue()函数floor()函数exp()函数12种报错注入函数总结前言 报错注入的前提是当语句发生错误时,错误信息被输出到前端。其漏...
    99+
    2022-07-08
    sql注入解决方法 sql注入 报错注入 sql报错注入原理
  • python imread函数详解
    Python 中各种imread函数的区别与联系 最近一直在用python做图像处理相关的东西,被各种imread函数搞得很头疼,因此今天决定将这些imread总结一下,以免以后因此犯些愚蠢的错误。如果你正好也对此感...
    99+
    2022-06-02
    python imread函数 python imread函数讲解
  • Python isalpha()函数详解
    「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:小白零基础《Python入门到精通》 isalpha...
    99+
    2023-10-23
    python 网络安全 人工智能 机器学习
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作