返回顶部
首页 > 资讯 > 后端开发 > Python >python中pd.cut()与pd.qcut()的对比及示例
  • 936
分享到

python中pd.cut()与pd.qcut()的对比及示例

2024-04-02 19:04:59 936人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

目录1、pd.cut()2、pd.qcut()3、pd.cut() v.s. pd.qcut()1、pd.cut() 用于将数据值按照值本身进行分段并排序到 bins 中。参数包含:

1、pd.cut()

用于将数据值按照值本身进行分段并排序到 bins 中。
参数包含:x, bins, right, include_lowest, labels, retbins, precision

x :被划分的数组
bins :被划分的区间/区间数

  • - ① 当 bins 为整数时,表示数组 x 被划分为多少个等间距的区间;
  • - ② 当 bins 为序列时,表示数组 x 将被划分在该指定序列中,若不在则输出 NaN;
# x = [1,2,3,5,3,4,1],  bins = 3
[In ] pd.cut(np.array([1,2,3,5,3,4,1]),3)  
[Out] [(0.996, 2.333], (0.996, 2.333], (2.333, 3.667], (3.667, 5.0], (2.333, 3.667], (3.667, 5.0], (0.996, 2.333]]
      CateGories (3, interval[float64]): [(0.996, 2.333] < (2.333, 3.667] < (3.667, 5.0]]

# x = [1,2,3,5,3,4,1],  bins = [1,2,3]
[In ] pd.cut(np.array([1,2,3,5,3,4,1]),[1,2,3])
[Out] [NaN, (1.0, 2.0], (2.0, 3.0], NaN, (2.0, 3.0], NaN, NaN]
      Categories (2, interval[int64]): [(1, 2] < (2, 3]]

right :是否包含右端点,默认为 True;
include_lowest :是否包含左端点,默认为 False;

# x = [1,2,3,5,3,4,1],  bins = [1,2,3], 默认不包含左端点 1,默认包含右端点 3
[In ] pd.cut(np.array([1,2,3,5,3,4,1]),[1,2,3])
[Out] [NaN, (1.0, 2.0], (2.0, 3.0], NaN, (2.0, 3.0], NaN, NaN]
      Categories (2, interval[int64]): [(1, 2] < (2, 3]]

# x = [1,2,3,5,3,4,1],  bins = [1,2,3], 设置包含左端点 1,设置包含右端点 3
[In ] pd.cut(np.array([1,2,3,5,3,4,1]),[1,2,3],include_lowest=True,right=False)
[Out] [[1.0, 2.0), [2.0, 3.0), NaN, NaN, NaN, NaN, [1.0, 2.0)]
      Categories (2, interval[int64]): [[1, 2) < [2, 3)]

labels :是否用标记来替代返回的 bins,默认为 False,如需标记,标记数需与 bins 数一致,并为 labels 赋值一组列表;

# x = [1,2,3,5,3,4,1],  bins = 3, 设置用指定标签 ['A','B','C'] 返回序列
[In ] pd.cut(np.array([1,2,3,5,3,4,1]),3,labels=['A','B','C'])
[Out] [A, A, B, C, B, C, A]
      Categories (3, object): [A < B < C]

retbins : 是否返回间距 bins,默认为 False,仅返回 x 中每个值对应的 bin 的列表,若 retbins = True,则返回 bin 的列表及对应的 bins。

# x = [1,2,3,5,3,4,1],  bins = 3, 设置一并返回对应 bins 序列
[In ] pd.cut(np.array([1,2,3,5,3,4,1]),3,retbins=True)
[Out] ([(0.996, 2.333], (0.996, 2.333], (2.333, 3.667], (3.667, 5.0], (2.333, 3.667], (3.667, 5.0], (0.996, 2.333]]
      Categories (3, interval[float64]): [(0.996, 2.333] < (2.333, 3.667] < (3.667, 5.0]],
      array([0.996     , 2.33333333, 3.66666667, 5.        ]))

precision : 精度,区间边界值保留的小数点位数

# x = [1,2,3,5,3,4,1],  bins = 3, 精度为2
[In ] pd.cut(np.array([1,2,3,5,3,4,1]),3,precision=2)
[Out] [(1.0, 2.33], (1.0, 2.33], (2.33, 3.67], (3.67, 5.0], (2.33, 3.67], (3.67, 5.0], (1.0, 2.33]]
      Categories (3, interval[float64]): [(1.0, 2.33] < (2.33, 3.67] < (3.67, 5.0]]

2、pd.qcut()

基于分位数的离散化功能。 根据等级或基于样本分位数(或者说基于样本值落在区间的频率),将变量分离为相等大小的桶。

参数包含:x, q, labels, retbins, precision, duplicates

  • x、labels、retbins、precision 与 pd.cut() 中参数用法一致;
  • q : 将序列 x 划分为 q 个区间,使落在每个区间的值的数量一致;
  • duplicates :重复值处理,默认为 duplicates = ‘raise’,表示不忽略重复值。如需忽略 x 中的重复值,可指定 duplicates = ‘drop’。

3、pd.cut() v.s. pd.qcut()

  • pd.cut() 将指定序列 x,按指定数量等间距的划分(根据值本身而不是这些值的频率选择均匀分布的bins),或按照指定间距划分
  • pd.qcut() 将指定序列 x,划分为 q 个区间,使落在每个区间的记录数一致
[In] ll = [1,2,3,5,3,4,1,2]
     print('- - - pd.cut()示例1 - - -')
     print(pd.cut(ll, 4, precision=2).value_counts())
     print('- - - pd.cut()示例2 - - -')
     print(pd.cut(ll, [1,2,4], precision=2).value_counts())
     print('- - - pd.qcut()示例 - - -')
     print(pd.qcut(ll, 4, precision=2).value_counts())

[Out] - - - pd.cut()示例1 - - -
     (1.0, 2.0]    4
     (2.0, 3.0]    2
     (3.0, 4.0]    1
     (4.0, 5.0]    1
     dtype: int64
     - - - pd.cut()示例2 - - -
     (1, 2]    2
     (2, 4]    3
     dtype: int64
     - - - pd.qcut()示例 - - -
     (0.99, 1.75]    2
     (1.75, 2.5]     2
     (2.5, 3.25]     2
     (3.25, 5.0]     2
     dtype: int64

到此这篇关于python中pd.cut()与pd.qcut()的对比及示例的文章就介绍到这了,更多相关Python pd.cut()与pd.qcut()内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: python中pd.cut()与pd.qcut()的对比及示例

本文链接: https://lsjlt.com/news/118712.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python中pd.cut()与pd.qcut()的对比及示例
    目录1、pd.cut()2、pd.qcut()3、pd.cut() v.s. pd.qcut()1、pd.cut() 用于将数据值按照值本身进行分段并排序到 bins 中。参数包含:...
    99+
    2024-04-02
  • mongodb与redis的对比示例
    这篇文章主要介绍mongodb与redis的对比示例,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!什么是redis?Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内...
    99+
    2024-04-02
  • nodejs中Express与Koa2对比的示例分析
    这篇文章给大家分享的是有关nodejs中Express与Koa2对比的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1、先说结论目前没有看到Express会被koa2取代...
    99+
    2024-04-02
  • Redis集群架构及对比的示例
    小编给大家分享一下Redis集群架构及对比的示例,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1、Redis3.0·  ...
    99+
    2024-04-02
  • ES6之map、set与数组、对象的对比示例
    这篇文章给大家分享的是有关ES6之map、set与数组、对象的对比示例的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。前言ES5中的数据结构,主要是用Array和Object。在E...
    99+
    2024-04-02
  • 构造器与java方法的对比示例
    这篇文章主要介绍了构造器与java方法的对比示例,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。Java的优点是什么1. 简单,只需理解基本的概念,就可以编写适合于各种情况的应...
    99+
    2023-06-14
  • python中pandas.DataFrame对行与列求和及添加新行与列示例
    本文介绍的是python中pandas.DataFrame对行与列求和及添加新行与列的相关资料,下面话不多说,来看看详细的介绍吧。 方法如下: 导入模块: from pandas import Data...
    99+
    2022-06-04
    示例 python pandas
  • Python与sed,grep文本查找效率对比的示例分析
    小编给大家分享一下Python与sed,grep文本查找效率对比的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!测试文本:20w行,21M大 python...
    99+
    2023-06-13
  • Kotlin与Java主客观对比的示例分析
    这篇文章将为大家详细讲解有关Kotlin与Java主客观对比的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。KotlinKotlin是一门相对比较新的JVM语言,JetBrains自2011年以来...
    99+
    2023-05-30
    kotlin java
  • Python3之enumrate和range对比及示例分析
    Python3之enumrate和range对比及示例分析,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。Python3之enumrate和range对比及示例前言在Python...
    99+
    2023-06-02
  • Java中对象比较的示例分析
    这篇文章主要介绍了Java中对象比较的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。元素比较基本类型的比较在Java中,基本类型的对象可以直接比较大小public&n...
    99+
    2023-06-29
  • JS对象数组去重的3种方法示例及对比
    目录一.去重前后数据对比二.使用方法1.使用filter和Map2.使用reduce3.使用for循环三.2400条数据,三种方法处理时间对比总结一.去重前后数据对比 // 原数...
    99+
    2024-04-02
  • Python2与Python 3的对比
    首发 http://www.everlose.info/notes/2013/10/31/difference-between-python3-to-python2/ 这篇文章总结了一些与Python2.6相比Python3.0中的新特性...
    99+
    2023-01-31
    Python
  • VB.NET语言与VB语言对比的示例分析
    小编给大家分享一下VB.NET语言与VB语言对比的示例分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!VB.NET语法对比旧语法 新语法 说明窗体装载事件,类初始化事件 Sub New procedure Sub New...
    99+
    2023-06-17
  • mysql中InnoDB和MyISAM对比的示例分析
    这篇文章主要介绍了mysql中InnoDB和MyISAM对比的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。事务:InnoDB 是事务型的,可以使用 Commit 和...
    99+
    2023-06-14
  • Python中对象的引用与复制代码示例
    可以说Python没有赋值,只有引用。你这样相当于创建了一个引用自身的结构,所以导致了无限循环。为了理解这个问题,有个基本概念需要搞清楚。 Python没有「变量」,我们平时所说的变量其实只是「标签」,是引...
    99+
    2022-06-04
    示例 对象 代码
  • python数字图像处理之对比度与亮度调整示例
    目录skimage包的exposure模块1、gamma调整2、log对数调整3、判断图像对比度是否偏低4、调整强度skimage包的exposure模块 图像亮度与对比度的调整,是...
    99+
    2024-04-02
  • Python中的getter与setter及deleter使用示例讲解
    目录原始代码使用getter和setter的代码getter和setter的实战用法如何添加getter和setter官方给出的规范代码示例假如我们需要写一个矩形的类,对象属性包括矩...
    99+
    2023-01-12
    Python getter Python setter Python deleter
  • mysql结构对比的示例分析
    小编给大家分享一下mysql结构对比的示例分析,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!小工具原由日常开发经常遇到数据库结构变更,但是不能实时记录下来,上线以后会造成测试和线上的数据库机构...
    99+
    2024-04-02
  • .py和.ipynb对比的示例分析
    小编给大家分享一下.py和.ipynb对比的示例分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!1. 相同点用Python语言编写的源代码文件,其文件后缀是 “.py” 或 “.ipynb”。用Python语言编写的源代...
    99+
    2023-06-14
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作