返回顶部
首页 > 资讯 > 后端开发 > Python >【Python实用基础整合(二)】DataFrame是否为空判断及行/列差值、变化率计算
  • 430
分享到

【Python实用基础整合(二)】DataFrame是否为空判断及行/列差值、变化率计算

python数学建模开发语言 2023-09-06 14:09:36 430人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

一、DataFrame是否为空 判断整个DataFrame是否为空的方法: pandas.DataFrame.empty 示例: df = pd.DataFrame({'fruits':['appl


一、DataFrame是否为空

判断整个DataFrame是否为空的方法:

pandas.DataFrame.empty

示例:

df = pd.DataFrame({'fruits':['apple', 'orange', 'watermelon'], 'price':[6, 4, 2]})df       fruits  price0       apple      61      orange      42  watermelon      2if df.empty:    print('=== df为空 ===')else:    print('=== df非空 ===')  # === df非空 ===df_empty = pd.DataFrame(columns=['fruits', 'price'])df_emptyEmpty DataFrameColumns: [fruits, price]Index: []if df_empty.empty:    print('=== df_empty为空 ===')  # === df_empty为空 ===else:    print('=== df_empty非空 ===') 

而判断具体某个元素是否为NAN,则可以使用isna()函数:

df = pd.DataFrame({'fruits':['apple', 'orange', 'watermelon'], 'price':[6, 4, 2]})df       fruits  price0       apple      61      orange      42  watermelon      2df.isna()   fruits  price0   False  False1   False  False2   False  False

或者使用空值的特征判断(NAN的一大特征就是不等于本身):

np.nan != np.nanTrue

二、DataFrame行/列差值计算

计算DataFrame行/列的差值使用:

DataFrame.diff(periods=1, axis=0)

其中,

  • periods:默认值是1,表示两行/列的索引之差,即平移的区间,periods为正整数表示索引大的行/列减去索引小的,反之;
  • axis:运算的轴,默认为0,表示按照行进行计算,axis=1,表示按照列进行计算。

示例:

2.1 periods示例

df = pd.DataFrame({'price':[6, 4, 2, 4, 6], 'weight': [12, 43, 23, 3, 5], 'total':[72, 172, 46, 12, 30]})df   price  weight  total0      6      12     721      4      43    1722      2      23     463      4       3     124      6       5     30# 默认对行操作,periods=1表示后一行减前一行df.diff(periods=1)   price  weight  total0    NaN     NaN    NaN1   -2.0    31.0  100.02   -2.0   -20.0 -126.03    2.0   -20.0  -34.04    2.0     2.0   18.0# periods=2表示做差的两行间相隔一行df.diff(periods=2)   price  weight  total0    NaN     NaN    NaN1    NaN     NaN    NaN2   -4.0    11.0  -26.03    0.0   -40.0 -160.04    4.0   -18.0  -16.0# 默认对行操作,periods=-1表示前一行减后一行df.diff(periods=-1)   price  weight  total0    2.0   -31.0 -100.01    2.0    20.0  126.02   -2.0    20.0   34.03   -2.0    -2.0  -18.04    NaN     NaN    NaN

2.2 axis示例

df   price  weight  total0      6      12     721      4      43    1722      2      23     463      4       3     124      6       5     30# axis=0表示对行操作df.diff(periods=1, axis=0)   price  weight  total0    NaN     NaN    NaN1   -2.0    31.0  100.02   -2.0   -20.0 -126.03    2.0   -20.0  -34.04    2.0     2.0   18.0# axis=1表示对列操作df.diff(periods=1, axis=1)   price  weight  total0    NaN       6     601    NaN      39    1292    NaN      21     233    NaN      -1      94    NaN      -1     25

三、DataFrame行/列变化率计算

计算DataFrame中行/列的变化率时使用函数:

pd.DataFrame.pct_change(periods, fill_method, limit, freq, **kwargs)

参数含义:

  • periods : int类型,默认为1,含义同diff函数中的periods
  • fill_method : str类型, 默认为’pad’,表示在计算变化率之前如何处理空值。'pad’表示使用前一个值进行缺失值填充;
  • limit : int类型, 默认为None,表示填充的最大NA的数量,如果NA的数量大于limit,那么停止填充NA元素;
  • freq : DateOffset, timedelta, 或者 str类型,可选参数,表示时间序列 api 中使用的增量(例如“M”或BDay());
  • **kwargs,其他传递到 DataFrame.shiftSeries.shift的关键字参数。

函数返回值类型与调用对象一致,为Series或者DataFrame。

Examples:

-----------**Series**-----------        >>> s = pd.Series([90, 91, 85])        >>> s        0    90        1    91        2    85        dtype: int64        >>> s.pct_change()        0         NaN        1    0.011111        2   -0.065934        dtype: float64        >>> s.pct_change(periods=2)        0         NaN        1         NaN        2   -0.055556        dtype: float64        # 存在空值时,使用前一个有效值先填充后再计算        >>> s = pd.Series([90, 91, None, 85])        >>> s        0    90.0        1    91.0        2     NaN        3    85.0        dtype: float64        >>> s.pct_change(fill_method='ffill')        0         NaN        1    0.011111        2    0.000000        3   -0.065934        dtype: float64---------------**DataFrame**---------------        >>> df = pd.DataFrame({        ...     'FR': [4.0405, 4.0963, 4.3149],        ...     'GR': [1.7246, 1.7482, 1.8519],        ...     'IT': [804.74, 810.01, 860.13]},        ...     index=['1980-01-01', '1980-02-01', '1980-03-01'])        >>> df                        FR      GR      IT        1980-01-01  4.0405  1.7246  804.74        1980-02-01  4.0963  1.7482  810.01        1980-03-01  4.3149  1.8519  860.13        >>> df.pct_change()                          FR        GR        IT        1980-01-01       NaN       NaN       NaN        1980-02-01  0.013810  0.013684  0.006549        1980-03-01  0.053365  0.059318  0.061876                # 对列进行变化百分比计算,同时periods=-1表示前一列相对后一列的变化率        >>> df = pd.DataFrame({        ...     '2016': [1769950, 30586265],        ...     '2015': [1500923, 40912316],        ...     '2014': [1371819, 41403351]},        ...     index=['GoOG', 'APPL'])        >>> df                  2016      2015      2014        GOOG   1769950   1500923   1371819        APPL  30586265  40912316  41403351                >>> df.pct_change(axis='columns', periods=-1)                  2016      2015  2014        GOOG  0.179241  0.094112   NaN        APPL -0.252395 -0.011860   NaN

【述毕】

笔者独自运营了微信公众号,用于分享个人学习及工作生活趣事,大家可以关注一波。(微信搜索“微思研”)

来源地址:https://blog.csdn.net/weixin_44237659/article/details/131055002

--结束END--

本文标题: 【Python实用基础整合(二)】DataFrame是否为空判断及行/列差值、变化率计算

本文链接: https://lsjlt.com/news/397114.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作