返回顶部
首页 > 资讯 > 精选 >有哪些Pandas小窍门
  • 557
分享到

有哪些Pandas小窍门

2023-06-16 02:06:37 557人浏览 安东尼
摘要

本篇内容主要讲解“有哪些pandas小窍门”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“有哪些Pandas小窍门”吧!用剪贴板创建数据框众所周知,Pandas可以使用sqlAlchemy从CSV

本篇内容主要讲解“有哪些pandas小窍门”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“有哪些Pandas小窍门”吧!

用剪贴板创建数据框

众所周知,Pandas可以使用sqlAlchemy从CSV、JSON甚至直接从数据库轻松读取数据,但你知道Pandas还可以从所用操作系统的剪贴板读取数据吗?假设有一个包含多个数据表的excel文件。现在,需要在python中处理其中一个表的部分数据。你通常会怎么做?

  • 从数据表中复制需要在Python中处理的数据。

  • 将其粘贴到另一个数据表中。

  • 将当前工作表保存到CSV文件中。

  • 获取新CSV文件的路径。

  • 在Python中,使用pd.read_csv('path/to/csv/file')将文件读入一个Pandas数据框架

当然,其实有种更简单的方法——pd.read_clipboard()。

  • 复制所需数据区域

  • 在Python中,使用pd.read_clipboard()

有哪些Pandas小窍门

如上所示,如果只是想要将一些数据加载到Pandas中,那么无需CSV或Excel的分离文件。

在该函数中还有一些小窍门。例如,当遇到带有日期格式的数据时,可能无法正确加载,如下所示:

有哪些Pandas小窍门

诀窍就是,为Pandas注明哪一列是需要解析的日期格式。

df = pd.read_clipboard(parse_dates=['dob'])

有哪些Pandas小窍门

使用测试方法生成虚拟数据

有时可能需要生成一些样本数据帧,最常见的方法应该是使用NumPy生成一个具有随机值的数组,然后从该数组生成数据帧。

如果数据需要具有一定的分布,比如正态分布,就必须使用这种方法。但是,大多数情况下,数据是否呈正态分布并不重要,只要有数据就好。在这种情况下,有一种更简单的方法,即使用pandas.util.testing测试包生成样本数据帧。

pd.util.testing.makeDataFrame()

数据帧的索引将使用随机字符串生成,默认情况下将有4列30行。

有哪些Pandas小窍门

如果需要数量相当的行和列,可以将testing.N定义为行数,并将testing.K定义为列数。

pd.util.testing.N = 10 pd.util.testing.K = 5 pd.util.testing.makeDataFrame()

有哪些Pandas小窍门

将数据帧输出至压缩文件

有哪些Pandas小窍门

图源:unsplash

数据帧可以轻松输出至文件,例如以df.to_csv()、df.to_json()等形式。但有时,为节省磁盘空间或另作它用,需要压缩文件。例如,作为一名数据工程师,为了将Pandas数据帧输出到CSV文件中,并将其传输到远程服务器,在发送前需要压缩文件以节省空间和带宽。

通常,一贯的解决方案是在所用调度工具(如airflow或Oozie)中多操作一步,但Pandas可以直接输出压缩文件。所以,解决方案几步就可完成,更加简洁明了。

先使用第二个小窍门生成随机数据帧吧:

pd.util.testing.N = 100000 pd.util.testing.K = 5 df = pd.util.testing.makeDataFrame()

有哪些Pandas小窍门

在该例子中,仅需要一个数据框架,其中的值可完全不计。现在,将数据帧保存到一个CSV文件中,并检查其大小。

import osdf.to_csv('sample.csv')os.path.getsize('sample.csv')

有哪些Pandas小窍门

然后,可以试试将相同的数据帧输出到压缩文件中,并检查文件的大小。

df.to_csv('sample.csv.gz', compression='gzip')os.path.getsize('sample.csv.gz')

有哪些Pandas小窍门

可以看到,压缩文件小于正常CSV文件的一半。

这可能不是一个好例子,因为该随机数据帧中没有任何重复值。在实践中,如果存在分类值,压缩率会非常高!顺便一提,如你所想,Pandas可以直接将压缩文件读入数据帧,无须在文件系统中解压它。

df = pd.read_csv('sample.csv.gz', compression='gzip', index_col=0)

有哪些Pandas小窍门

gzip是优先选择,因为它默认存在于大多数linux系统中。Pandas还支持其它压缩格式,比如“zip”和“bz2”。

多列获取DateTime(时间日期)

有哪些Pandas小窍门

图源:unsplash

在Pandas中,你一定用过pd.to_datetime()方法将某种字符串转换为DateTime格式,这通常用于处理诸如%Y%m%d的格式字符串。然而,也有时可能会使用下方所示的数据框架作为原始数据。

df = pd.DataFrame({     'year': np.arange(2000, 2012),     'month': np.arange(1, 13),     'day': np.arange(1, 13),     'value': np.random.randn(12) })

有哪些Pandas小窍门

在数据框架中,将年、月、日作为单独列分隔开来屡见不鲜,可以使用pd.to_dateframe()将其一步转换为DateTime列。

df['date'] = pd.to_datetime(df[['year', 'month', 'day']])

有哪些Pandas小窍门

到此,相信大家对“有哪些Pandas小窍门”有了更深的了解,不妨来实际操作一番吧!这里是编程网网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

--结束END--

本文标题: 有哪些Pandas小窍门

本文链接: https://lsjlt.com/news/282163.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 有哪些Pandas小窍门
    本篇内容主要讲解“有哪些Pandas小窍门”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“有哪些Pandas小窍门”吧!用剪贴板创建数据框众所周知,Pandas可以使用SQLAlchemy从CSV...
    99+
    2023-06-16
  • 有哪些Python小窍门
    这篇文章主要讲解了“有哪些Python小窍门”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“有哪些Python小窍门”吧!1. F-StringsF-Strings提供了一种简便的方法,可以将...
    99+
    2023-06-16
  • 有哪些Python编程窍门
    这篇文章主要讲解了“有哪些Python编程窍门”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“有哪些Python编程窍门”吧!1、正交性正交性是编程的一个重要原则。在设计优良的系统中,数据库代...
    99+
    2023-06-16
  • JavaScript前端性能优化小窍门有哪些
    这篇文章主要讲解了“JavaScript前端性能优化小窍门有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“JavaScript前端性能优化小窍门有哪些”...
    99+
    2024-04-02
  • 做SEO优化的小诀窍有哪些
    这篇文章将为大家详细讲解有关做SEO优化的小诀窍有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。通过对手获得外链资源外链资源对每一个站长都是一个秘密,没有任何一个SEO站长会把好的资源拿出来分享,所以...
    99+
    2023-06-10
  • 有哪些租用高防服务器的窍门
    租用高防服务器的窍门有:1、根据自身的业务规模和所涉及到的范围租用合适的高防服务器配置,不盲目追求更高的服务器配置;2、选择好的idc高仿服务器提供商,了解服务商的各种资质和服务可信度。具体内容如下:配置情况配置的好坏决定了使用的高防服务器...
    99+
    2024-04-02
  • 租用高防服务器的窍门有哪些
    租用高防服务器可以帮助保护您的网站或应用免受DDoS攻击的影响。以下是一些租用高防服务器的窍门: 选择可靠的高防服务器提供商:确...
    99+
    2024-04-02
  • Python函数变量在应用中的窍门有哪些
    今天就跟大家聊聊有关Python函数变量在应用中的窍门有哪些,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。Python函数变量还是比较常用的,于是我研究了一下在python如何编写P...
    99+
    2023-06-17
  • git使用的小窍门是什么
    本篇文章给大家分享的是有关git使用的小窍门是什么,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。git(读音为/gɪt/。)是一个开源的分布式版本控制系统可以有效、高速地处理从...
    99+
    2023-06-28
  • html5冷门小知识有哪些
    这篇文章将为大家详细讲解有关html5冷门小知识有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。 HTML是Web同一语言,这些容纳在尖...
    99+
    2024-04-02
  • 使用NumPy进行数据分析的技巧和窍门有哪些?
    NumPy是一个Python科学计算的基础库,它提供了高性能的多维数组对象以及相应的操作函数,是Python数据分析的重要工具之一。本文将介绍NumPy中常用的数据分析技巧和窍门,并提供相关代码示例。 创建NumPy数组 NumPy数...
    99+
    2023-06-17
    教程 编程算法 numy
  • Pandas函数有哪些
    本篇内容介绍了“Pandas函数有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1.安装如果想自己运行...
    99+
    2024-04-02
  • numpy版本查看的小技巧和窍门
    numpy是Python中非常常用的数学库,广泛应用于科学计算领域,支持大量的数值计算、线性代数、随机数生成以及傅里叶变换等功能。而在使用numpy进行数学计算时,经常需要确定numpy的版本及其特性,针对不同版本的numpy进...
    99+
    2024-01-19
    查看技巧 窍门 numpy版本
  • pandas的优点有哪些
    本篇内容主要讲解“pandas的优点有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“pandas的优点有哪些”吧!下面是一个例子,数据获取方式见文末。>>> im...
    99+
    2023-06-15
  • Pandas使用技巧有哪些
    小编给大家分享一下Pandas使用技巧有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1.行的条件选择首先,数据探索是必要步骤。Pandas为进行各种分析提供...
    99+
    2023-06-27
  • pandas常规操作有哪些
    这篇文章主要介绍了pandas常规操作有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一 聚合函数1. numpy、pandas使用的统计方式在数组中经常使用的聚合方式d...
    99+
    2023-06-27
  • pandas去重有哪些方法
    pandas去重的方法有:1、使用drop_duplicates()方法;2、使用duplicated()方法;3、使用unique()方法;4、使用value_counts()方法。详细介绍:1、使用drop_duplicates()方法...
    99+
    2023-11-22
    Pandas 去重
  • pandas排序有哪些方法
    pandas排序的方法有:1、使用sort_values()方法;2、使用sort_index()方法;3、使用order()方法;4、使用sort()方法;5、使用nlargest()和nsmallest()方法等。详细介绍:1、使用so...
    99+
    2023-11-22
    Pandas 排序
  • 使用PHP开发技术创建二维码数组:有哪些技巧和窍门?
    二维码是一种矩阵条形码,可以储存大量信息。在现代生活中,二维码已经广泛应用于各种场景,例如支付、扫码登录、商品信息等等。在本文中,我们将介绍如何使用PHP开发技术创建二维码数组,并分享一些技巧和窍门。 一、使用PHP QR Code库 P...
    99+
    2023-06-02
    开发技术 二维码 数组
  • PHP编程小窍门:掌握trim函数有效去除中文空格
    PHP编程小窍门:掌握trim函数有效去除中文空格 在PHP编程中,经常会遇到需要处理字符串中的空格的情况。而在处理中文字符串时,有时会遇到中文空格的问题,这就需要我们熟练掌握PHP中...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作