返回顶部
首页 > 资讯 > 后端开发 > Python >几行代码让Python函数执行快30倍
  • 385
分享到

几行代码让Python函数执行快30倍

2024-04-02 19:04:59 385人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

目录1、python 多线程处理的基本指南2、多处理入门3、它为什么如此重要?4、实现5、基准测试Python 是一种流行的编程语言,也是数据科学社区中最受欢迎的语言。与其他流行编程

Python 是一种流行的编程语言,也是数据科学社区中最受欢迎的语言。与其他流行编程语言相比,Python 的主要缺点是它的动态特性和多功能属性拖慢了速度表现。Python 代码是在运行时被解释的,而不是在编译时被编译为原生代码。

1、Python 多线程处理的基本指南

C 语言的执行速度比 Python 代码快 10 100 倍。但如果对比开发速度的话,Python 比 C 语言要快。对于数据科学研究来说,开发速度远比运行时性能更重要。由于存在大量 api框架和包,Python 更受数据科学家和数据分析师的青睐,只是它在性能优化方面落后太多了。

2、多处理入门

考虑一个单核心 CPU,如果它被同时分配多个任务,就必须不断地中断当前执行的任务并切换到下一个任务才能保持所有进程正常运行。对于多核处理器来说,CPU 可以在不同内核中同时执行多个任务,这一概念被称为并行处理。

3、它为什么如此重要?

数据整理、特征工程和数据探索都是数据科学模型开发管道中的重要元素。在输入机器学习模型之前,原始数据需要做工程处理。对于较小的数据集来说,执行过程只需几秒钟就能完成;但对于较大的数据集而言,这项任务就比较繁重了。

并行处理是提高 Python 程序性能的一种有效方法。Python 有一个多处理模块,让我们能够跨 CPU 的不同内核并行执行程序。

4、实现

我们将使用来自 multiprocessing 模块的 Pool 类,针对多个输入值并行执行一个函数。这个概念称为数据并行性,它是 Pool 类的主要目标。

我将使用从 Kaggle 下载的 Quora 问题对相似性数据 集来演示这个模块。

上述数据集包含了很多在 Quora 平台上提出的文本问题。我将在一个 Python 函数上执行多处理模块,这个函数通过删除停用词、删除 html 标签、删除标点符号、词干提取等过程来处理文本数据。

preprocess() 就是执行上述文本处理步骤的函数。

可以在 这里 找到托管在我的 GitHub 上的函数 preprocess() 的代码片段。
现在,我们使用 multiprocessing 模块中的 Pool 类为数据集的不同块并行执行该函数。数据集的每个块都将并行处理。


import multiprocessing
from functools import partial
from QuoraTextPreprocessing import preprocess

BUCKET_SIZE = 50000

def run_process(df, start):
    df = df[start:start+BUCKET_SIZE]
    print(start, "to ",start+BUCKET_SIZE)
    temp = df["question"].apply(preprocess)

chunks  = [x for x in range(0,df.shape[0], BUCKET_SIZE)]   
pool = multiprocessing.Pool()
func = partial(run_process, df)
temp = pool.map(func,chunks)
pool.close()
pool.join()

该数据集有 537,361 条记录(文本问题)需要处理。对于 50,000 的桶大小,数据集被分成 11 个较小的数据块,这些块可以并行处理以加快程序的执行时间。

5、基准测试

人们常问的问题是使用多处理模块后执行速度能快多少。我在实现了数据并行性,对整个数据集执行一次 preprocess() 函数后对比了基准执行时间。

运行测试的机器有 64GB 内存和 10 个 CPU 内核。

多处理和单处理执行的基准时间:

从上图中,我们可以观察到 Python 函数的并行处理将执行速度提高了近 30 倍。

我们可以在我的 gitHub 中找到用于记录基准测试数据的 Python文件。

基准测试过程:

结 论:

在本文中,我们讨论了 Python 中多处理模块的实现,该模块可用于加速 Python 函数的执行。添加几行多处理代码后,具有 537k 实例的数据集的执行时间几乎快了 30 倍。

处理大型数据集的时候,我建议大家使用并行处理,因为它可以节省大量时间并加快工作流程。

到此这篇关于几行代码让 Python 函数执行快 30 倍的文章就介绍到这了,更多相关Python 函数执行内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 几行代码让Python函数执行快30倍

本文链接: https://lsjlt.com/news/154929.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 几行代码让Python函数执行快30倍
    目录1、Python 多线程处理的基本指南2、多处理入门3、它为什么如此重要?4、实现5、基准测试Python 是一种流行的编程语言,也是数据科学社区中最受欢迎的语言。与其他流行编程...
    99+
    2024-04-02
  • PHP-代码执行函数-命令执行函数
    目录 代码执行函数: 1.eval()函数 2.assert()  函数 3.call_user_func()函数  4- create_function()函数  5- array_map()函数 6- call_user_func_ar...
    99+
    2023-09-09
    php 开发语言 网络安全
  • 只用3行代码,让Python提速4倍!最
    Python是一门非常适合处理数据和自动化完成重复性工作的编程语言。我们在用数据训练机器学习模型之前,通常都需要对数据进行预处理,而Python就非常适合完成这项工作,比如需要重新调整几十万张图像的尺寸,用Python没问题!你几乎总是能找...
    99+
    2023-01-31
    代码 Python
  • PHP常见的命令执行函数与代码执行函数
    目录 代码执行函数: 1. eval() GET和POST传参的区别  2. assert() 3. call_user_func() 4. create_function() 5. array_map() 6. call_user_fun...
    99+
    2023-09-05
    php 网络安全 web安全
  • 怎么编写Python代码让数据处理快4倍
    这篇文章主要介绍“怎么编写Python代码让数据处理快4倍”,在日常操作中,相信很多人在怎么编写Python代码让数据处理快4倍问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么编写Python代码让数据处理...
    99+
    2023-06-16
  • 动态执行python代码
    最近刚刚学到两个新的命令exec和eval,这两个命令可以在代码中动态执行python脚本。 exec a = 1 exec "a = 2" print a 上述代码输出的结果为2 name = "os" exec "impor...
    99+
    2023-01-31
    代码 动态 python
  • Java使用ScriptEngine动态执行代码(附Java几种动态执行代码比较)
    引言 在Java项目中,或多或少我们有动态执行代码的需求,比如: 系统中有一个规则验证需求,但规则经常改变 代码热更新,热修复 笔者也在目前参与的一个项目中遇到了...
    99+
    2024-04-02
  • 怎样让php代码不向下执行
    本教程操作环境:windows7系统、PHP7.1版、DELL G3电脑让php代码不向下执行的方法:当在脚本中调用die()和exit()时,将会终止整个脚本。它们都可用于阻止脚本继续执行,而使得某些重要的操作不会发生。die()phpd...
    99+
    2019-11-18
    php
  • 如何让php代码不向下执行
    这篇文章将为大家详细讲解有关如何让php代码不向下执行,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。在php中,可以使用die()和exit()函数让代码不向下执行,语法为“die(message)”和“...
    99+
    2023-06-25
  • JavaScript函数内部的代码怎么执行
    这篇文章主要介绍“JavaScript函数内部的代码怎么执行”,在日常操作中,相信很多人在JavaScript函数内部的代码怎么执行问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解...
    99+
    2024-04-02
  • 让Python脚本暂停执行的几种方法
    转自:让Python脚本暂停执行的几种方法  1.time.sleep(secs)      参考文档原文:   Suspend execution for the given number of seconds. The a...
    99+
    2023-01-31
    脚本 几种方法 Python
  • python 远程执行代码 para
    installtion:    yum -y install python-devel    pip install paramiko    problem:    1.1 error: command ‘gcc’ failed with ...
    99+
    2023-01-31
    代码 python para
  • python 远程执行代码 fabr
     fabric应用:               1、fab -H 172.23.177.40,172.23.177.41 host_type               2、fab host_type check_ver         ...
    99+
    2023-01-31
    代码 python fabr
  • python函数专讲:exec执行函数
    今天的Python学习教程想跟大家说一下exec执行函数...
    99+
    2023-06-02
  • PyPy 如何让Python代码运行得和C一样快
    目录1. 引言2. 举个栗子3. 刨根问底3.1 提前编译3.2 语言可解释性3.3 即时编译4. 总结1. 引言 作为一名算法工程师,如何快速实现一个想法并验证它是否有效对日常工作...
    99+
    2024-04-02
  • 怎么在JavaScript函数内执行全局代码
    本篇内容主要讲解“怎么在JavaScript函数内执行全局代码”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么在JavaScript函数内执行全局代码”吧!先...
    99+
    2024-04-02
  • python执行js代码的方法
    目录什么是js代码混淆?正常代码混淆代码Python第三方包Execjs安装执行js什么是js代码混淆? 正常代码 我们现在看一段js代码,代码逻辑很简单,就是拼接时间返回。 function...
    99+
    2022-06-02
    python 执行js python 执行js代码
  • Python中怎么执行js代码
    这篇文章将为大家详细讲解有关Python中怎么执行js代码,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。正常代码我们现在看一段js代码,代码逻辑很简单,就是拼接时间返回。function&n...
    99+
    2023-06-16
  • 只需要这一行代码就能让python计算速度提高十倍
    目录一、前言二、Python的JIT编译器三、Numba快速学习四、关于使用五、实验提升一、前言 Python语言近年来人气爆棚。它广泛应用于数据科学,人工智能,以及网络安全问题中,...
    99+
    2024-04-02
  • 很底层的性能优化:让CPU更快地执行你的代码
    Cache对性能的影响 首先我们要知道,CPU访问内存时,不是直接去访问内存的,而是先访问缓存(cache)。当缓存中已经有了我们要的数据时,CPU就会直接从缓存中读数据,而不是从内存中读。CPU和缓存的关系如下:缓存分为一级、二级、三级,...
    99+
    2023-07-31
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作