首页 > 资讯 > 后端开发 > Python >怎么使用python3线程池ThreadPoolExecutor处理csv文件数据

614

分享到

怎么使用python3线程池ThreadPoolExecutor处理csv文件数据

2023-07-02 08:07:51 614人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要介绍“怎么使用python3线程池ThreadPoolExecutor处理csv文件数据”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“怎么使用python3线程池ThreadPoolEx

这篇文章主要介绍“怎么使用python3线程池ThreadPoolExecutor处理csv文件数据”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“怎么使用python3线程池ThreadPoolExecutor处理csv文件数据”文章能帮助大家解决问题。

背景

由于不同乙方对服务商业务接口字段理解不一致，导致线上上千万数据量数据存在问题，为了修复数据，通过 Python 脚本进行修改

知识点

Python3、线程池、pymysql、CSV 文件操作、requests

拓展

当我们程序在使用到线程、进程或协程的时候，以下三个知识点可以先做个基本认知

CPU 密集型、io 密集型、GIL 全局解释器锁

库

pip3 install requests
pip3 install pyMysql

流程

怎么使用python3线程池ThreadPoolExecutor处理csv文件数据

实现代码

# -*- coding:utf-8 -*-# @FileName:grade_update.py# @Desc    :在一台超级计算机上运行过的牛逼Python代码import timefrom concurrent.futures import ThreadPoolExecutor,FIRST_COMPLETED,waitimport requestsimport pymysqlfrom projectPath import pathgradeId = [4303, 4304, 1000926, 1000927]def writ_mysql():    """    数据库连接    """    return pymysql.connect(host="localhost",                         port=3306,                         user="admin",                         passWord="admin",                         database="test"                         )def oprationdb(grade_id, member_id):  """  操作数据库  """    db = writ_mysql()    try:        cursor = db.cursor()        sql = f"UPDATE `t_m_member_grade` SET `current_grade_id`={grade_id}, `modified` =now() WHERE `member_id`={member_id};"        cursor.execute(sql)        db.commit()        print(f"提交的SQL->{sql}")    except pymysql.Error as e:        db.rollback()        print("DB数据库异常：", e)    db.close()    return Truedef interface(rows, thead):  """  调用第三方接口  """    print(f"处理数据行数--->{thead}----数据--->{rows}")    try:        url = "Http://xxxx/api/xxx-data/Tmall/bindQuery"        body = {            "nickname": str(rows[0]),            "seller_name": "test",            "mobile": "111"        }        heade={"Content-Type": "application/x-www-fORM-urlencoded"}        res = requests.post(url=url, data=body,headers=heade)        result = res.JSON()        if result["data"]["status"] in [1, 2]:            grade = result["data"]["member"]["level"]            grade_id = gradeId[grade]            oprationdb(grade_id=grade_id, member_id=rows[1])            return True        return True    except Exception as e:        print(f"调用异常:{e}")def read_csv():    import csv    # db = writ_mysql()    #线程数    MAX_WORKERS=5    with ThreadPoolExecutor(MAX_WORKERS) as pool:        with open(path + '/file/result2_colu.csv', 'r', newline='', encoding='utf-8') as f:            #set() 函数创建无序不重复元素集            seq_notdone = set()            seq_done = set()            # 使用csv的reader()方法，创建一个reader对象            reader = csv.reader(f)            n = 0            for row in reader:                n += 1                # 遍历reader对象的每一行                try:                    seq_notdone.add(pool.submit(interface, rows=row, thead=n))                    if len(seq_notdone) >= MAX_WORKERS:                        #FIRST_COMPLETED文档说明 -- Return when any future finishes or is cancelled.                        done, seq_notdone = wait(seq_notdone,return_when=FIRST_COMPLETED)                        seq_done.update(done)                except Exception as e:                    print(f"解析结果出错：{e}")    # db.close()    return "完成"if __name__ == '__main__':    read_csv()

解释

引入线程池库

from concurrent.futures import ThreadPoolExecutor,FIRST_COMPLETED,wait
pool.submit(interface, rows=row, thead=n)

提交任务，interface 调用的函数，rows、thead 为 interface() 函数的入参

任务持续提交，线程池通过 MAX_WORKERS 定义的线程数持续消费

说明像这种 I/O 密集型的操作脚本适合使用多线程，如果是 CPU 密集型建议使用进行，根据机器核数进行配置

关于“怎么使用python3线程池ThreadPoolExecutor处理csv文件数据”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识，可以关注编程网Python频道，小编每天都会为大家更新不同的知识点。

您可能感兴趣的文档:

--结束END--

本文标题: 怎么使用python3线程池ThreadPoolExecutor处理csv文件数据

本文链接: https://lsjlt.com/news/340547.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

怎么使用python3线程池ThreadPoolExecutor处理csv文件数据

背景

知识点

拓展

库

流程

实现代码

解释

怎么使用python3线程池ThreadPoolExecutor处理csv文件数据

python3线程池ThreadPoolExecutor处理csv文件数据

python中ThreadPoolExecutor线程池和ProcessPoolExecutor进程池怎么使用

怎么在Java并发包中使用ThreadPoolExecutor线程池

怎么在java中使用ThreadPoolExecutor创建一个线程池

Java使用线程池批量处理数据操作

怎么使用Python3多线程处理爬虫

怎么用Python Pandas处理CSV文件

怎么使用php多线程处理大数据

Spring Boot使用线程池处理上万条数据插入功能

怎么使用Python3实时操作处理日志文件

python3怎么使用libpcap库抓包及处理数据

怎么使用java多线程处理大批量数据

python线程池回调函数怎么使用

怎么用php多线程处理大数据

Java动态线程池插件dynamic-tp怎么使用

怎么使用Python处理文本数据

Java怎么使用线程池递归压缩文件夹下面的所有子文件

php使用yield处理大数据文件

Python数据处理pandas读写操作IO工具CSV怎么使用

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义