python3线程池ThreadPoolExecutor处理csv文件数据

2024-04-02 19:04:59 517人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

目录背景知识点拓展库流程实现代码解释背景由于不同乙方对服务商业务接口字段理解不一致，导致线上上千万数据量数据存在问题，为了修复数据，通过 python 脚本进行修改知识点 pyt

背景

由于不同乙方对服务商业务接口字段理解不一致，导致线上上千万数据量数据存在问题，为了修复数据，通过 python 脚本进行修改

知识点

python3、线程池、pyMysql、CSV 文件操作、requests

拓展

当我们程序在使用到线程、进程或协程的时候，以下三个知识点可以先做个基本认知

CPU 密集型、io 密集型、GIL 全局解释器锁

库

pip3 install requests

pip3 install pymysql

流程

实现代码

# -*- coding:utf-8 -*-
# @FileName:grade_update.py
# @Desc    :在一台超级计算机上运行过的牛逼Python代码
import time
from concurrent.futures import ThreadPoolExecutor,FIRST_COMPLETED,wait
import requests
import pymysql
from projectPath import path
gradeId = [4303, 4304, 1000926, 1000927]
def writ_mysql():
    """
    数据库连接
    """
    return pymysql.connect(host="localhost",
                         port=3306,
                         user="admin",
                         passWord="admin",
                         database="test"
                         )
def oprationdb(grade_id, member_id):
  """
  操作数据库
  """
    db = writ_mysql()
    try:
        cursor = db.cursor()
        sql = f"UPDATE `t_m_member_grade` SET `current_grade_id`={grade_id}, `modified` =now() WHERE `member_id`={member_id};"
        cursor.execute(sql)
        db.commit()
        print(f"提交的SQL->{sql}")
    except pymysql.Error as e:
        db.rollback()
        print("DB数据库异常：", e)
    db.close()
    return True
def interface(rows, thead):
  """
  调用第三方接口
  """
    print(f"处理数据行数--->{thead}----数据--->{rows}")
    try:
        url = "Http://xxxx/api/xxx-data/Tmall/bindQuery"
        body = {
            "nickname": str(rows[0]),
            "seller_name": "test",
            "mobile": "111"
        }
        heade={"Content-Type": "application/x-www-fORM-urlencoded"}
        res = requests.post(url=url, data=body,headers=heade)
        result = res.JSON()
        if result["data"]["status"] in [1, 2]:
            grade = result["data"]["member"]["level"]
            grade_id = gradeId[grade]
            oprationdb(grade_id=grade_id, member_id=rows[1])
            return True
        return True
    except Exception as e:
        print(f"调用异常:{e}")
def read_csv():
    import csv
    # db = writ_mysql()
    #线程数
    MAX_WORKERS=5
    with ThreadPoolExecutor(MAX_WORKERS) as pool:
        with open(path + '/file/result2_colu.csv', 'r', newline='', encoding='utf-8') as f:
            #set() 函数创建无序不重复元素集
            seq_notdone = set()
            seq_done = set()
            # 使用csv的reader()方法，创建一个reader对象
            reader = csv.reader(f)
            n = 0
            for row in reader:
                n += 1
                # 遍历reader对象的每一行
                try:
                    seq_notdone.add(pool.submit(interface, rows=row, thead=n))
                    if len(seq_notdone) >= MAX_WORKERS:
                        #FIRST_COMPLETED文档说明 -- Return when any future finishes or is cancelled.
                        done, seq_notdone = wait(seq_notdone,return_when=FIRST_COMPLETED)
                        seq_done.update(done)
                except Exception as e:
                    print(f"解析结果出错：{e}")
    # db.close()
    return "完成"
if __name__ == '__main__':
    read_csv()

解释

引入线程池库

from concurrent.futures import ThreadPoolExecutor,FIRST_COMPLETED,wait

pool.submit(interface, rows=row, thead=n)

提交任务，interface 调用的函数，rows、thead 为 interface() 函数的入参

任务持续提交，线程池通过 MAX_WORKERS 定义的线程数持续消费

说明像这种 I/O 密集型的操作脚本适合使用多线程，如果是 CPU 密集型建议使用进行，根据机器核数进行配置

以上就是python3线程池ThreadPoolExecutor处理csv文件数据的详细内容，更多关于python3 ThreadPoolExecutor处理csv的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

--结束END--

本文标题: python3线程池ThreadPoolExecutor处理csv文件数据

本文链接: https://lsjlt.com/news/118665.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

python3线程池ThreadPoolExecutor处理csv文件数据

目录背景知识点拓展库流程实现代码解释背景由于不同乙方对服务商业务接口字段理解不一致，导致线上上千万数据量数据存在问题，为了修复数据，通过 Python 脚本进行修改知识点 Pyt...

99+

2024-04-02
怎么使用python3线程池ThreadPoolExecutor处理csv文件数据

这篇文章主要介绍“怎么使用python3线程池ThreadPoolExecutor处理csv文件数据”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“怎么使用python3线程池ThreadPoolEx...

99+

2023-07-02
Python3 多线程(连接池)操作MySQL插入数据

目录多线程(连接池)操作MySQL插入数据 1.主要模块 2.创建连接池 3.数据预处理 4.线程任务 5.启动多线程 6.完整示例 7.思考/总结多线程(连接池)操作MySQL插...

99+

2024-04-02
Java使用线程池批量处理数据操作

Java使用线程池批量处理数据操作疑问&思路：如何保证数据按顺序批量处理 2.如何保证数据全部处理完统一返回 3.如何保证是多任务异步操作 4.如何提高运行效率，减少运行时间使用ArrayLis...

99+

2023-09-08

java 开发语言
Springboot线程池并发处理数据优化方式

目录第一步：首先配置线程基本参数第二步：让Spring Boot加载第三步：创建一个service接口第四步：编写现实类第五步：测试结果如下第一步：首先配置线程基本参数可以放在ap...

99+

2024-04-02
如何优化Springboot线程池并发处理数据方式

这篇文章给大家分享的是有关如何优化Springboot线程池并发处理数据方式的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。第一步：首先配置线程基本参数可以放在application.propertes文件种也可以...

99+

2023-06-22
Python：PDF文件处理（数据处理）

工作中有对PDF文件进行数据抽取，现在总结归纳一下相应的方法，本文包括一下内容： PDF文件分割、拼接； PDF文件抽取图片，简单的图片识别； PDF文件抽取表格； PDF文件抽取文本； PDF文件转docx文件； docx文件...

99+

2023-09-03

pdf python Powered by 金山文档
Spring Boot使用线程池处理上万条数据插入功能

目录# 前言# 使用步骤# 前言前两天做项目的时候，想提高一下插入表的性能优化，因为是两张表，先插旧的表，紧接着插新的表，一万多条数据就有点慢了后面就想到了线程池ThreadPo...

99+

2022-11-13

Spring Boot线程池上万条数据插入 Spring Boot线程池 Spring Boot线程池数据插入
H2数据库导入CSV文件的实现原理

这篇文章主要介绍“H2数据库导入CSV文件的实现原理”，在日常操作中，相信很多人在H2数据库导入CSV文件的实现原理问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”H2数据库导...

99+

2024-04-02
JAVA多线程处理for循环数据

对for循环内数据启用多线程执行，主线程与子线程无先后顺序 public static void main(String[] args) throws InterruptedException...

99+

2023-09-14

java jvm 开发语言
TensorFlow多线程输入数据处理框

参考书《TensorFlow：实战Google深度学习框架》（第2版）一个简单的程序来生成样例数据。 #!/usr/bin/env python # -*- coding: UTF-8 -*- # coding=utf-8 ...

99+

2023-01-30

数据处理多线程 TensorFlow
php多线程如何处理大数据

在PHP中实现多线程处理大数据通常可以通过使用多线程扩展或者多进程来实现。以下是一种基本的实现方法：使用多线程扩展：PHP中有一...

99+

2024-04-02
多线程+代理池爬取天天基金网、股票数据(

目录简介技术路线编写思路数据格式功能截图配置说明补充 ...

99+

2023-01-31

多线程基金股票
java线程池的匹配文件数量计算方法是什么

这篇文章主要讲解了“java线程池的匹配文件数量计算方法是什么”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“java线程池的匹配文件数量计算方法是什么”吧！构建一个新的线程的代价还是有些高的...

99+

2023-06-17
VB.NET文件处理数据的方法

本篇内容介绍了“VB.NET文件处理数据的方法”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！VB.NET文件处理代码：'打开csv文...

99+

2023-06-17
java 多线程处理大量并发数据

Java中多线程是一种处理数据的常见方式，它可以同时执行多个线程以提高程序的性能和效率。下面是一个使用多线程处理数据的示例代码： public class DataProcessor { pub...

99+

2023-09-07

java 开发语言
怎么用php多线程处理大数据

在PHP中，可以使用多种方法来处理大数据，其中包括使用多线程的方法。下面是一个示例，演示如何使用PHP多线程处理大数据： ...

99+

2023-10-22

php 大数据
c#多线程怎么处理多个数据

处理多个数据的多线程方法有多种，以下是其中的一些常见方法：1. 并行循环：使用Parallel类的For、ForEach或Invok...

99+

2023-08-18

c#
Python处理数据：匹配两个Excel文件数据

当需要处理两个Excel文件的数据，根据两个Excel的某一些内容进行数据匹配，从而提取出相应的数据时，除了使用Excel自带的Vlookup函数，还能使用Python进行处理。我是不会告诉你们我选择Python处理的原因是对Excel的V...

99+

2023-09-21

python excel
Nodejs处理Json文件并将处理后的数据写入新文件中

目录处理Json文件并将处理后的数据写入新文件问题描述实现过程用Nodejs解析json数据处理Json文件并将处理后的数据写入新文件问题描述事情是这样的，朋友让我处理一个jso...

99+

2022-11-13

Nodejs处理Json文件 Json数据写入新文件 Nodejs写入json文件