返回顶部
首页 > 资讯 > 后端开发 > Python >python3--中的进程操作--multiprocess模块
  • 805
分享到

python3--中的进程操作--multiprocess模块

模块进程操作 2023-01-30 22:01:10 805人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

在python程序中的进程操作运行中的程序就是一个进程。所有的进程都是通过它的父进程来创建的。因此,运行起来的python程序也是一个进程,那么我们也可以在程序中再创建进程。多个进程可以实现并发效果,也就是说,当我们的程序中存在多个进程的时

在python程序中的进程操作

运行中的程序就是一个进程。所有的进程都是通过它的父进程来创建的。因此,运行起来的python程序也是一个进程,那么我们也可以在程序中再创建进程。多个进程可以实现并发效果,也就是说,当我们的程序中存在多个进程的时候,在某些时候,就会让程序的执行速度变快。以我们之前所学的知识,并不能实现创建进程这个功能,所以我们就需要借助Python中强大的模块。


multiprocess模块

multiprocess不是一个模块而是python中一个操作、管理进程的包。 之所以叫multi是取自multiple的多功能的意思,在这个包中几乎包含了和进程有关的所有子模块。由于提供的子模块非常多,为了方便归类记忆,大致分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享


multiprocess.process模块

process模块介绍

process模块是一个创建进程的模块,借助这个模块,就可以完成进程的创建

Process([group [, target [, name [, args [, kwargs]]]]]),由该类实例化得到的对象,表示一个子进程中的任务
(尚未启动)

强调:
1. 需要使用关键字的方式来指定参数
2. args指定的为传给target函数的位置参数,是一个元组形式,必须有逗号

参数介绍:
1 group参数未使用,值始终为None
2 target表示调用对象,即子进程要执行的任务
3 args表示调用对象的位置参数元组,args=(1,2,'eGon',)
4 kwargs表示调用对象的字典,kwargs={'name':'egon','age':18}
5 name为子进程的名称

方法介绍

1 p.start():启动进程,并调用该子进程中的p.run() 
2 p.run():进程启动时运行的方法,正是它去调用target指定的函数,我们自定义类的类中一定要实现该方法  
3 p.terminate():强制终止进程p,不会进行任何清理操作,如果p创建了子进程,该子进程就成了僵尸进程,使用该方法需
要特别小心这种情况。如果p还保存了一个那么也将不会被释放,进而导致死锁
4 p.is_alive():如果p仍然运行,返回True
5 p.join([timeout]):主线程等待p终止(强调:是主线程处于等的状态,而p是处于运行的状态)。timeout是可选的超时
时间,需要强调的是,p.join只能join住start开启的进程,而不能join住run开启的进程

属性介绍

1 p.daemon:默认值为False,如果设为True,代表p为后台运行的守护进程,当p的父进程终止时,p也随之终止,并且设定
为True后,p不能创建自己的新进程,必须在p.start()之前设置
2 p.name:进程的名称
3 p.pid:进程的pid
4 p.exitcode:进程在运行时为None、如果为–N,表示被信号N结束(了解即可)
5 p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。这个键的用途是为涉及网络连接的底
层进程间通信提供安全性,这类连接只有在具有相同的身份验证键时才能成功(了解即可)

在windows中使用process模块的注意事项

 在windows操作系统中由于没有fork(linux操作系统中创建进程的机制),在创建子进程的时候会自动 import 启动它的这
 个文件,而在 import 的时候又执行了整个文件。因此如果将process()直接写在文件中就会无限递归创建子进程报错。
 所以必须把创建子进程的部分使用if __name__ ==‘__main__’ 判断保护起来,import 的时候  ,就不会递归运行了


每一个进程,都有一个进程id号,查看进程号

import os
import time
print(os.getpid())
time.sleep(1000)

运行结果

blob.png

这个进程号,每次执行程序的时候,都是随机分配的

系统中的进程id号,是不会冲突的,每一个进程,对应一个唯一的进程id号

通过windows任务管理器,就可以看到

blob.png



使用process创建一个进程

import os
import time
from multiprocessing import Process

def process1():
    print('process1 : ', os.getpid())  # 打印进程id号
    time.sleep(10)  # 延迟10秒

print(os.getppid())  # 打印父进程id号
p = Process(target=process1)  # 实例化一个对象p,target=process1表示子进程要执行的任务
p.start()  # 启动进程

执行报错

blob.png

在创建子进程的时候会自动 import 启动它的这个文件,而在 import 的时候又执行了整个文件。因此如果将process()直接写在文件中就会无限递归创建子进程报错。所以必须把创建子进程的部分使用if __name__ ==‘__main__’ 判断保护起来,import 的时候  ,就不会递归运行了


解决方案:

import os
import time
from multiprocessing import Process

def process1():
    print('process1 : ', os.getpid(), os.getppid())  # 打印进程id号, getppid父进程id号
    time.sleep(10)  # 延迟10秒

print(os.getpid())  # 打印进程id号


if __name__ == '__main__':
    p = Process(target=process1)  # 实例化一个对象p,target=process1表示子进程要执行的任务
    p.start()  # 启动进程

执行结果

blob.png

为什么会打印两次进程id号?

一个是当前进程的id号,一个是创建新进程的id号



使用process模块创建进程并传参

import os
import time
from multiprocessing import Process

def process1(n, name, num=20):
    print('process1 : ', os.getpid())
    print('n : ', n, name, num)
    time.sleep(10)


if __name__ == '__main__':
    print(os.getpid())  # 打印进程id
    # 实例化一个对象p(即创建一个新进程(子进程)),target=process1表示子进程要执行的程序为process1
    # args里面为需要传入的参数
    p = Process(target=process1, args=[1, 'Sam', 30])
    p.start()  # 运行进程

执行结果

14452  # 打印当前进程id号

process1 :  5884  # 打印新进程id号

n :  1 Sam 30



在一个python进程中开启子进程,start方法和并发效果

import time
from multiprocessing import Process
def f(name):
    print('执行子进程')
    print('hello', name)
    time.sleep(5)
    print('子进程执行完毕,退出!')


if __name__ == '__main__':
    p = Process(target=f, args=('Sam',))
    p.start()  # 执行子进程
    print('执行主进程的内容')

执行结果:

执行主进程的内容

执行子进程

hello Sam

子进程执行完毕,退出!

注释:

1 主进程默认会等待子进程执行完毕之后才会结束

2 主进程和子进程之间的代码是异步执行的

3 为什么主进程要等待子进程结束:回收一些子进程的资源

4 开启一个进程是有时间开销的:操作系统响应开启进程指令,给这个进程分配必要的资源


进程同步控制

import os
import time
from multiprocessing import Process

def func():
    print(os.getpid(),os.getppid())
    time.sleep(1)


if __name__ == '__main__':
    print(os.getpid(), os.getppid())
    p = Process(target=func)
    p.start()
    p.join()  # join方法能够检测到p进程是否已经执行完了,阻塞直到p执行结束
              # join方法能够让子进程执行结束后,在执行其它的
    print('*'*20)

执行结果,join方法,能够将一个程序变成同步的

14832 13644

15796 14832

********************


举一个join方法应用场景的实际例子

让子进程计算一个值,主进程必须得到子进程的值,来计算值

以文件为消息中间件,来完成主进程获取子进程的值

import os
from multiprocessing import Process

def func(exp):
    print(os.getpid(), os.getppid())
    result = eval(exp)  # eval去引号,得到里面真正的表达式
    with open('file', 'w') as f:
        f.write(str(result))


if __name__ == '__main__':
    print(os.getpid(), os.getppid())
    p = Process(target=func, args=['3*5'])
    p.start()
    ret = 5/6
    p.join()  # join方法能够检测到p进程是否已经执行完了,阻塞直到p执行结束
              # p.join()方法一直阻塞,等待子进程算出结果后才执行下面的代码
    with open('file') as f:
        result = f.read()
    ret = ret + int(result)
    print('计算结果为 : {:.2f}'.fORMat(ret))

执行结果:

9980 13644

2236 9980

计算结果为 : 15.83



开启多个子进程

方法一

import os
from multiprocessing import Process

def process(n):
    print(os.getpid(), os.getppid())
    print(n)


if __name__ == '__main__':
    Process(target=process, args=[1, ]).start()
    Process(target=process, args=[2, ]).start()

执行结果

12840 4320

1

16128 4320

2


如果需要开启很多个子进程,写多个明显不理智

方法二

import os
from multiprocessing import Process

def process(n):
    print(os.getpid(), os.getppid())
    print(n)


if __name__ == '__main__':
    for i in range(5):
        Process(target=process, args=[i, ]).start()

执行结果

16308 15472

1

14320 15472

0

9652 15472

2

7752 15472

3

3992 15472

4


注释:为什么上面执行的顺序是随机的?

是操作系统来决定的,它不一定是按照你的顺序来开启进程,有自己的算法,比如开启一个进程,时间片轮转了,那么就不是顺序的


计算复杂的表达式,怎么使用启用多个进程执行?

import os
import time
from multiprocessing import Process

def process(n):
    print(os.getpid(), os.getppid())
    time.sleep(1)
    print(n)


if __name__ == '__main__':
    # 将所有进程放入一个列表里面
    p_lst = []
    for i in range(10):
        p = Process(target=process, args=[i, ])
        p.start()
        p_lst.append(p)
    for p in p_lst:
        p.join()  # 所有的子进程执行之后,在一起执行join方法(阻塞算结果),
                  # 所有的子进程都结束后才会执行后面的代码
    print('求和!')



开启进程的第二种方式

通过继承来实现的,必须要重写run方法,名字必须是run

import os
from multiprocessing import Process


class Myprocess(Process):
    def __init__(self, *args):  # *args接收多个参数
        super().__init__()  # 执行父类__init__方法
        self.args = args

    def run(self):
        print(os.getpid(), self.name)  # self.name 为进程名
        for i in self.args:
            print('{}和女主播聊天'.format(i))


if __name__ == '__main__':
    print(os.getpid())
    p = Myprocess('Sam', 'Tom')
    p.start()  # 在执行start的时候,会帮我们主动执行run方法中的内容

执行结果

14340

14780 Myprocess-1

Sam和女主播聊天

Tom和女主播聊天


进程中的数据隔离,如何证明是隔离的呢?

from multiprocessing import Process
n = 100
def func():
    global n  # 声明使用全局变量
    n += 1
    print('son :', n)

# 子进程的变量不会影响主进程的变量
if __name__ == '__main__':
    p = Process(target=func)
    p.start()
    p.join()
    print(n)

执行结果

son : 101

100



守护进程

import time
from multiprocessing import Process

def func():
    print('son start')
    time.sleep(1)
    print('son end')


if __name__ == '__main__':
    p = Process(target=func)
    # 在一个进程开启之前可以设置它为一个守护进程
    p.daemon = True
    p.start()
    time.sleep(0.5)
    print('在主进程中')

执行结果:

son start

在主进程中


总结:守护进程的意义:子进程会随着主进程代码的执行结束而结束

守护进程的作用:

1 守护主进程,程序报活(检查主进程是否存活)

2 主进程开启的时候,建立一个守护进程

3 守护进程只负责每隔1分钟,就给检测程序发一条信息


例2:守护进程

import time
from multiprocessing import Process
def func():
    print('son start')
    while True:
        time.sleep(1)
        print('son')

def func2():
    print('start : in func2')
    time.sleep(5)
    print('end : in func2')


if __name__ == '__main__':
    p = Process(target=func)
    # 在一个进程开启之前可以设置它为守护进程
    p.daemon = True
    p.start()
    Process(target=func2).start()
    time.sleep(2)
    print('在主进程中')

执行结果

son start

start : in func2

son

在主进程中

end : in func2


总结:

主进程会等待子进程的结束而结束

守护进程的意义:

    子进程会随着主进程代码的执行结束而结束

    注意:守护进程不会关心主进程什么时候结束,我只关心主进程中的代码什么时候结束

守护进程的作用:

    守护主进程,程序报活(检测主进程是否存活)

    主进程开启的时候,建立一个守护进程

    守护进程只负责每隔1分钟,就给检测程序发一条消息



进程中的其它方法

import time
from multiprocessing import Process

def func():
    print('wahaha')
    time.sleep(20)
    print('wahaha end')


if __name__ == '__main__':
    p = Process(target=func)
    p.start()
    print(p.is_alive())  # 检测进程是否存活
    time.sleep(1)
    p.terminate()  # 在主进程中结束一个子进程
                   # 执行命令后,进程不是马上结束,而是等待操作系统来回收
    print(p.is_alive())  # 检测进程是否存活
    time.sleep(0.5)
    print(p.is_alive())  # 检测进程是否存活

执行结果

True

wahaha

True

False


--结束END--

本文标题: python3--中的进程操作--multiprocess模块

本文链接: https://lsjlt.com/news/179070.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python3--中的进程操作--multiprocess模块
    在python程序中的进程操作运行中的程序就是一个进程。所有的进程都是通过它的父进程来创建的。因此,运行起来的python程序也是一个进程,那么我们也可以在程序中再创建进程。多个进程可以实现并发效果,也就是说,当我们的程序中存在多个进程的时...
    99+
    2023-01-30
    模块 进程 操作
  • Python中的进程操作模块(multiprocess.process)
    目录一、multiprocess模块二、multiprocess.process模块1、使用process模块创建进程1 在Python中启动的第一个子进程2、 查看主进程和子进程的...
    99+
    2024-04-02
  • python3文件操作相关模块
    os模块: os.curdir'.' os.pardir'..' os.sep #路径分隔符,不同的操作系统看到的结果不一样'/' os.linesep #换行符,不同的操作系统看到的也不一样,windox'\n' os.getc...
    99+
    2023-01-31
    模块 操作 文件
  • Python中的线程操作模块(oncurrent)
    目录GIL锁1、 创建线程的方式:直接使用Thread2、 创建线程的方式:继承Thread二、多线程与多进程1、 pid的比较2、 开启效率的较量3、 内存数据的共享问题三、Thr...
    99+
    2024-04-02
  • Python中的协程(Coroutine)操作模块(greenlet、gevent)
    目录一、协程介绍1、介绍2、举例3、优点如下:4、缺点如下:5、总结协程特点:二、greenlet(绿叶)模块1、安装模块2、greenlet实现状态切换3、效率对比三、gevent...
    99+
    2024-04-02
  • Python中struct模块对字节流/二进制流的操作教程
    前言 最近使用Python解析IDX文件格式的MNIST数据集,需要对二进制文件进行读取操作,其中我使用的是struct模块。查了网上挺多教程都写的挺好的,不过对新手不是很友好,所以我重新整理了一些笔记以供...
    99+
    2022-06-04
    字节 模块 操作
  • python3中的struct模块使用
    软硬件环境python3struct简介struct是python(包括版本2和3)中的内建模块,它用来在c语言中的结构体与python中的字符串之间进行转换,数据一般来自文件或者网络。常用方法struct模块中的函数函数returnex...
    99+
    2023-01-31
    模块 struct
  • Python中操作mysql的pymysql模块详解
    前言 pymsql是Python中操作MySQL的模块,其使用方法和MySQLdb几乎相同。但目前pymysql支持python3.x而后者不支持3.x版本。 本文测试python版本:2.7.11。mys...
    99+
    2022-06-04
    详解 模块 操作
  • 如何进行Python模块与函数的应用操作
    本篇文章为大家展示了如何进行Python模块与函数的应用操作,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。模块与函数使用Python/C API中的PyImport_Import()函数可以在C程序...
    99+
    2023-06-17
  • 深入理解Python3中的http.client模块
    http 模块简介 Python3 中的 http 包中含有几个用来开发 HTTP 协议的模块。 http.client 是一个底层的 HTTP 协议客户端,被更高层的 urllib.request ...
    99+
    2022-06-04
    模块 http client
  • Python中用psycopg2模块操作PostgreSQL方法
    其实在Python中可以用来连接PostgreSQL的模块很多,这里比较推荐psycopg2。psycopg2安装起来非常的简单(pip install psycopg2),这里主要重点介绍下如何使用。 安...
    99+
    2022-06-04
    中用 模块 操作
  • python中有哪些文件操作模块
    这篇文章给大家介绍python中有哪些文件操作模块,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。python的五大特点是什么python的五大特点:1.简单易学,开发程序时,专注的是解决问题,而不是搞明白语言本身。2....
    99+
    2023-06-14
  • Python3 导入上级目录中的模块
    python导入同级别模块很方便: import xxx 要导入下级目录页挺方便,需要在下级目录中写一个__init__.py文件 from dirname import xxx 要导入上级目录,可以使用 sys.path 首先 sy...
    99+
    2023-01-31
    上级 模块 目录中
  • Python使用cookielib模块操作cookie的实例教程
    cookielib是一个自动处理cookies的模块,如果我们在使用爬虫等技术的时候需要保存cookie,那么cookielib会让你事半功倍!他最常见的搭档模块就是python下的urllib和reque...
    99+
    2022-06-04
    实例教程 模块 操作
  • Python使用Paramiko模块编写脚本进行远程服务器操作
    简介: paramiko是python(2.2或更高)的模块,遵循SSH2协议实现了安全(加密和认证)连接远程机器。 安装所需软件包: http://ftp.dlitz.net/pub/dlitz/cryp...
    99+
    2022-06-04
    脚本 模块 操作
  • Python 线程池模块之多线程操作代码
    1、线程池模块 引入 from concurrent.futures import ThreadPoolExecutor 2、使用线程池 一个简单的线程池使用案例 from concurrent.futu...
    99+
    2022-06-02
    Python 多线程 Python 线程池模块
  • node.js 操作系统模块进阶指南:系统操控不求人
    获取系统信息 os.arch(): 获取系统的架构(例如:"x64" 或 "arm64") os.cpus(): 获取CPU信息,包括数量、型号和速度 os.networkInterfaces(): 获取网络接口详细信息,例如IP地址、...
    99+
    2024-04-02
  • Python中的os.path路径模块中的操作方法总结
    解析路径 路径解析依赖与os中定义的一些变量: os.sep-路径各部分之间的分隔符。 os.extsep-文件名与文件扩展名之间的分隔符。 os.pardir-路径中表示目录树上一级的部分。...
    99+
    2022-06-04
    操作方法 路径 模块
  • Python3内置模块中base64的解码方法
    这篇文章给大家介绍Python3内置模块中base64的解码方法,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。即 base64 其实不能归属密码领域,作用也不是用于加密,它是一种编码算法,但是具有不可读性,所以可以说是...
    99+
    2023-06-02
  • python操作jira添加模块的方法
    目录JIRA介绍:python操作jira首先安装jira模块导入jira模块编写添加模块代码获取当前项目的模块信息从excel表读取信息主方法中调用添加模块等方法JIRA介绍: &...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作