首页 > 资讯 > 后端开发 > Python >python3--中的进程操作--multiprocess模块

805

分享到

python3--中的进程操作--multiprocess模块

模块进程操作 2023-01-30 22:01:10 805人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

在python程序中的进程操作运行中的程序就是一个进程。所有的进程都是通过它的父进程来创建的。因此，运行起来的python程序也是一个进程，那么我们也可以在程序中再创建进程。多个进程可以实现并发效果，也就是说，当我们的程序中存在多个进程的时

在python程序中的进程操作

运行中的程序就是一个进程。所有的进程都是通过它的父进程来创建的。因此，运行起来的python程序也是一个进程，那么我们也可以在程序中再创建进程。多个进程可以实现并发效果，也就是说，当我们的程序中存在多个进程的时候，在某些时候，就会让程序的执行速度变快。以我们之前所学的知识，并不能实现创建进程这个功能，所以我们就需要借助Python中强大的模块。

multiprocess模块

multiprocess不是一个模块而是python中一个操作、管理进程的包。之所以叫multi是取自multiple的多功能的意思,在这个包中几乎包含了和进程有关的所有子模块。由于提供的子模块非常多，为了方便归类记忆，大致分为四个部分：创建进程部分，进程同步部分，进程池部分，进程之间数据共享

multiprocess.process模块

process模块介绍

process模块是一个创建进程的模块，借助这个模块，就可以完成进程的创建

Process([group [, target [, name [, args [, kwargs]]]]])，由该类实例化得到的对象，表示一个子进程中的任务
（尚未启动）

强调：
1. 需要使用关键字的方式来指定参数
2. args指定的为传给target函数的位置参数，是一个元组形式，必须有逗号

参数介绍：
1 group参数未使用，值始终为None
2 target表示调用对象，即子进程要执行的任务
3 args表示调用对象的位置参数元组，args=(1,2,'eGon',)
4 kwargs表示调用对象的字典,kwargs={'name':'egon','age':18}
5 name为子进程的名称

方法介绍

1 p.start()：启动进程，并调用该子进程中的p.run() 
2 p.run():进程启动时运行的方法，正是它去调用target指定的函数，我们自定义类的类中一定要实现该方法  
3 p.terminate():强制终止进程p，不会进行任何清理操作，如果p创建了子进程，该子进程就成了僵尸进程，使用该方法需
要特别小心这种情况。如果p还保存了一个锁那么也将不会被释放，进而导致死锁
4 p.is_alive():如果p仍然运行，返回True
5 p.join([timeout]):主线程等待p终止（强调：是主线程处于等的状态，而p是处于运行的状态）。timeout是可选的超时
时间，需要强调的是，p.join只能join住start开启的进程，而不能join住run开启的进程

属性介绍

1 p.daemon：默认值为False，如果设为True，代表p为后台运行的守护进程，当p的父进程终止时，p也随之终止，并且设定
为True后，p不能创建自己的新进程，必须在p.start()之前设置
2 p.name:进程的名称
3 p.pid：进程的pid
4 p.exitcode:进程在运行时为None、如果为–N，表示被信号N结束(了解即可)
5 p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。这个键的用途是为涉及网络连接的底
层进程间通信提供安全性，这类连接只有在具有相同的身份验证键时才能成功（了解即可）

在windows中使用process模块的注意事项

 在windows操作系统中由于没有fork(linux操作系统中创建进程的机制)，在创建子进程的时候会自动 import 启动它的这
 个文件，而在 import 的时候又执行了整个文件。因此如果将process()直接写在文件中就会无限递归创建子进程报错。
 所以必须把创建子进程的部分使用if __name__ ==‘__main__’ 判断保护起来，import 的时候  ，就不会递归运行了

每一个进程，都有一个进程id号，查看进程号

import os
import time
print(os.getpid())
time.sleep(1000)

运行结果

这个进程号，每次执行程序的时候，都是随机分配的

系统中的进程id号，是不会冲突的，每一个进程，对应一个唯一的进程id号

通过windows任务管理器，就可以看到

使用process创建一个进程

import os
import time
from multiprocessing import Process

def process1():
    print('process1 : ', os.getpid())  # 打印进程id号
    time.sleep(10)  # 延迟10秒

print(os.getppid())  # 打印父进程id号
p = Process(target=process1)  # 实例化一个对象p,target=process1表示子进程要执行的任务
p.start()  # 启动进程

执行报错

在创建子进程的时候会自动 import 启动它的这个文件，而在 import 的时候又执行了整个文件。因此如果将process()直接写在文件中就会无限递归创建子进程报错。所以必须把创建子进程的部分使用if __name__ ==‘__main__’ 判断保护起来，import 的时候，就不会递归运行了。

解决方案:

import os
import time
from multiprocessing import Process

def process1():
    print('process1 : ', os.getpid(), os.getppid())  # 打印进程id号, getppid父进程id号
    time.sleep(10)  # 延迟10秒

print(os.getpid())  # 打印进程id号


if __name__ == '__main__':
    p = Process(target=process1)  # 实例化一个对象p,target=process1表示子进程要执行的任务
    p.start()  # 启动进程

执行结果

为什么会打印两次进程id号？

一个是当前进程的id号，一个是创建新进程的id号

使用process模块创建进程并传参

import os
import time
from multiprocessing import Process

def process1(n, name, num=20):
    print('process1 : ', os.getpid())
    print('n : ', n, name, num)
    time.sleep(10)


if __name__ == '__main__':
    print(os.getpid())  # 打印进程id
    # 实例化一个对象p(即创建一个新进程(子进程)),target=process1表示子进程要执行的程序为process1
    # args里面为需要传入的参数
    p = Process(target=process1, args=[1, 'Sam', 30])
    p.start()  # 运行进程

执行结果

14452 # 打印当前进程id号

process1 : 5884 # 打印新进程id号

n : 1 Sam 30

在一个python进程中开启子进程，start方法和并发效果

import time
from multiprocessing import Process
def f(name):
    print('执行子进程')
    print('hello', name)
    time.sleep(5)
    print('子进程执行完毕，退出！')


if __name__ == '__main__':
    p = Process(target=f, args=('Sam',))
    p.start()  # 执行子进程
    print('执行主进程的内容')

执行结果:

执行主进程的内容

执行子进程

hello Sam

子进程执行完毕，退出！

注释:

1 主进程默认会等待子进程执行完毕之后才会结束

2 主进程和子进程之间的代码是异步执行的

3 为什么主进程要等待子进程结束：回收一些子进程的资源

4 开启一个进程是有时间开销的：操作系统响应开启进程指令，给这个进程分配必要的资源

进程同步控制

import os
import time
from multiprocessing import Process

def func():
    print(os.getpid(),os.getppid())
    time.sleep(1)


if __name__ == '__main__':
    print(os.getpid(), os.getppid())
    p = Process(target=func)
    p.start()
    p.join()  # join方法能够检测到p进程是否已经执行完了，阻塞直到p执行结束
              # join方法能够让子进程执行结束后，在执行其它的
    print('*'*20)

执行结果，join方法，能够将一个程序变成同步的

14832 13644

15796 14832

********************

举一个join方法应用场景的实际例子

让子进程计算一个值，主进程必须得到子进程的值，来计算值

以文件为消息中间件，来完成主进程获取子进程的值

import os
from multiprocessing import Process

def func(exp):
    print(os.getpid(), os.getppid())
    result = eval(exp)  # eval去引号，得到里面真正的表达式
    with open('file', 'w') as f:
        f.write(str(result))


if __name__ == '__main__':
    print(os.getpid(), os.getppid())
    p = Process(target=func, args=['3*5'])
    p.start()
    ret = 5/6
    p.join()  # join方法能够检测到p进程是否已经执行完了，阻塞直到p执行结束
              # p.join()方法一直阻塞，等待子进程算出结果后才执行下面的代码
    with open('file') as f:
        result = f.read()
    ret = ret + int(result)
    print('计算结果为 : {:.2f}'.fORMat(ret))

执行结果：

9980 13644

2236 9980

计算结果为 : 15.83

开启多个子进程

方法一

import os
from multiprocessing import Process

def process(n):
    print(os.getpid(), os.getppid())
    print(n)


if __name__ == '__main__':
    Process(target=process, args=[1, ]).start()
    Process(target=process, args=[2, ]).start()

执行结果

12840 4320

16128 4320

如果需要开启很多个子进程，写多个明显不理智

方法二

import os
from multiprocessing import Process

def process(n):
    print(os.getpid(), os.getppid())
    print(n)


if __name__ == '__main__':
    for i in range(5):
        Process(target=process, args=[i, ]).start()

执行结果

16308 15472

14320 15472

9652 15472

7752 15472

3992 15472

注释：为什么上面执行的顺序是随机的？

是操作系统来决定的，它不一定是按照你的顺序来开启进程，有自己的算法，比如开启一个进程，时间片轮转了，那么就不是顺序的

计算复杂的表达式，怎么使用启用多个进程执行？

import os
import time
from multiprocessing import Process

def process(n):
    print(os.getpid(), os.getppid())
    time.sleep(1)
    print(n)


if __name__ == '__main__':
    # 将所有进程放入一个列表里面
    p_lst = []
    for i in range(10):
        p = Process(target=process, args=[i, ])
        p.start()
        p_lst.append(p)
    for p in p_lst:
        p.join()  # 所有的子进程执行之后，在一起执行join方法(阻塞算结果)，
                  # 所有的子进程都结束后才会执行后面的代码
    print('求和！')

开启进程的第二种方式

通过继承来实现的，必须要重写run方法，名字必须是run

import os
from multiprocessing import Process


class Myprocess(Process):
    def __init__(self, *args):  # *args接收多个参数
        super().__init__()  # 执行父类__init__方法
        self.args = args

    def run(self):
        print(os.getpid(), self.name)  # self.name 为进程名
        for i in self.args:
            print('{}和女主播聊天'.format(i))


if __name__ == '__main__':
    print(os.getpid())
    p = Myprocess('Sam', 'Tom')
    p.start()  # 在执行start的时候，会帮我们主动执行run方法中的内容

执行结果

14340

14780 Myprocess-1

Sam和女主播聊天

Tom和女主播聊天

进程中的数据隔离，如何证明是隔离的呢？

from multiprocessing import Process
n = 100
def func():
    global n  # 声明使用全局变量
    n += 1
    print('son :', n)

# 子进程的变量不会影响主进程的变量
if __name__ == '__main__':
    p = Process(target=func)
    p.start()
    p.join()
    print(n)

执行结果

son : 101

100

守护进程

import time
from multiprocessing import Process

def func():
    print('son start')
    time.sleep(1)
    print('son end')


if __name__ == '__main__':
    p = Process(target=func)
    # 在一个进程开启之前可以设置它为一个守护进程
    p.daemon = True
    p.start()
    time.sleep(0.5)
    print('在主进程中')

执行结果：

son start

在主进程中

总结:守护进程的意义：子进程会随着主进程代码的执行结束而结束

守护进程的作用:

1 守护主进程，程序报活(检查主进程是否存活)

2 主进程开启的时候，建立一个守护进程

3 守护进程只负责每隔1分钟，就给检测程序发一条信息

例2：守护进程

import time
from multiprocessing import Process
def func():
    print('son start')
    while True:
        time.sleep(1)
        print('son')

def func2():
    print('start : in func2')
    time.sleep(5)
    print('end : in func2')


if __name__ == '__main__':
    p = Process(target=func)
    # 在一个进程开启之前可以设置它为守护进程
    p.daemon = True
    p.start()
    Process(target=func2).start()
    time.sleep(2)
    print('在主进程中')

执行结果

son start

start : in func2

son

在主进程中

end : in func2

总结：

主进程会等待子进程的结束而结束

守护进程的意义:

子进程会随着主进程代码的执行结束而结束

注意：守护进程不会关心主进程什么时候结束，我只关心主进程中的代码什么时候结束

守护进程的作用:

守护主进程，程序报活(检测主进程是否存活)

主进程开启的时候，建立一个守护进程

守护进程只负责每隔1分钟，就给检测程序发一条消息

进程中的其它方法

import time
from multiprocessing import Process

def func():
    print('wahaha')
    time.sleep(20)
    print('wahaha end')


if __name__ == '__main__':
    p = Process(target=func)
    p.start()
    print(p.is_alive())  # 检测进程是否存活
    time.sleep(1)
    p.terminate()  # 在主进程中结束一个子进程
                   # 执行命令后，进程不是马上结束，而是等待操作系统来回收
    print(p.is_alive())  # 检测进程是否存活
    time.sleep(0.5)
    print(p.is_alive())  # 检测进程是否存活

执行结果

True

wahaha

True

False

您可能感兴趣的文档:

--结束END--

本文标题: python3--中的进程操作--multiprocess模块

本文链接: https://lsjlt.com/news/179070.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python3--中的进程操作--multiprocess模块

python3--中的进程操作--multiprocess模块

Python中的进程操作模块(multiprocess.process)

python3文件操作相关模块

Python中的线程操作模块(oncurrent)

Python中的协程(Coroutine)操作模块(greenlet、gevent)

Python中struct模块对字节流/二进制流的操作教程

python3中的struct模块使用

Python中操作mysql的pymysql模块详解

如何进行Python模块与函数的应用操作

深入理解Python3中的http.client模块

Python中用psycopg2模块操作PostgreSQL方法

python中有哪些文件操作模块

Python3 导入上级目录中的模块

Python使用cookielib模块操作cookie的实例教程

Python使用Paramiko模块编写脚本进行远程服务器操作

Python 线程池模块之多线程操作代码

node.js 操作系统模块进阶指南：系统操控不求人

Python中的os.path路径模块中的操作方法总结

Python3内置模块中base64的解码方法

python操作jira添加模块的方法

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义