目录进程线程内核态线程用户态线程轻量级进程(LWP)小结协程I/O 模型阻塞 I/O非阻塞 I/O同(异)步 I/Onode.js 的并发模型总结前言: node.js 现在已成为构
前言:
node.js 现在已成为构建高并发网络应用服务工具箱中的一员,何以 Node.js 会成为大众的宠儿?本文将从进程、线程、协程、I/O 模型这些基本概念说起,为大家全面介绍关于 Node.js 与并发模型的这些事。
我们一般将某个程序正在运行的实例称之为进程,它是操作系统进行资源分配和调度的一个基本单元,一般包含以下几个部分:
进程表
的表格,每个进程占用一个进程表项
(也叫进程控制块
),该表项包含了程序计数器、堆栈指针、内存分配情况、所打开文件的状态、调度信息等重要的进程状态信息,从而保证进程挂起后,操作系统能够正确地重新唤起该进程。进程具有以下特征:
需要注意的是,如果一个程序运行了两遍,即便操作系统能够使它们共享代码(即只有一份代码副本在内存中),也不能改变正在运行的程序的两个实例是两个不同的进程的事实。
在进程的执行过程中,由于中断、CPU 调度等各种原因,进程会在下面几个状态中切换:
通过上面的进程状态切换图可知,进程可以从运行态切换成就绪态和阻塞态,但只有就绪态才能直接切换成运行态,这是因为:
有些时候,我们需要使用线程来解决以下问题:
关于线程,我们需要知道以下几点:
了解了线程的基本特征,下面我们来聊一下常见的几种线程类型。
内核态线程是直接由操作系统支持的线程,其主要特点如下:
用户态线程是完全建立在用户空间的线程,其主要特点如下:
轻量级进程(LWP)是建立在内核之上并由内核支持的用户线程,其主要特点如下:
上文我们对常见的线程类型(内核态线程、用户态线程、轻量级进程)进行了简单介绍,它们各自有各自的适用范围,在实际的使用中可根据自己的需要自由地对其进行组合使用,比如常见的一对一、多对一、多对多等模型,由于篇幅限制,本文对此不做过多介绍,感兴趣的同学可自行研究。
协程(Coroutine),也叫纤程(Fiber),是一种建立在线程之上,由开发者自行管理执行调度、状态维护等行为的一种程序运行机制,其特点主要有:
在 javascript 中,我们经常用到的 async/await
便是协程的一种实现,
比如下面的例子:
function updateUserName(id, name) {
const user = getUserById(id);
user.updateName(name);
return true;
}
async function updateUserNameAsync(id, name) {
const user = await getUserById(id);
await user.updateName(name);
return true;
}
上例中,函数 updateUserName
和 updateUserNameAsync
内的逻辑执行顺序是:
getUserById
并将其返回值赋给变量 user
;user
的 updateName
方法;true
给调用者。两者的主要区别在于其实际运行过程中的状态控制:
updateUserName
的执行过程中,按照前文所述的逻辑顺序依次执行;updateUserNameAsync
的执行过程中,同样按照前文所述的逻辑顺序依次执行,只不过在遇到 await
时,updateUserNameAsync
将会被挂起并保存挂起位置当前的程序状态,直到 await
后面的程序片段返回后,才会再次唤醒 updateUserNameAsync
并恢复挂起前的程序状态,然后继续执行下一段程序。通过上面的分析我们可以大胆猜测:协程要解决的并非是进程、线程要解决的程序并发问题,而是要解决处理异步任务时所遇到的问题(比如文件操作、网络请求等);在 async/await
之前,我们只能通过回调函数来处理异步任务,这很容易使我们陷入回调地狱
,生产出一坨坨屎一般难以维护的代码,通过协程,我们便可以实现异步代码同步化的目的。
需要牢记的是:协程的核心能力是能够将某段程序挂起并维护程序挂起位置的状态,并在未来某个时刻在挂起的位置恢复,并继续执行挂起位置后的下一段程序。
一个完整的 I/O
操作需要经历以下阶段:
I/O
操作请求;I/O
操作请求进行处理(分为准备阶段和实际执行阶段),并将处理结果返回给用户进(线)程。我们可将 I/O
操作大致分为阻塞 I/O
、非阻塞 I/O
、同步 I/O
、异步 I/O
四种类型,在讨论这些类型之前,我们先熟悉下以下两组概念(此处假设服务 A 调用了服务 B):
阻塞/非阻塞:
阻塞调用
;非阻塞调用
。同步/异步:
同步
的;回调
的方式将执行结果通知给 A,那么服务 B 就是异步
的。很多人经常将阻塞/非阻塞
与同步/异步
搞混淆,故需要特别注意:
阻塞/非阻塞
针对于服务的调用者
而言;同步/异步
针对于服务的被调用者
而言。了解了阻塞/非阻塞
与同步/异步
,我们来看具体的 I/O 模型
。
定义:用户进(线)程发起 I/O
系统调用后,用户进(线)程会被立即阻塞
,直到整个 I/O
操作处理完毕并将结果返回给用户进(线)程后,用户进(线)程才能解除阻塞
状态,继续执行后续操作。
特点:
I/O
操作的时候,用户进(线)程不能进行其它操作;I/O
请求就能阻塞进(线)程,所以为了能够及时响应 I/O
请求,需要为每个请求分配一个进(线)程,这样会造成巨大的资源占用,并且对于长连接请求来说,由于进(线)程资源长期得不到释放,如果后续有新的请求,将会产生严重的性能瓶颈。定义:
I/O
系统调用后,如果该 I/O
操作未准备就绪,该 I/O
调用将会返回一个错误,用户进(线)程也无需等待,而是通过轮询的方式来检测该 I/O
操作是否就绪;I/O
操作会阻塞用户进(线)程直到执行结果返回给用户进(线)程。特点:
I/O
操作就绪状态(一般使用 while
循环),因此该模型需占用 CPU,消耗 CPU 资源;I/O
操作就绪前,用户进(线)程不会阻塞,等到 I/O
操作就绪后,后续实际的 I/O
操作将阻塞用户进(线)程;用户进(线)程发起 I/O
系统调用后,如果该 I/O
调用会导致用户进(线)程阻塞,那么该 I/O
调用便为同步 I/O
,否则为 异步 I/O
。
判断 I/O
操作同步
或异步
的标准是用户进(线)程与 I/O
操作的通信机制,其中:
同步
情况下用户进(线)程与 I/O
的交互是通过内核缓冲区进行同步的,即内核会将 I/O
操作的执行结果同步到缓冲区,然后再将缓冲区的数据复制到用户进(线)程,这个过程会阻塞用户进(线)程,直到 I/O
操作完成;异步
情况下用户进(线)程与 I/O
的交互是直接通过内核进行同步的,即内核会直接将 I/O
操作的执行结果复制到用户进(线)程,这个过程不会阻塞用户进(线)程。Node.js 采用的是单线程、基于事件驱动的异步 I/O
模型,个人认为之所以选择该模型的原因在于:
I/O
密集型的,在保证高并发的情况下,如何合理、高效地管理多线程资源相对于单线程资源的管理更加复杂。总之,本着简单、高效的目的,Node.js 采用了单线程、基于事件驱动的异步 I/O
模型,并通过主线程的 EventLoop 和辅助的 Worker 线程来实现其模型:
需要注意的是,Node.js 并不适合执行 CPU 密集型(即需要大量计算)任务;这是因为 EventLoop 与 JavaScript 代码(非异步事件任务代码)运行在同一线程(即主线程),它们中任何一个如果运行时间过长,都可能导致主线程阻塞,如果应用程序中包含大量需要长时间执行的任务,将会降低服务器的吞吐量,甚至可能导致服务器无法响应。
Node.js 是前端开发人员现在乃至未来不得不面对的技术,然而大多数前端开发人员对 Node.js 的认知仅停留在表面,为了让大家更好地理解 Node.js 的并发模型,本文先介绍了进程、线程、协程,接着介绍了不同的 I/O
模型,最后对 Node.js 的并发模型进行了简单介绍。虽然介绍 Node.js 并发模型的篇幅不多,但笔者相信万变不离其宗,掌握了相关基础,再深入理解 Node.js 的设计与实现必将事半功倍。
到此这篇关于Node.js 与并发模型的详细介绍的文章就介绍到这了,更多相关Node.js 并发模型内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
--结束END--
本文标题: Node.js 与并发模型的详细介绍
本文链接: https://lsjlt.com/news/164677.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-01-12
2023-05-20
2023-05-20
2023-05-20
2023-05-20
2023-05-20
2023-05-20
2023-05-20
2023-05-20
2023-05-20
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0