返回顶部
首页 > 资讯 > 精选 >Node.js中Worker线程的作用是什么
  • 519
分享到

Node.js中Worker线程的作用是什么

2023-06-14 22:06:21 519人浏览 泡泡鱼
摘要

今天就跟大家聊聊有关node.js中Worker线程的作用是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。node.js 中 CPU 密集型应用的历史在 worker 线程之前,

今天就跟大家聊聊有关node.js中Worker线程的作用是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

node.js 中 CPU 密集型应用的历史

在 worker 线程之前,Node.js 中有多种方式执行 CPU 密集型应用。其中的一些为:

  • 使用child_process模块并在一个子进程中运行 CPU 密集型代码

  • 使用cluster模块,在多个进程中运行多个 CPU 密集型操作

  • 使用诸如 Microsoft 的Napa.js这样的第三方模块

但是受限于性能、额外引入的复杂性、占有率低、薄弱的文档化等,这些解决方案无一被广泛采用。

为 CPU 密集型操作使用 worker 线程

尽管对于javascript并发性问题来说,worker_threads是一个优雅的解决方案,但其并未给 JavaScript 本身带来多线程特性。相反,worker_threads通过运行应用使用多个相互隔离的 JavaScript workers 来实现并发,而 workers 和父 worker 之间的通信由 Node 提供。听懵了吗? ‍♂️

在 Node.js 中,每一个 worker 将拥有其自己的 V8 实例及事件循环(Event Loop)。但和child_process不同的是,workers 不共享内存。

以上概念会在后面解释。我们首先来大致看一眼如何使用 Worker 线程。一个原生的用例看起来是这样的:

// worker-simple.jsconst {Worker, isMainThread, parentPort, workerData} = require('worker_threads');if (isMainThread) { const worker = new Worker(__filename, {workerData: {num: 5}}); worker.once('message', (result) => { console.log('square of 5 is :', result); })} else { parentPort.postMessage(workerData.num * workerData.num)}

在上例中,我们向每个单独的 workder 中传入了一个数字以计算其平方值。在计算之后,子 worker 将结果发送回主 worker 线程。尽管看上去简单,但 Node.js 新手可能还是会有点困惑。

Worker 线程是如何工作的?

JavaScript 语言没有多线程特性。因此,Node.js 的 Worker 线程以一种异于许多其它高级语言传统多线程的方式行事。

在 Node.js 中,一个 worker 的职责就是去执行一段父 worker 提供的代码(worker 脚本)。这段 worker 脚本将会在隔绝于其它 workers 的环境中运行,并能够在其自身和父 worker 间传递消息。worker 脚本既可以是一个独立的文件,也可以是一段可被eval解析的文本格式的脚本。在我们的例子中,我们将__filename作为 worker 脚本,因为父 worker 和子 worker 代码都在同一个脚本文件中,由isMainThread属性决定其角色。

每个 worker 通过message channel连接到其父 worker。子 worker 可以使用parentPort.postMessage()函数向消息通道中写入信息,父 worker 则通过调用 worker 实例上的worker.postMessage()函数向消息通道中写入信息。看一下图 1:

Node.js中Worker线程的作用是什么

一个 Message Channel 就是一个简单的通信渠道,其两端被称作 ‘ports'。在 JavaScript/nodejs 术语中,一个 Message Channel 的两端就被叫做port1和port2

Node.js 的 workers 是如何并行的?

现在关键的问题来了,JavaScript 并不直接提供并发,那么两个 Node.js workers 要如何并行呢?答案就是V8 isolate。

一个V8 isolate就是 chrome V8 runtime 的一个单独实例,包含自有的 JS 堆和一个微任务队列。这允许了每个 Node.js worker 完全隔离于其它 workers 地运行其 JavaScript 代码。其缺点在于 worker 无法直接访问其它 workers 的堆数据了。

扩展阅读:JS在浏览器和Node下是如何工作的?

由此,每个 worker 将拥有其自己的一份独立于父 worker 和其它 workers 的 libuv 事件循环的拷贝。

跨越 JS/c++ 的边界

实例化一个新 worker、提供和父级/同级 JS 脚本的通信,都是由 C++ 实现版本的 worker 完成的。在成文时,该实现为worker.cc(https://GitHub.com/nodejs/node/blob/921493e228/src/node_worker.cc)。

Worker 的实现通过worker_threads模块被暴露为用户级的 JavaScript 脚本。该 JS 实现被分割为两个脚本,我将之称为:

  • 初始化脚本 worker.js— 负责初始化 worker 实例,并建立初次父子 worker 通信,以确保从父 worker 传递 worker 元数据至子 worker。(Https://github.com/nodejs/node/blob/921493e228/lib/internal/worker.js)

  • 执行脚本 worker_thread.js— 根据用户提供的workerData数据和其它父 worker 提供的元数据执行用户的 worker JS 脚本。(https://github.com/nodejs/node/blob/921493e228/lib/internal/main/worker_thread.js)

图 2 以更清晰的方式解释了这个过程:

Node.js中Worker线程的作用是什么

基于上述,我们可以将 worker 设置过程划分为两个阶段:

  • worker 初始化

  • 运行 worker

来看看每个阶段都发生了什么吧:

初始化步骤

用户级脚本通过使用worker_threads创建一个 worker 实例

Node 的父 worker 初始化脚本调用 C++ 并创建一个空的 worker 对象。此时,被创建的 worker 还只是个未被启动的简单的 C++ 对象

当 C++ worker 对象被创建后,其生成一个线程 ID 并赋值给自身

同时,一个空的初始化消息通道(让我们称之为IMC)被父 worker 创建。图 2 中灰色的 “Initialisation Message Channel” 部分展示了这点

一个公开的 JS 消息通道(称其为PMC)被 worker 初始化脚本创建。该通道被用户级 JS 使用以在父子 worker 之间传递消息。图 1 中主要描述了这部分,也在图 2 中被标为了红色。

Node 父 worker 初始化脚本调用 C++ 并将需要被发送到 worker 执行脚本中的初始元数据写入IMC。

什么是初始元数据?即执行脚本需要了解以启动 worker 的数据,包括脚本名称、worker 数据、PMC 的port2,以及其它一些信息。

按我们的例子来说,初始化元数据如:

:phone: 嘿!worker 执行脚本,请你用{num: 5}这样的 worker 数据运行一下worker-simple.js好吗?也请你把 PMC 的port2传递给它,这样 worker 就能从 PMC 读取数据啦。

下面的小片段展示了初始化数据如何被写入 IMC:

const kPublicPort = Symbol('kPublicPort');// ...const { port1, port2 } = new MessageChannel();this[kPublicPort] = port1;this[kPublicPort].on('message', (message) => this.emit('message', message));// ...this[kPort].postMessage({  type: 'loadScript',  filename,  doEval: !!options.eval,  cwdCounter: cwdCounter || workerIo.sharedCwdCounter,  workerData: options.workerData,  publicPort: port2,  // ...  hasStdin: !!options.stdin}, [port2]);

代码中的this[kPort]是初始化脚本中 IMC 的端点。尽管 worker 初始化脚本向 IMC 写入了数据,但 worker 执行脚本仍无法访问该数据。

运行步骤

此时,初始化已告一段落;接下来 worker 初始化脚本调用 C++ 并启动 worker 线程。

一个新的V8 isolate被创建并被分配给 worker。前面讲过,一个 “v8 isolate” 就是 chrome V8 runtime 的一个单独实例。这使得 worker 线程的执行上下文隔离于应用代码中的其它部分。

libuv被初始化。这确保了 worker 线程保有其自己独立于应用中的其它部分事件循环。

worker 执行脚本被执行,并且 worker 的事件循环被启动。

worker 执行脚本调用 C++ 并从 IMC 中读取初始化元数据。

worker 执行脚本执行对应文件或代码(在我们的例子中就是worker-simple.js),以作为一个 worker 开始运行。

看看下面的代码片段,worker 执行脚本是如何从 IMC 读取数据的:

const publicWorker = require('worker_threads');// ...port.on('message', (message) => {  if (message.type === 'loadScript') {    const {      cwdCounter,      filename,      doEval,      workerData,      publicPort,      manifestSrc,      manifestURL,      hasStdin    } = message;    // ...    initializeCJSLoader();    initializeESMLoader();        publicWorker.parentPort = publicPort;    publicWorker.workerData = workerData;    // ...        port.unref();    port.postMessage({ type: UP_AND_RUNNING });    if (doEval) {      const { evalScript } = require('internal/process/execution');      evalScript('[worker eval]', filename);    } else {      process.argv[1] = filename; // script filename      require('module').runMain();    }  }  // ...

是否注意到以上片段中的workerData和parentPort属性被指定给了publicWorker对象呢?后者是在 worker 执行脚本中由require('worker_threads')引入的。

这就是为何workerData和parentPort属性只在子 worker 线程内部可用,而在父 worker 的代码中不可用了。

如果尝试在父 worker 代码中访问这两个属性,都会返回null。

充分利用 worker 线程

现在我们理解 Node.js 的 worker 线程是如何工作的了,这的确能帮助我们在使用 Worker 线程时获得最佳性能。当编写比worker-simple.js更复杂的应用时,需要记住以下两个主要的关注点:

尽管 worker 线程比真正的进程更轻量,但如果频繁让 workers 陷入某些繁重的工作仍会开销巨大。

使用 worker 线程承担并行 I/O 操作仍是不划算的,因为 Node.js 原生的 I/O 机制是比从头启动一个 worker 线程去做同样的事更快的方式。

为了克服第 1 点的问题,我们需要实现“worker 线程池”。

worker 线程池

Node.js 的 worker 线程池是一组正在运行且能够被后续任务利用的 worker 线程。当一个新任务到来时,它可以通过父子消息通道被传递给一个可用的 worker。一旦完成了这个任务,子 worker 能将结果通过同样的消息通道回传给父 worker。

一旦实现得当,由于减少了创建新线程带来的额外开销,线程池可以显著改善性能。同样值得一提的是,因为可被有效运行的并行线程数总是受限于硬件,创建一堆数目巨大的线程同样难以奏效。

下图是对三台 Node.js 服务器的一个性能比较,它们都接收一个字符串并返回做了 12 轮加盐处理的一个 Bcrypt 哈希值。三台服务器分别是:

  • 不用多线程

  • 多线程,没有线程池

  • 有 4 个线程的线程池

一眼就能看出,随着负载增长,使用一个线程池拥有显著小的开销。

Node.js中Worker线程的作用是什么

看完上述内容,你们对Node.js中Worker线程的作用是什么有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注编程网精选频道,感谢大家的支持。

--结束END--

本文标题: Node.js中Worker线程的作用是什么

本文链接: https://lsjlt.com/news/275387.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Node.js中Worker线程的作用是什么
    今天就跟大家聊聊有关Node.js中Worker线程的作用是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。Node.js 中 CPU 密集型应用的历史在 worker 线程之前,...
    99+
    2023-06-14
  • Node.js中进程与线程的作用是什么
    本篇内容主要讲解“Node.js中进程与线程的作用是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Node.js中进程与线程的作用是什么”吧!1. 回顾进程...
    99+
    2024-04-02
  • 深入理解Node.js中的Worker线程
    目录概述Node.js 中 CPU 密集型应用的历史为 CPU 密集型操作使用 worker 线程Worker 线程是如何工作的?Node.js 的 workers 是如何并行的?跨...
    99+
    2024-04-02
  • javascript中web worker的作用是什么
    javascript中web worker的作用是什么?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。worker是window对象的一个方法,可以通过以下方式来检测你的浏览...
    99+
    2023-06-15
  • Node.js中的进程和线程是什么
    这篇文章主要介绍“Node.js中的进程和线程是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Node.js中的进程和线程是什么”文章能帮助大家解决问题。一、进...
    99+
    2024-04-02
  • Java多线程之什么是Worker Thread模式
    本篇内容主要讲解“Java多线程之什么是Worker Thread模式”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Java多线程之什么是Worker Thread模式”吧!一.Worker T...
    99+
    2023-06-25
  • Node.js中的单线程模型是什么
    这期内容当中小编将会给大家带来有关Node.js中的单线程模型是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、高并发一般来说,高并发的解决方案就是多线程模型,服务...
    99+
    2024-04-02
  • java中多线程的作用是什么
    这篇文章将为大家详细讲解有关java中多线程的作用是什么,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1、说明多线程是指在一个进程中,并发执行了多个线程,每个线程都实现了不同的功能。2、作用(1)在单核C...
    99+
    2023-06-15
  • Java中 join线程的作用是什么
    Java中 join线程的作用是什么,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。使调用join()的线程执行完毕后才能执行其它线程,在一定意义上,它可以实现同...
    99+
    2023-06-17
  • Python中线程同步的作用是什么
    Python中线程同步的作用是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。假如两个线程对象t1和t2都要对数值num=0进行增1运算,那么t1和t2都各对num修改1...
    99+
    2023-06-17
  • NET Core中的Worker Service是什么/怎么用
    本篇内容主要讲解“NET Core中的Worker Service是什么/怎么用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“NET Core中的Worker Service是什么/怎么用”吧!...
    99+
    2023-06-09
  • python线程join的作用是什么
    Python中的线程是独立运行的,即使主线程(即主程序)运行结束,子线程仍然会继续执行。线程的join()方法的作用是阻塞主线程,直...
    99+
    2023-08-11
    python join
  • Node.js中的进程、线程、协程与并发模型是什么
    这篇文章主要介绍“Node.js中的进程、线程、协程与并发模型是什么”,在日常操作中,相信很多人在Node.js中的进程、线程、协程与并发模型是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方...
    99+
    2024-04-02
  • C++ 多线程编程中 memory barriers 的作用是什么?
    在 c++++ 多线程编程中,内存屏障的作用是确保线程之间数据的一致性。它通过强制线程按照预期顺序执行来防止数据竞争。c++ 提供了顺序一致性屏障、acquire/release 屏障和...
    99+
    2024-05-24
    c++ 多线程
  • python守护线程的作用是什么
    Python中的守护线程是一种特殊类型的线程,其作用是在主线程结束时自动退出,而不需要显式地调用线程的退出方法。守护线程通常用于执行...
    99+
    2023-10-23
    python
  • Android中的线程和线程池有什么作用
    今天小编给大家分享一下Android中的线程和线程池有什么作用的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。前言从用途上来说...
    99+
    2023-07-04
  • 线程池的原理和作用是什么
    这篇文章主要讲解了“线程池的原理和作用是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“线程池的原理和作用是什么”吧!一、为什么需要线程池在实际使用中,线...
    99+
    2024-04-02
  • Python线程安全锁的作用是什么
    Python线程安全锁的主要作用是保护共享资源的访问,以防止多个线程同时访问和修改共享资源导致的数据不一致或错误。 在多线程环境中,...
    99+
    2023-10-23
    Python
  • 线程池的工作流程是什么
    本篇内容主要讲解“线程池的工作流程是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“线程池的工作流程是什么”吧!线程池的各种参数面试的时候最常问的就是线程池的...
    99+
    2024-04-02
  • Node.js异步编程中的callback有什么作用
    这篇文章主要介绍“Node.js异步编程中的callback有什么作用”,在日常操作中,相信很多人在Node.js异步编程中的callback有什么作用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作