首页 > 资讯 > 数据库 >理解Spark运行模式（二）(Yarn Cluster)

792

分享到

理解Spark运行模式（二）(Yarn Cluster)

理解Spark运行模式（二）(Yarn Cluster) 2020-11-26 09:11:56 792人浏览猪猪侠

摘要

上一篇说到spark的yarn client运行模式，它与yarn cluster模式的主要区别就是前者Driver是运行在客户端，后者Driver是运行在yarn集群中。yarn client模式一般用在交互式场景中，比如spark sh

上一篇说到spark的yarn client运行模式，它与yarn cluster模式的主要区别就是前者Driver是运行在客户端，后者Driver是运行在yarn集群中。yarn client模式一般用在交互式场景中，比如spark shell, spark sql等程序，但是该模式下运行在客户端的Driver与Yarn集群有大量的网络交互，如果客户端与集群之间的网络不是很好，可能会导致性能问题。因此一般在生产环境中，大部分还是采用yarn cluster模式运行spark程序。

下面具体还是用计算PI的程序来说明，examples中该程序有三个版本，分别采用Scala、python和Java语言编写。本次用Python程序pi.py做说明。

 1 from __future__ import print_function
 2 
 3 import sys
 4 from random import random
 5 from operator import add
 6 
 7 from pyspark.sql import SparkSession
 8 
 9 
10 if __name__ == "__main__":
11     """
12         Usage: pi [partitions]
13     """
14     spark = SparkSession
15         .builder
16         .appName("PythonPi")
17         .getOrCreate()
18 
19     partitions = int(sys.argv[1]) if len(sys.argv) > 1 else 2
20     n = 100000 * partitions
21 
22     def f(_):
23         x = random() * 2 - 1
24         y = random() * 2 - 1
25         return 1 if x ** 2 + y ** 2 <= 1 else 0
26 
27     count = spark.sparkContext.parallelize(range(1, n + 1), partitions).map(f).reduce(add)
28     print("Pi is roughly %f" % (4.0 * count / n))
29 
30     spark.stop()

程序逻辑与上一篇Scala程序一样，就不再多做说明了。

下面来以yarn cluster方式来执行这个程序，注意执行程序前先要启动hdfs和yarn，最好同时启动spark的history server，这样即使在程序运行完以后也可以从WEB UI中查看到程序运行情况。

输入以下命令：

[root@BruceCentos4 ~]# $SPARK_HOME/bin/spark-submit --master yarn --deploy-mode cluster $SPARK_HOME/examples/src/main/python/pi.py

以下是程序运行输出信息部分截图，

开始部分：

中间部分：

结束部分：

由于程序是以yarn cluster方式运行的，因此Driver是运行在Yarn集群当中（在BruceCentOS3上的ApplicationMaster进程当中），同时在BruceCentOS和BruceCentOS2上各运行了1个Executor进程（进程名字：CoarseGrainedExecutorBackend），而BruceCentOS4上的SparkSubmit进程仅仅作为yarn client向yarn集群提交spark程序。作为对比，在yarn client模式当中，客户端SparkSubmit进程不仅作为yarn client提交程序，而且同时还会运行Driver，并启动SparkContext，并且向Executor分配和管理Task，最后收集运行结果，因此yarn client模式程序输出信息会显示最终的打印结果。然而在yarn cluster模式当中，由于Driver运行在yarn集群的ApplicationMaster中，因此最终结果需要到ApplicationMaster进程的日志中取查看。可以通过如下命令查看。

SparkUI上的Executor信息：

BruceCentOS4上的客户端进程：

BruceCentOS3上的ApplicationMaster进程(包含Spark Driver）：

BruceCentOS上的Executor：

BruceCentOS2上的Executor：

下面具体描述下Spark程序在yarn cluster模式下运行的具体流程。

这里是一个流程图：

Spark Yarn Client向YARN提交应用程序，类似于mapReduce向Yarn提交程序，会将程序文件、库文件和配置文件等上传到HDFS。
ResourceManager收到请求后，在集群中选择一个nodeManager，为该应用程序分配第一个Container，要求它在这个Container中启动应用程序的ApplicationMaster，其中ApplicationMaster中会运行Spark Driver，并进行SparkContext的初始化。
ApplicationMaster向ResourceManager注册，这样用户可以直接通过ResourceManager查看应用程序的运行状态，然后它将采用轮询的方式通过rpc协议为各个任务申请资源，并监控它们的运行状态直到运行结束。
一旦ApplicationMaster申请到资源（也就是Container）后，便与对应的NodeManager通信，要求它在获得的Container中启动CoarseGrainedExecutorBackend，CoarseGrainedExecutorBackend启动后会向ApplicationMaster中的SparkContext注册并申请Task。这一点和Standalone模式一样，只不过SparkContext在Spark Application中初始化时，使用CoarseGrainedSchedulerBackend配合YarnClusterScheduler进行任务的调度。
ApplicationMaster中的SparkContext分配Task给CoarseGrainedExecutorBackend执行，CoarseGrainedExecutorBackend运行Task并向ApplicationMaster汇报运行的状态和进度，以让ApplicationMaster随时掌握各个任务的运行状态，从而可以在任务失败时重新启动任务。
应用程序运行完成后，ApplicationMaster向ResourceManager申请注销并关闭自己。

以上就是个人对Spark运行模式(yarn cluster)的一点理解，其中参考了“求知若渴虚心若愚”博主的“Spark(一): 基本架构及原理”的部分内容（其中基于Spark2.3.0对某些细节进行了修正），在此表示感谢。

您可能感兴趣的文档:

--结束END--

本文标题: 理解Spark运行模式（二）(Yarn Cluster)

本文链接: https://lsjlt.com/news/2326.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

理解Spark运行模式（二）(Yarn Cluster)

理解Spark运行模式（二）(Yarn Cluster)

理解Spark运行模式（一）(Yarn Client)

解析spark源码yarn-cluster模式任务提交

3.spark运行模式

Redis cluster集群模式的原理解析

informix-online动态服务器运行模式管理

win10兼容模式无法运行怎么解决

批处理模式下运行 top 命令的方法

linux怎么在批处理模式下运行top命令

我们如何以批处理模式运行MySQL语句？

构建高性能系统：深入理解Golang Facade模式的运行机制

深入剖析Golang Facade模式的内部机制与运行原理

深入理解以DEBUG方式线程的底层运行原理

三大常用数据库事务详解之三：事务运行模式

以批处理模式或交互方式运行 MySQL 时，默认输出格式有什么区别？

JavaScript 代理模式：实现动态行为和解耦的艺术

Windows8系统下禁用多核心处理器强制其在单核模式下运行

win8怎么禁用多核心处理器核心强制在单核模式下运行

开源操作系统：理解其运作方式和技术构建模块

在批处理模式下运行 MySQL 语句时，我们如何打印以及输出正在执行哪些语句？

关于SQL建表语句使用详解

HBase在大数据审计与合规性追踪中的应用

MySQL与HBase在大数据金融分析中的性能与可扩展性对比

HBase的Region Server之间的网络通信优化

HBase在大数据监控与告警系统中的实时数据处理能力

MySQL与HBase在大数据安全策略中的实现与对比

HBase的分布式事务处理在复杂业务场景中的应用

MySQL与HBase在混合存储架构中的整合策略

HBase如何支持高效的二级索引查询

MySQL与HBase在物联网数据收集与处理中的协作模式