返回顶部
首页 > 资讯 > 精选 >如何进行spark on yarn 的资源调度器设置.
  • 406
分享到

如何进行spark on yarn 的资源调度器设置.

2023-06-03 04:06:26 406人浏览 独家记忆
摘要

本篇文章给大家分享的是有关如何进行spark on yarn 的资源调度器设置.,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。最近一段时间 发现了一个问题. 就是即便

本篇文章给大家分享的是有关如何进行spark on yarn 的资源调度器设置.,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

最近一段时间 发现了一个问题. 就是即便在整个集群  不忙的时候, 也会某几个节点, 会被spark on yarn 的任务跑满. 

而不是把任务均匀的分配到到多几个节点上. 

百思不解. 

于是开始各个方面的调查.  从spark 方面没有发现什么问题. 回过头来看yarn . 

发现原来使我们的资源调度的配置上有点问题. 

  <property>

    <name>yarn.scheduler.capacity.resource-calculator</name>

    <!--value>org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator</value-->

    <value>org.apache.hadoop.yarn.util.resource.DominantResourceCalculator</value>

    <description>

      The ResourceCalculator implementation to be used to compare

      Resources in the scheduler.

      The default i.e. DefaultResourceCalculator only uses Memory while

      DominantResourceCalculator uses dominant-resource to compare

      multi-dimensional resources such as Memory, CPU etc.

    </description>

  </property>

问题就出在这里了.  default  调度器, 只关注node 的内存 情况, 根据内存情况来分派任务. 

这就是导致, 如果一个spark 任务向yarn 申请container 的时候, yarn 只关注了 某几个点的内存情况. 

如果内存满足 spark 的要求, 就可能把所有的container 都分派到一个node 去,导致这个node 节点 负载飚高. 

比如 spark 申请 10个 1g 内存的container . 然后 yarn 发现有2个节点  各有5g 空闲内存,  但是却只有3个cpu 空闲. 

那么可能就会只有这俩node 来跑这10个container , 而不是把10个container 分配到10个node上去.

然后就出现我们前面说的情况.  内存充足但是cpu不足. 导致spark 的container 只有3个在运行. 另外俩个要等待 .  

这也符合我们前面看到的现象.  

以上就是如何进行spark on yarn 的资源调度器设置.,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注编程网精选频道。

--结束END--

本文标题: 如何进行spark on yarn 的资源调度器设置.

本文链接: https://lsjlt.com/news/232588.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 如何进行spark on yarn 的资源调度器设置.
    本篇文章给大家分享的是有关如何进行spark on yarn 的资源调度器设置.,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。最近一段时间 发现了一个问题. 就是即便...
    99+
    2023-06-03
  • Hadoop Yarn的资源调度器有哪些
    这篇文章主要介绍“Hadoop Yarn的资源调度器有哪些”,在日常操作中,相信很多人在Hadoop Yarn的资源调度器有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Hadoop Yarn的资源调度器...
    99+
    2023-06-02
  • Spark中的资源调度器是什么
    在Spark中,资源调度器是负责管理和分配集群资源的组件。它负责将任务分配给集群中的各个节点,以确保任务在可用资源上得到有效执行。S...
    99+
    2024-03-05
    Spark
  • 如何进行C++代码的资源管理?
    如何进行C++代码的资源管理以C++为例,资源管理是程序开发中非常重要的一环。良好的资源管理可以提高程序的性能和稳定性,减少内存泄漏和资源浪费。本文将介绍一些常用的C++资源管理技术和最佳实践。1.使用智能指针:C++11引入了智能指针的概...
    99+
    2023-11-02
    内存管理 资源分配 C++资源管理
  • 如何进行C++代码的资源优化?
    如何进行C++代码的资源优化在计算机编程中,资源优化是一项非常重要的工作。资源的优化可以帮助我们提高程序的性能、减少内存占用以及节省宝贵的计算资源。在C++编程中,我们可以采取一些方法来进行代码的资源优化,本文将介绍一些常用的方法和技巧。一...
    99+
    2023-11-04
    内存管理(Memory Management)
  • 如何在PHP项目中进行性能调优和资源优化?
    如何在PHP项目中进行性能调优和资源优化?随着互联网的高速发展,越来越多的应用程序采用了PHP作为开发语言。由于PHP的易用性和灵活性,许多开发人员选择使用它来构建自己的网站和应用程序。然而,由于PHP的动态特性和解释性质,一些开发人员可能...
    99+
    2023-11-03
    性能调优 PHP项目 资源优化
  • java开源调度如何给xxljob加k8s执行器
    目录前言执行器接口K8S执行器设计1、在XXL-JOB-ADMIN模块新增执行器2、引入K8S-CLIENT-JAVA,使用SERVICEACCOUNT机制与K8S交互3、编写代理执...
    99+
    2024-04-02
  • 如何进行C++代码的任务调度?
    如何进行C++代码的任务调度概述任务调度是计算机科学中的一个重要主题,它涉及使用合适的算法和数据结构来有效地安排和执行任务。在C++编程中,任务调度尤为重要,因为在复杂的应用程序中,我们经常需要同时处理多个任务,为了保证程序的顺利执行,我们...
    99+
    2023-11-03
    调度算法 代码调度 C++任务调度
  • win10资源管理器预览窗格如何设置
    本文小编为大家详细介绍“win10资源管理器预览窗格如何设置”,内容详细,步骤清晰,细节处理妥当,希望这篇“win10资源管理器预览窗格如何设置”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。win10资源管理器预...
    99+
    2023-07-01
  • solaris10如何使用projadd进行资源限制的添加
    这篇文章主要介绍了solaris10如何使用projadd进行资源限制的添加,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一...
    99+
    2024-04-02
  • 如何进行C#打印设置实现源码的分析
    本篇文章为大家展示了如何进行C#打印设置实现源码的分析,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。C#打印设置是如何在实际编程开发中体现的呢?C#打印设置需要注意什么呢?C#打印设置常用属性是如何...
    99+
    2023-06-17
  • 如何进行Oracle Linux 6.9的yum源配置
    本篇文章为大家展示了如何进行Oracle Linux 6.9的yum源配置,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。操作系统:Oracle Linux 6.9 虚拟 &nbs...
    99+
    2023-06-05
  • Win10如何自定义设置文件资源管理器打开位置
    这篇文章给大家分享的是有关Win10如何自定义设置文件资源管理器打开位置的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。具体方法如下:在记事本中写入如下图命令(“X:\你的文件夹”改为你想要自定义的位置):WScr...
    99+
    2023-06-14
  • 如何设置node.js模块和其下载资源的镜像
    这篇文章将为大家详细讲解有关如何设置node.js模块和其下载资源的镜像,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。后来研究发现 npm 不仅可以设置 node.js ...
    99+
    2024-04-02
  • 阿里云服务器分区如何有效地进行资源管理
    阿里云服务器分区是一种有效的资源管理方式,可以有效地帮助学生在使用阿里云服务器时,更好地管理自己的资源,提高使用效率。本文将详细介绍阿里云服务器分区的基本概念、创建和管理分区的过程以及其带来的优势。 阿里云服务器分区是一种将阿里云服务器的硬...
    99+
    2023-11-19
    阿里 有效地 分区
  • win7系统如何进行适配器设置
      win7系统如何进行适配器设置?在电脑的适配器选项中我们可以去进行网络的设置,一些用户对于这个设置操作比较陌生。今天小编为大家带来win7系统进行适配器设置的更改详细讲解,让你轻松的学会怎么去进行适配器设置使用的方法。  win7系统进...
    99+
    2023-07-10
  • 如何进行Multi Router Traffic Grapher的设置
    如何进行Multi Router Traffic Grapher的设置,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。Multi Router Traffic Grapher...
    99+
    2023-06-13
  • 如何进行IdeaIU 2019.3.3的主要设置
    如何进行IdeaIU 2019.3.3的主要设置,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。Maven选择maven版本,一般用maven-3.3.9或者maven-3.5....
    99+
    2023-06-26
  • 如何进行robots.txt 中的robots优化设置
    本篇文章为大家展示了如何进行robots.txt 中的robots优化设置,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1。你是否知道robots.txt中文的意思   2。你是否知道404页面应该...
    99+
    2023-06-12
  • 如何进行CentOS7服务器搭建的基本设置
    如何进行CentOS7服务器搭建的基本设置,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。设置yum源默认使用国外yum源,速度慢,可以更换至国内yum源。腾讯云...
    99+
    2023-06-26
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作