返回顶部
首页 > 资讯 > 操作系统 >如何使用Ganglia对Linux网格和集群服务器进行实时监控
  • 568
分享到

如何使用Ganglia对Linux网格和集群服务器进行实时监控

2023-06-16 14:06:04 568人浏览 泡泡鱼
摘要

本篇内容介绍了“如何使用Ganglia对linux网格和集群服务器进行实时监控”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!从系统管理员接手

本篇内容介绍了“如何使用Ganglia对linux网格和集群服务器进行实时监控”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

从系统管理员接手服务器和主机管理以来,像应用监控这样的工具就成了他们的好帮手。其中比较有名的有 NagiOS、 Zabbix、 Icinga 和  Centreon。以上这些是重量级的监控工具,让一个新手管理员来设置,并使用其中的高级特性是有些困难的。

本文将向你介绍 Ganglia,它是一个易于扩展的监控系统。使用它可以实时查看 Linux 服务器和集群(图形化展示)中的各项性能指标。

Ganglia 能够让你以集群(按服务器组)和网格(按地理位置)的方式更好地组织服务器。

这样,我们可以创建一个包含所有远程主机的网格,然后将那些机器按照其它标准分组成小的集合

此外, Ganglia 的 WEB 页面对移动设备进行过优化,也允许你导出 csv 和 .JSON 格式的数据。

我们的测试环境包括一个安装 Ganglia 的主节点服务器 Centos 7 (IP 地址 192.168.0.29),和一个作为被监控端的 ubuntu  14.04 主机(192.168.0.32)。我们将通过 Ganglia 的 Web 页面来监控这台 Ubuntu 主机。

下面的例子可以给大家提供参考,CentOS7 作为主节点,Ubuntu 作为被监控对象。

安装和配置 Ganglia

请遵循以下步骤,在主节点服务器安装监控工具。

启用 EPEL 仓库 ,然后安装 Ganglia 和相关工具:

# yum update && yum install epel-release # yum install ganglia rrdtool ganglia-gmetad ganglia-gmond ganglia-web

在上面这步随 Ganglia 将安装一些应用,它们的功能如下:

  • rrdtool,Round-Robin 数据库,它是一个储存并图形化显示随着时间变化的数据的工具;

  • ganglia-gmetad 一个守护进程,用来收集被监控主机的数据。被监控主机与主节点主机都要安装  Ganglia-gmond(监控守护进程本身);

  • ganglia-web 提供 Web 前端,用于显示监控系统的历史数据和图形。

使用 Apache 提供的基本认证功能,为 Ganglia Web  界面(/usr/share/ganglia)配置身份认证。

如果你想了解更多高级安全机制,请参阅 Apache 文档的 授权与认证部分。

为完成这个目标,我们需要创建一个用户名并设定一个密码,以访问被 Apache 保护的资源。在本例中,我们先来创建一个叫 adminganglia  的用户名,然后给它分配一个密码,它将被储存在 /etc/Httpd/auth.basic(可以随意选择另一个目录 和/或 文件名, 只要 Apache  对此有读取权限就可以。)

# htpasswd -c /etc/httpd/auth.basic adminganglia

给 adminganglia 输入两次密码完成密码设置。

修改配置文件 /etc/httpd/conf.d/ganglia.conf:

Alias /ganglia /usr/share/ganglia <Location /ganglia> AuthType basic AuthName "Ganglia web UI" AuthBasicProvider file AuthUserFile "/etc/httpd/auth.basic" Require user adminganglia </Location>

编辑 /etc/ganglia/gmetad.conf:

首先,使用 gridname 指令来为网格设置一个描述性名称。

gridname "Home office"

然后,使用 data_source 指令,后面跟集群名(服务器组)、轮询时间间隔(秒)、主节点主机和被监控节点的 IP 地址:

data_source "Labs" 60 192.168.0.29:8649 # 主节点 data_source "Labs" 60 192.168.0.32 # 被监控节点

编辑 /etc/ganglia/gmond.conf。

a) 确保集群的配置类似下面。

cluster { name = "Labs" # gmetad.conf 中的  data_source 指令的名字 owner = "unspecified" latlong = "unspecified" url = "unspecified" }

b) 在 udp_send_chanel 中,注释掉 mcast_join:

udp_send_channel   { # mcast_join = 239.2.11.71 host = localhost port = 8649 ttl = 1 }

c) 在 udp_recv_channel 中,注释掉 mcast_join 和 bind 部分:

udp_recv_channel { # mcast_join = 239.2.11.71 ## comment out port = 8649 # bind = 239.2.11.71 ## comment out }

保存并退出。

打开 8649/udp 端口,使用 SELinux 确保 PHP 脚本(通过 Apache 运行)能够连接到网络

# firewall-cmd --add-port=8649/udp # firewall-cmd --add-port=8649/udp --permanent # setsebool -P httpd_can_network_connect 1

重启 Apache、gmetad、gmond,并确保它们启用了“开机启动”。

# systemctl restart httpd gmetad gmond # systemctl enable httpd gmetad httpd

至此,我们现在能够打开 Ganglia 的 Web 页面 http://192.168.0.29/ganglia 并用步骤 2 中设置的凭证登录。

[如何使用Ganglia对Linux网格和集群服务器进行实时监控][5]

Gangila Web 页面

在 Ubuntu 主机上,只需安装 Ganglia-monitor,等同于 CentOS 上的 ganglia-gmond:

$ sudo aptitude update && aptitude install ganglia-monitor

编辑被监控主机的 /etc/ganglia/gmond.conf 文件。与主节点主机上是相同的文件,除了被注释掉的 cluster,  udp_send_channel , udp_recv_channel 这里不应被注释:

cluster { name = "Labs" # The name in the data_source directive in gmetad.conf owner = "unspecified" latlong = "unspecified" url = "unspecified" } udp_send_channel   { mcast_join = 239.2.11.71 host = localhost port = 8649 ttl = 1 } udp_recv_channel { mcast_join = 239.2.11.71 ## comment out port = 8649 bind = 239.2.11.71 ## comment out }

之后重启服务。

$ sudo service ganglia-monitor restart

刷新页面,你将在 Home office grid / Labs cluster  中看到两台主机的各种统计及图形化的展示(用下拉菜单选择集群,本例中为 Labs):

如何使用Ganglia对Linux网格和集群服务器进行实时监控

Ganglia 中 Home office 网格报告

使用菜单按钮(如上指出的),你可以获取到每台服务器和集群的信息。还可以使用 对比主机Compare Hosts选项卡来比较集群中所有服务器的状态。

可以使用正则表达式选择一组服务器,立刻就可以看到它们性能的对比:

如何使用Ganglia对Linux网格和集群服务器进行实时监控

Ganglia 服务器信息

我最喜欢的一个特点是对移动端有友好的总结界面,可以通过 Mobile 选项来访问。选择你感兴趣的集群,然后选中一个主机。

如何使用Ganglia对Linux网格和集群服务器进行实时监控

Ganglia 移动端总结截图

“如何使用Ganglia对Linux网格和集群服务器进行实时监控”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: 如何使用Ganglia对Linux网格和集群服务器进行实时监控

本文链接: https://lsjlt.com/news/284025.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 如何使用Ganglia对Linux网格和集群服务器进行实时监控
    本篇内容介绍了“如何使用Ganglia对Linux网格和集群服务器进行实时监控”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!从系统管理员接手...
    99+
    2023-06-16
  • 如何使用Python脚本在Linux服务器上进行网络监控
    如何使用Python脚本在Linux服务器上进行网络监控引言:随着科技的发展和互联网的普及,网络已经成为人们生活和工作不可或缺的一部分。然而,网络的稳定性和安全性一直是重要的关注点。为了确保服务器的正常运行,网络监控是必不可少的。本文将介绍...
    99+
    2023-10-22
    Python Linux 脚本 网络监控
  • 如何通过iLO进行Zabbix监控实现针对HP服务器集成
    这篇文章将为大家详细讲解有关如何通过iLO进行Zabbix监控实现针对HP服务器集成,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。      iLO 全名是 Integrat...
    99+
    2023-06-04
  • 如何实时监控Linux服务器性能
    这篇文章主要为大家展示了“如何实时监控Linux服务器性能”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“如何实时监控Linux服务器性能”这篇文章吧。简述dstat 是一款生成Linux系统资源...
    99+
    2023-06-15
  • Linux服务器中如何进行流量监控webalizer
    Linux服务器中如何进行流量监控webalizer,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。webalizewebzlizer是一个免费的web serv...
    99+
    2023-06-05
  • 如何使用Prometheus进行监控数据的收集和存储
    要使用Prometheus进行监控数据的收集和存储,需要按照以下步骤进行操作: 安装Prometheus:首先需要在服务器上安装...
    99+
    2024-04-09
    Prometheus
  • 如何进行服务器集群的扩展和缩减
    如何进行服务器集群的扩展和缩减?在当今高度数字化的时代,服务器集群已经成为许多组织和企业实现高性能和高可用性的重要基础设施。然而,随着业务需求的不断变化,如何有效地进行服务器集群的扩展和缩减成为了一个关键问题。本文将向您介绍一些常用的方法...
    99+
    2024-01-23
    服务器扩展和缩减 服务器集群 云服务器知识
  • html中如何使用pre标签对空行和空格进行控制
    这篇文章主要为大家展示了“html中如何使用pre标签对空行和空格进行控制”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“html中如何使用pre标签对空行和空格...
    99+
    2024-04-02
  • 如何使用Python和Linux一起实现实时日志监控?
    日志监控是现代软件开发过程中必不可少的一环。通过监控日志,我们可以了解系统的运行情况,找出问题所在,并及时进行修复,从而提高系统的稳定性和可靠性。本文将介绍如何使用Python和Linux一起实现实时日志监控。 一、安装必要的软件 在开始...
    99+
    2023-08-28
    实时 日志 linux
  • 如何使用Zabbix来监控远程Linux服务器
    要使用Zabbix来监控远程Linux服务器,您需要按照以下步骤操作: 在远程Linux服务器上安装Zabbix代理程序。您可以通...
    99+
    2024-04-02
  • 如何使用sysdig监控和排除Linux系统服务器故障
    这篇文章主要讲解了“如何使用sysdig监控和排除Linux系统服务器故障”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何使用sysdig监控和排除Linux系统服务器故障”吧!当你需要追...
    99+
    2023-06-13
  • 监控软件Nagios的服务器端如何在Linux系统上进行安装和配置
    本篇内容主要讲解“监控软件Nagios的服务器端如何在Linux系统上进行安装和配置”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“监控软件Nagios的服务器端如何在Linux系统上进行安装和配...
    99+
    2023-06-12
  • 如何使用阿里云服务器进行短信群发
    阿里云服务器是一款高性能、高可用、高安全的云服务器产品,它能够满足各种业务场景的需求。本文将详细讲解如何使用阿里云服务器进行短信群发,包括设置短信模板、配置短信发送平台、发送短信等步骤。 一、设置短信模板在使用阿里云服务器进行短信群发之前,...
    99+
    2023-11-05
    阿里 如何使用 短信群发
  • Linux服务器上的ASP:如何使用HTTP对象进行通信?
    Linux服务器上的ASP:如何使用HTTP对象进行通信? 在使用ASP开发Web应用程序时,与其他服务器进行通信是不可避免的。HTTP协议是Web应用程序中最常用的通信协议之一,因此本文将介绍如何在Linux服务器上使用ASP通过HTTP...
    99+
    2023-10-31
    linux http 对象
  • 使用struts2拦截器如何实现对用户进行权限控制
    使用struts2拦截器如何实现对用户进行权限控制?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。大多数网站会设置用户权限,如过滤非法用户,用户不登录时不能进行访问,或者设置...
    99+
    2023-05-31
    struts 权限控制 拦截器
  • 如何使用Redis和Shell脚本开发实时任务监控功能
    如何使用Redis和Shell脚本开发实时任务监控功能引言:随着互联网的发展,实时任务监控成为了许多系统开发者和运维人员的必备技能。而Redis和Shell脚本作为常用的实时任务监控工具,可以帮助我们方便地管理和监控系统中的任务。本文将介绍...
    99+
    2023-10-22
    redis Shell脚本 实时任务监控
  • 如何使用阿里云服务器进行格式化
    阿里云服务器提供了丰富的服务,包括云存储、云数据库、计算等。在使用阿里云服务器的过程中,我们可能需要进行格式化操作,以清理硬盘空间、恢复出厂设置等。本文将详细介绍如何使用阿里云服务器进行格式化。 首先,我们需要登录阿里云控制台。在控制台中,...
    99+
    2023-11-06
    阿里 如何使用 服务器
  • 如何监控CentOS服务器以及及时发现和应对安全事件
    要监控CentOS服务器并及时发现和应对安全事件,可以采取以下措施:1. 安装防火墙:在服务器上安装并配置防火墙,如iptables...
    99+
    2023-10-10
    CentOS
  • 阿里云监控服务器进程异常如何及时发现和解决
    在使用阿里云服务器时,有时候会遇到服务器进程异常的情况。这可能会导致网站或应用程序无法正常运行,严重影响用户体验。因此,及时发现和解决服务器进程异常是至关重要的。本文将介绍如何通过阿里云监控工具来监测服务器进程,并提供一些常见的服务器进程...
    99+
    2024-01-16
    阿里 进程 异常
  • SUSE系统中如何实现多台服务器的集中管理和监控
    在SUSE系统中,可以使用SUSE Manager来实现多台服务器的集中管理和监控。SUSE Manager是一个企业级的基础设施管...
    99+
    2024-04-09
    SUSE
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作