返回顶部
首页 > 资讯 > 数据库 >MHA监控检测报错
  • 767
分享到

MHA监控检测报错

2024-04-02 19:04:59 767人浏览 独家记忆
摘要

MHA安装之后一直正常运行,中间也有出现过切换的情况,不过都正常进行,后有其他dba在mha自动切换后做过一些操作,但并未说做了哪些操作。我再查看状态时,发现监控没有在运行,于是手工启动,结果就报以下错误:

MHA安装之后一直正常运行,中间也有出现过切换的情况,不过都正常进行,后有其他dba在mha自动切换后做过一些操作,但并未说做了哪些操作。我再查看状态时,发现监控没有在运行,于是手工启动,结果就报以下错误:

Mon Nov 20 17:15:11 2017 - [info] MHA::MasterMonitor version 0.56.
Mon Nov 20 17:15:12 2017 - [info] GTID failover mode = 0
Mon Nov 20 17:15:12 2017 - [info] Dead Servers:
Mon Nov 20 17:15:12 2017 - [info] Alive Servers:
Mon Nov 20 17:15:12 2017 - [info]   192.168.2.211(192.168.2.211:3206)
Mon Nov 20 17:15:12 2017 - [info]   192.168.2.212(192.168.2.212:3206)
Mon Nov 20 17:15:12 2017 - [info]   192.168.2.213(192.168.2.213:3206)
Mon Nov 20 17:15:12 2017 - [info] Alive Slaves:
Mon Nov 20 17:15:12 2017 - [info]   192.168.2.212(192.168.2.212:3206)  Version=5.6.24-log (oldest major version between slaves) log-bin:enabled
Mon Nov 20 17:15:12 2017 - [info]     Replicating from 192.168.2.211(192.168.2.211:3206)
Mon Nov 20 17:15:12 2017 - [info]     Primary candidate for the new Master (candidate_master is set)
Mon Nov 20 17:15:12 2017 - [info]   192.168.2.213(192.168.2.213:3206)  Version=5.6.24-log (oldest major version between slaves) log-bin:enabled
Mon Nov 20 17:15:12 2017 - [info]     Replicating from 192.168.2.211(192.168.2.211:3206)
Mon Nov 20 17:15:12 2017 - [info]     Not candidate for the new Master (no_master is set)
Mon Nov 20 17:15:12 2017 - [info] Current Alive Master: 192.168.2.211(192.168.2.211:3206)
Mon Nov 20 17:15:12 2017 - [info] Checking slave configurations..
Mon Nov 20 17:15:12 2017 - [warning]  relay_log_purge=0 is not set on slave 192.168.2.213(192.168.2.213:3206).
Mon Nov 20 17:15:12 2017 - [info] Checking replication filtering settings..
Mon Nov 20 17:15:12 2017 - [info]  binlog_do_db= , binlog_ignore_db=
Mon Nov 20 17:15:12 2017 - [info]  Replication filtering check ok.
Mon Nov 20 17:15:12 2017 - [info] GTID (with auto-pos) is not supported
Mon Nov 20 17:15:12 2017 - [info] Starting ssh connection tests..
Mon Nov 20 17:15:15 2017 - [info] All SSH connection tests passed successfully.
Mon Nov 20 17:15:15 2017 - [info] Checking MHA node version..
Mon Nov 20 17:15:15 2017 - [error][/usr/local/share/perl5/MHA/ManagerUtil.pm, ln122] Got error when getting node version. Error:
Mon Nov 20 17:15:15 2017 - [error][/usr/local/share/perl5/MHA/ManagerUtil.pm, ln123]
bash: apply_diff_relay_logs: command not found
Mon Nov 20 17:15:15 2017 - [error][/usr/local/share/perl5/MHA/ManagerUtil.pm, ln150] node version on 192.168.2.212 not found! Is MHA Node package installed ?
 at /usr/local/share/perl5/MHA/MasterMonitor.pm line 374.
Mon Nov 20 17:15:15 2017 - [error][/usr/local/share/perl5/MHA/MasterMonitor.pm, ln424] Error happened on checking configurations. node version on 192.168.2.212 not found! Is MHA Node package installed ?
 at /usr/local/share/perl5/MHA/MasterMonitor.pm line 374.
        ...propagated at /usr/local/share/perl5/MHA/ManagerUtil.pm line 151.
Mon Nov 20 17:15:15 2017 - [error][/usr/local/share/perl5/MHA/MasterMonitor.pm, ln523] Error happened on monitoring servers.
Mon Nov 20 17:15:15 2017 - [info] Got exit code 1 (Not master dead).

提示到不到命令,同时提示我是否节点2是否没有安装node包,我做过以下尝试:

1)尝试配置环境变量路径,错误依旧。

2)尝试重新安装node包,错误依旧。

网上也查找过报错信息,但都是千篇一律,一篇文章转来转去,没有对应的解决方法。

后来空了又仔细看了下,问题解决掉了,解决方法如下:

[root@kxt-mha-03 ~]# find / -name apply_diff_relay_logs
/usr/local/bin/apply_diff_relay_logs
[root@kxt-mha-03 ~]# ln -s /usr/local/bin/apply_diff_relay_logs  /usr/bin/
[root@kxt-mha-03 ~]# ln -s /usr/local/bin/save_binary_logs   /usr/bin/
[root@kxt-mha-02 ~]# ln -s /usr/local/bin/apply_diff_relay_logs  /usr/bin/
[root@kxt-mha-02 ~]# ln -s /usr/local/bin/save_binary_logs   /usr/bin/
[root@kxt-mha-01 ~]# ln -s /usr/local/bin/apply_diff_relay_logs  /usr/bin/
[root@kxt-mha-01 ~]# ln -s /usr/local/bin/save_binary_logs   /usr/bin/
再次做检测:
Wed Feb 28 10:48:40 2018 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping.
Wed Feb 28 10:48:40 2018 - [info] Reading application default configuration from /etc/mha/conf/app1.cnf..
Wed Feb 28 10:48:40 2018 - [info] Reading server configuration from /etc/mha/conf/app1.cnf..
Wed Feb 28 10:48:40 2018 - [info] MHA::MasterMonitor version 0.56.
Wed Feb 28 10:48:41 2018 - [info] GTID failover mode = 0
Wed Feb 28 10:48:41 2018 - [info] Dead Servers:
Wed Feb 28 10:48:41 2018 - [info] Alive Servers:
Wed Feb 28 10:48:41 2018 - [info]   192.168.2.211(192.168.2.211:3206)
Wed Feb 28 10:48:41 2018 - [info]   192.168.2.212(192.168.2.212:3206)
Wed Feb 28 10:48:41 2018 - [info]   192.168.2.213(192.168.2.213:3206)
Wed Feb 28 10:48:41 2018 - [info] Alive Slaves:
Wed Feb 28 10:48:41 2018 - [info]   192.168.2.212(192.168.2.212:3206)  Version=5.6.24-log (oldest major version between slaves) log-bin:enabled
Wed Feb 28 10:48:41 2018 - [info]     Replicating from 192.168.2.211(192.168.2.211:3206)
Wed Feb 28 10:48:41 2018 - [info]     Primary candidate for the new Master (candidate_master is set)
Wed Feb 28 10:48:41 2018 - [info]   192.168.2.213(192.168.2.213:3206)  Version=5.6.24-log (oldest major version between slaves) log-bin:enabled
Wed Feb 28 10:48:41 2018 - [info]     Replicating from 192.168.2.211(192.168.2.211:3206)
Wed Feb 28 10:48:41 2018 - [info]     Not candidate for the new Master (no_master is set)
Wed Feb 28 10:48:41 2018 - [info] Current Alive Master: 192.168.2.211(192.168.2.211:3206)
Wed Feb 28 10:48:41 2018 - [info] Checking slave configurations..
Wed Feb 28 10:48:41 2018 - [warning]  relay_log_purge=0 is not set on slave 192.168.2.213(192.168.2.213:3206).
Wed Feb 28 10:48:41 2018 - [info] Checking replication filtering settings..
Wed Feb 28 10:48:41 2018 - [info]  binlog_do_db= , binlog_ignore_db= 
Wed Feb 28 10:48:41 2018 - [info]  Replication filtering check ok.
Wed Feb 28 10:48:41 2018 - [info] GTID (with auto-pos) is not supported
Wed Feb 28 10:48:41 2018 - [info] Starting SSH connection tests..
Wed Feb 28 10:48:44 2018 - [info] All SSH connection tests passed successfully.
Wed Feb 28 10:48:44 2018 - [info] Checking MHA Node version..
Wed Feb 28 10:48:44 2018 - [info]  Version check ok.
Wed Feb 28 10:48:44 2018 - [info] Checking SSH publickey authentication settings on the current master..
Wed Feb 28 10:48:44 2018 - [info] HealthCheck: SSH to 192.168.2.211 is reachable.
Wed Feb 28 10:48:45 2018 - [info] Master MHA Node version is 0.56.
Wed Feb 28 10:48:45 2018 - [info] Checking recovery script configurations on 192.168.2.211(192.168.2.211:3206)..
Wed Feb 28 10:48:45 2018 - [info]   Executing command: save_binary_logs --command=test --start_pos=4 --binlog_dir=/data/Mysql/data --output_file=/etc/mha/app1/save_binary_logs_test --manager_version=0.56 --start_file=mysql-bin.013591 
Wed Feb 28 10:48:45 2018 - [info]   Connecting to root@192.168.2.211(192.168.2.211:22).. 
  Creating /etc/mha/app1 if not exists..    ok.
  Checking output directory is accessible or not..
   ok.
  Binlog found at /data/mysql/data, up to mysql-bin.013591
Wed Feb 28 10:48:45 2018 - [info] Binlog setting check done.
Wed Feb 28 10:48:45 2018 - [info] Checking SSH publickey authentication and checking recovery script configurations on all alive slave servers..
Wed Feb 28 10:48:45 2018 - [info]   Executing command : apply_diff_relay_logs --command=test --slave_user='root' --slave_host=192.168.2.212 --slave_ip=192.168.2.212 --slave_port=3206 --workdir=/etc/mha/app1 --target_version=5.6.24-log --manager_version=0.56 --relay_dir=/data/mysql/data --current_relay_log=mysql-relay-bin.000091  --slave_pass=xxx
Wed Feb 28 10:48:45 2018 - [info]   Connecting to root@192.168.2.212(192.168.2.212:22).. 
  Checking slave recovery environment settings..
    Relay log found at /data/mysql/data, up to mysql-relay-bin.000091
    Temporary relay log file is /data/mysql/data/mysql-relay-bin.000091
    Testing mysql connection and privileges..Warning: Using a passWord on the command line interface can be insecure.
 done.
    Testing mysqlbinlog output.. done.
    Cleaning up test file(s).. done.
Wed Feb 28 10:48:46 2018 - [info]   Executing command : apply_diff_relay_logs --command=test --slave_user='root' --slave_host=192.168.2.213 --slave_ip=192.168.2.213 --slave_port=3206 --workdir=/etc/mha/app1 --target_version=5.6.24-log --manager_version=0.56 --relay_dir=/data/mysql/data --current_relay_log=mysql-relay-bin.020034  --slave_pass=xxx
Wed Feb 28 10:48:46 2018 - [info]   Connecting to root@192.168.2.213(192.168.2.213:22).. 
  Checking slave recovery environment settings..
    Relay log found at /data/mysql/data, up to mysql-relay-bin.020034
    Temporary relay log file is /data/mysql/data/mysql-relay-bin.020034
    Testing mysql connection and privileges..Warning: Using a password on the command line interface can be insecure.
 done.
    Testing mysqlbinlog output.. done.
    Cleaning up test file(s).. done.
Wed Feb 28 10:48:46 2018 - [info] Slaves settings check done.
Wed Feb 28 10:48:46 2018 - [info] 
192.168.2.211(192.168.2.211:3206) (current master)
 +--192.168.2.212(192.168.2.212:3206)
 +--192.168.2.213(192.168.2.213:3206)
Wed Feb 28 10:48:46 2018 - [info] Checking replication health on 192.168.2.212..
Wed Feb 28 10:48:46 2018 - [info]  ok.
Wed Feb 28 10:48:46 2018 - [info] Checking replication health on 192.168.2.213..
Wed Feb 28 10:48:46 2018 - [info]  ok.
Wed Feb 28 10:48:46 2018 - [warning] master_ip_failover_script is not defined.
Wed Feb 28 10:48:46 2018 - [warning] shutdown_script is not defined.
Wed Feb 28 10:48:46 2018 - [info] Got exit code 0 (Not master dead).
MySQL Replication Health is OK.

至此问题解决。


您可能感兴趣的文档:

--结束END--

本文标题: MHA监控检测报错

本文链接: https://lsjlt.com/news/44141.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • MHA监控检测报错
    MHA安装之后一直正常运行,中间也有出现过切换的情况,不过都正常进行,后有其他dba在mha自动切换后做过一些操作,但并未说做了哪些操作。我再查看状态时,发现监控没有在运行,于是手工启动,结果就报以下错误:...
    99+
    2024-04-02
  • 如何使用MySQL MHA源代码进行监控检查
    本篇文章给大家分享的是有关如何使用MySQL MHA源代码进行监控检查,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看...
    99+
    2024-04-02
  • 使用supervisor监控mha masterha_manager进程
    我们在用mha自带的masterha_manager脚本做mysql主库故障自动切换时,需要考虑如何让masterha_manager监控进程一直处于正常运行的状态。而supervisor可以很好地解决这个...
    99+
    2024-04-02
  • MySQL MHA 运行状态监控介绍
    目录一 项目描述1.1 背景1.2 实现设计1.2.1 之前的方法1.2.2 优化后的方法 二.实现详情2.1 编辑Python可执行文件2.2 修改 telegraf 文件2.3 ...
    99+
    2024-04-02
  • windows11检测工具报错怎么解决
    这篇文章主要讲解了“windows11检测工具报错怎么解决”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“windows11检测工具报错怎么解决”吧!windows11检测工具报错解决方法:方...
    99+
    2023-07-01
  • golang错字检测
    近年来,随着人工智能技术的快速发展,自然语言处理技术在各个领域越来越受到重视和广泛应用。其中,文本纠错技术在文本处理领域中起着至关重要的作用。本文将介绍一种基于golang开发的错别字检测工具以及其相关原理和算法。首先,错别字检测是指在一篇...
    99+
    2023-05-16
  • 错误日志监控报警脚本
    写在前面:在实际工作中,定期检查数据库错误日志是必不可少的工作项。但是检查的时候却不一定产生了新的错误信息,或者说我们更加希望永远不要有错误信息才好,因为这表示我们的数据库是健壮的。这种情况下,无法预知错误...
    99+
    2024-04-02
  • SpringBoot实现监控Actuator,关闭redis监测
    目录SpringBoot监控Actuator,关闭redis监测方法springboot Actuator查看配置明细运行时度量SpringBoot监控Actuator,关闭redi...
    99+
    2024-04-02
  • vue中语法规则检测报错怎么办
    这篇文章主要介绍了vue中语法规则检测报错怎么办,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。主要报错如下:截取了一段常见报错,选取其中一个...
    99+
    2024-04-02
  • 【2022-New】Flutter doctor 检测报错,Android toolchain - develop for Android devices
    错误一 cmdline-tools component is missing(缺少 cmdline-tools 组件) 解决方案: 点击开发工具左上角,依次点击: file=>settings=>Appearance & Behavior...
    99+
    2023-08-21
    android flutter android studio
  • python监控日志中的报错并进行邮件报警
    目录前言实现思路实现代码前言 在测试过程中,注意力往往都在功能上,如果功能正常,是基本不会查看日志的,反之会查看日志定位问题。但是表面上的功能正常不能确保日志没有报错,不能确保其他功...
    99+
    2024-04-02
  • docker 内存监控与压测方式
    一直运行的docker容器显示内存已经耗尽,并且容器内存耗尽也没出现重启情况,通过后台查看发现进程没有占用多少内存。内存的监控使用的是cadvisor,计算方式也是使用cadviso...
    99+
    2024-04-02
  • JavaScript 错误处理中的错误报告服务:主动监控和警报
    ...
    99+
    2024-04-02
  • Android实现检测手机摇晃的监听器
    android 检测手机摇晃的监听器,实现代码如下所示: public class ShakeListener implements SensorEventListener ...
    99+
    2022-06-06
    监听 监听器 手机 Android
  • python怎么检测函数错误
    在python中检测函数错误,具体方法如下:x = 0lis_y = [i for i in range(64,90)]def test(x,y):print (x+y)def test1(x,y):print( x*y)try:while...
    99+
    2024-04-02
  • docker环境错误如何检测
    在Docker环境中,有几种常见的错误可以被检测到:1. 容器无法启动:当容器的启动命令执行失败时,可以通过查看容器的日志来检测到该...
    99+
    2023-09-23
    docker
  • SensuGo中怎么存储和检索监控数据
    在SensuGo中,监控数据存储在Sensu的数据存储后端中,通常会使用InfluxDB或Elasticsearch等数据存储后端来...
    99+
    2024-04-09
    SensuGo
  • 如何使用 chromedp 检测 javascript 警报
    本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《如何使用 chromedp 检测 javascript 警报》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学...
    99+
    2024-04-05
  • 检查监听报错:WARNING:Subscription for node down event still pending该如何解决
    报错:WARNING:Subscription for node down event still pending该如何解决,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这...
    99+
    2024-04-02
  • 天兔监控SQL Azure报错的解决方法是什么
    天兔监控SQL Azure报错的解决方法是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。 今天新增了两台...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作