返回顶部
首页 > 资讯 > 数据库 >如何巧用Event发现问题
  • 101
分享到

如何巧用Event发现问题

2024-04-02 19:04:59 101人浏览 安东尼
摘要

小编给大家分享一下如何巧用Event发现问题,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!如果图片不能显示可查看下面链接:htt

小编给大家分享一下如何巧用Event发现问题,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

如果图片不能显示可查看下面链接:
https://www.jianshu.com/p/d636215d767f

有了前面对Event的了解,我们就可以利用这些Event来完成一些工作了。我曾经在学习了这些常用的Event后,使用C语言写过一个解析Event的工具,我叫它‘infobin’,意思就是从binary log提取信息的意思。据我所知虽然这个工具在少数情况下会出现BUG但是还是有些朋友在用。我这里并不是要推广我的工具,而是要告诉大家这种思路。我是结合工作中遇到的一些问题来完成了这个工具的,主要功能包含如下:

  • 分析binary log中是否有长期未提交的事务 ,长期不提交的事务将会引发更多的争用。

  • 分析binary log中是否有大事务 ,大事务的提交可能会堵塞其它事务的提交。

  • 分析binary log中每个表生成了多少DML Event,这样就能知道哪个表的修改量最大。

  • 分析binary log中Event的生成速度,这样就能知道哪个时间段生成的Event更多。

这个工具的帮助信息如下:

[root@gp1 infobin]#  ./infobin 
USAGE ERROR!
[Author]: gaopeng [QQ]:22389860 [blog]:Http://blog.itpub.net/7728585/ 
--USAGE:./infobin binlogfile pieces bigtrxsize bigtrxtime [-t] [-force]
[binlogfile]:binlog file!
[piece]:how many piece will split,is a Highly balanced histogram,
        find which time generate biggest binlog.(must:piece<2000000)
[bigtrxsize](bytes):larger than this size trx will view.(must:trx>256(bytes))
[bigtrxtime](sec):larger than this sec trx will view.(must:>0(sec))
[[-t]]:if [-t] no detail is print out,the result will small
[[-force]]:force analyze if unkown error check!!

接下来我们具体来看看这几个功能大概是怎么实现的。

一、分析长期未提交的事务

前面我已经多次提到过对于一个手动提交的事务而言有如下特点,我们以‘Insert’语句为列:

  1. GTID_LOG_EVENT和XID_EVENT是命令‘COMMIT’发起的时间。

  2. QUERY_EVENT是第一个‘Insert’命令发起的时间。

  3. MAP_EVENT/WRITE_ROWS_EVENT是每个‘Insert’命令发起的时间。

那实际上我们就可以用(1)减去(2)就能得到第一个‘DML’命令发起到‘COMMIT’命令发起之间所消耗的时间,再使用一个用户输入参数来自定义多久没有提交的事务叫做长期未提交的事务就可以了,我的工具中使用bigtrxtime作为这个输入。我们来用一个例子说明,我们做如下语句:

语句时间
beginT1
insert into testrr values(20);11:25:22
insert into testrr values(30);11:25:26
insert into testrr values(40);11:25:28
commit;11:25:30

我们来看看Event的顺序和时间如下:
|Event|时间|
|—-|—-|
|GTID_LOG_EVENT|11:25:30|
|QUERY_EVENT|11:25:22|
|MAP_EVENT(第1个insert)|11:25:22|
|WRITE_ROWS_EVENT(第1个insert)|11:25:22|
|MAP_EVENT(第2个insert)|11:25:26|
|WRITE_ROWS_EVENT(第2个insert)|11:25:26|
|MAP_EVENT(第3个insert)|11:25:28|
|WRITE_ROWS_EVENT(第3个insert)|11:25:28|
|XID_EVENT|11:25:30|

如果我们使用最后一个XID_EVENT的时间减去QUERY_EVENT的时间,那么这个事务从第一条语句开始到‘COMMIT’的时间就计算出来了。注意一点,实际上‘BEGIN’命令并没有记录到Event中,它只是做了一个标记让事务不会自动进入提交流程,关于‘BEGIN’命令做了什么可以参考我的简书文章如下:
https://www.jianshu.com/p/6de1e8071279

二、分析大事务

这部分实现比较简单,我们只需要扫描每一个事务GTID_LOG_EVENT和XID_EVENT之间的所有Event将它们的总和计算下来,就可以得到每一个事务生成Event的大小(但是为了兼容最好计算QUERY_EVENT和XID_EVENT之间的Event总量)。再使用一个用户输入参数自定义多大的事务叫做大事务就可以了,我的工具中使用bigtrxsize作为这个输入参数。

如果参数binlog_row_image参数设置为‘FULL’,我们可以大概计算一下特定表的每行数据修改生成的日志占用的大小:

  • ‘Insert’和‘Delete’:因为只有before_image或者after_image,因此100字节一行数据加上一些额外的开销大约加上10字节也就是110字节一行。如果定位大事务为100M那么大约修改量为100W行数据。

  • ‘Update’:因为包含before_image和after_image,因此上面的计算的110字节还需要乘以2。因此如果定位大事务为100M那么大约修改量为50W行数据。

我认为20M作为大事务的定义比较合适,当然这个根据自己的需求进行计算。

三、分析binary log中Event的生成速度

这个实现就很简单了,我们只需要把binary log按照输入参数进行分片,统计结束Event和开始Event的时间差值就能大概算出每个分片生成花费了多久时间,我们工具使用piece作为分片的传入参数。通过这个分析,我们可以大概知道哪一段时间Event生成量更大,也侧面反映了数据库的繁忙程度。

四、分析每个表生成了多少DML Event

这个功能也非常实用,通过这个分析我们可以知道数据库中哪一个表的修改量最大。实现方式主要是通过扫描binary log中的MAP_EVENT和接下来的DML Event,通过table id获取表名,然后将DML Event的大小归入这个表中,做一个链表,最后排序输出就好了。但是前面我们说过table id即便在一个事务中也可能改变,这是我开始没有考虑到的,因此这个工具有一定的问题,但是大部分情况是可以正常运行的。

五、工具展示

下面我就来展示一下我说的这些功能,我做了如下操作:

Mysql> flush binary logs;
Query OK, 0 rows affected (0.51 sec)
mysql> select count(*) from tti;
+----------+
| count(*) |
+----------+
|    98304 |
+----------+
1 row in set (0.06 sec)
mysql> delete from tti;
Query OK, 98304 rows affected (2.47 sec)
mysql> begin;
Query OK, 0 rows affected (0.00 sec)
mysql> insert into tti values(1,'gaopeng');
Query OK, 1 row affected (0.00 sec)
mysql> select sleep(20);
+-----------+
| sleep(20) |
+-----------+
|         0 |
+-----------+
1 row in set (20.03 sec)
mysql> commit;
Query OK, 0 rows affected (0.22 sec)
mysql> insert into tpp values(10);
Query OK, 1 row affected (0.14 sec)

在示例中我切换了一个binary log,同时做了3个事务:

  • 删除了tti表数据一共98304行数据。

  • 向tti表插入了一条数据,等待了20多秒提交。

  • 向tpp表插入了一条数据。

我们使用工具来分析一下,下面是统计输出:

./infobin mysql-bin.000005 3 1000000 15 -t > log.log
more log.log 
...
-------------Total now--------------
Trx total[counts]:3
Event total[counts]:125
Max trx event size:8207(bytes) Pos:420[0X1A4]
Avg binlog size(/sec):9265.844(bytes)[9.049(kb)]
Avg binlog size(/min):555950.625(bytes)[542.921(kb)]
--Piece view:
(1)Time:1561442359-1561442383(24(s)) piece:296507(bytes)[289.558(kb)]
(2)Time:1561442383-1561442383(0(s)) piece:296507(bytes)[289.558(kb)]
(3)Time:1561442383-1561442455(72(s)) piece:296507(bytes)[289.558(kb)]
--Large than 500000(bytes) trx:
(1)Trx_size:888703(bytes)[867.874(kb)] trx_begin_p:299[0X12B] 
trx_end_p:889002[0XD90AA]
Total large trx count size(kb):#867.874(kb)
--Large than 15(secs) trx:
(1)Trx_sec:31(sec)  trx_begin_time:[20190625 14:00:08(CST)] 
trx_end_time:[20190625 14:00:39(CST)] trx_begin_pos:889067
trx_end_pos:889267 query_exe_time:0 
--Every Table binlog size(bytes) and times:
Note:size unit is bytes
---(1)Current Table:test.tpp::
   Insert:binlog size(40(Bytes)) times(1)
   Update:binlog size(0(Bytes)) times(0)
   Delete:binlog size(0(Bytes)) times(0)
   Total:binlog size(40(Bytes)) times(1)
---(2)Current Table:test.tti::
   Insert:binlog size(48(Bytes)) times(1)
   Update:binlog size(0(Bytes)) times(0)
   Delete:binlog size(888551(Bytes)) times(109)
   Total:binlog size(888599(Bytes)) times(110)
---Total binlog dml event size:888639(Bytes) times(111)

我们发现我们做的操作都统计出来了:

  • 包含一个大事务日志总量大于500K,大小为800K左右,这是我的删除tti表中98304行数据造成的。

    --Large than 500000(bytes) trx:
    (1)Trx_size:888703(bytes)[867.874(kb)] trx_begin_p:299[0X12B] 
    trx_end_p:889002[0XD90AA]
  • 包含一个长期未提交的事务,时间为31秒,这是我特意等待20多秒提交引起的。

    --Large than 15(secs) trx:
    (1)Trx_sec:31(sec)  trx_begin_time:[20190625 14:00:08(CST)]
    trx_end_time:[20190625 14:00:39(CST)] trx_begin_pos:889067
    trx_end_pos:889267 query_exe_time:0
  • 本binary log有两个表的修改记录tti和tpp,其中tti表有‘Delete’操作和‘Insert’操作,tpp表只有‘Insert’操作,并且包含了日志量的大小。

--Every Table binlog size(bytes) and times:
Note:size unit is bytes
---(1)Current Table:test.tpp::
   Insert:binlog size(40(Bytes)) times(1)
   Update:binlog size(0(Bytes)) times(0)
   Delete:binlog size(0(Bytes)) times(0)
   Total:binlog size(40(Bytes)) times(1)
---(2)Current Table:test.tti::
   Insert:binlog size(48(Bytes)) times(1)
   Update:binlog size(0(Bytes)) times(0)
   Delete:binlog size(888551(Bytes)) times(109)
   Total:binlog size(888599(Bytes)) times(110)
---Total binlog dml event size:888639(Bytes) times(111)

好了到这里我想告诉你的就是,学习了Event过后就可以自己通过各种语言去试着解析binary log,也许你还能写出更好的工具实现更多的功能。

当然也可以通过mysqlbinlog 进行解析后,然后通过shell/python去统计,但是这个工具的速度要远远快于这种方式。

以上是“如何巧用Event发现问题”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网数据库频道!

您可能感兴趣的文档:

--结束END--

本文标题: 如何巧用Event发现问题

本文链接: https://lsjlt.com/news/62688.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 如何巧用Event发现问题
    小编给大家分享一下如何巧用Event发现问题,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!如果图片不能显示可查看下面链接:htt...
    99+
    2024-04-02
  • mysql如何实现event
    小编给大家分享一下mysql如何实现event,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧! 1、...
    99+
    2024-04-02
  • GO语言编程中的调试技巧:如何更快地发现问题?
    GO语言是一种快速、简洁、安全的编程语言,很多程序员都喜欢使用它来开发高效的网络服务和并发应用程序。然而,在GO语言编程过程中,程序员难免会遇到一些bug和错误,这时候需要使用调试技巧来快速定位和解决问题。本文将介绍一些GO语言编程中的调...
    99+
    2023-10-15
    编程算法 javascript git
  • JS event如何使用
    在JavaScript中,事件可以使用以下方式来使用:1. HTML属性:可以将事件直接作为HTML元素的属性来使用。例如,可以使用...
    99+
    2023-08-14
    JS event
  • mysql如何创建event并实现保存event执行history
    这篇文章给大家分享的是有关mysql如何创建event并实现保存event执行history的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。 1.创建保...
    99+
    2024-04-02
  • JavaScript中event如何使用
    本篇文章给大家分享的是有关JavaScript中event如何使用,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。JS event使用方法详解 ...
    99+
    2024-04-02
  • 如何解决用Python脚本发现OpenStack Overcloud中的问题
    这期内容当中小编将会给大家带来有关如何解决用Python脚本发现OpenStack Overcloud中的问题,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。OpenStack 在其 Overcloud 节...
    99+
    2023-06-16
  • C#开发中如何处理并发访问问题
    C#开发中如何处理并发访问问题在C#开发中,处理并发访问问题是非常重要的,尤其是在多线程环境下。如果不正确处理并发访问,可能会导致数据不一致或者程序崩溃等问题。本文将介绍一些在C#开发中处理并发访问问题的常用方法,并提供具体的代码示例。使用...
    99+
    2023-10-22
    并发处理 线程安全 锁定
  • java并发问题如何处理
    如何解决并发带来的脏数据问题?使用synchronized来起到同步加锁的作用,首先可以在类方法加synchronized关键字,代表方法锁(相关视频教程分享:java视频教程)也可以用synchronized关键字来声明一个同步块可以使用...
    99+
    2017-08-03
    java教程 java 并发问题 处理
  • mysql如何解决并发问题
    mysql并发的解决方法优化sql语句优化代码中sql语句,应尽量避免全表扫描,在 where 及 order by 涉及的列上建立索引;并避免频繁创建和删除临时表,以减少系统表资源的消耗。添加缓存缓存适合读多写少更新频度相对较低...
    99+
    2024-04-02
  • java并发问题如何解决
    Java中的并发问题可以通过以下几种方式来解决:1. 使用同步机制:可以使用synchronized关键字或者Lock接口来对共享资...
    99+
    2023-08-12
    java
  • 如何利用Storage Event实现页面间通信
    这篇文章主要介绍了如何利用Storage Event实现页面间通信,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。我们都知道触发window.onstorage必须满足以下两个...
    99+
    2023-06-09
  • 如何实现Spring Event(异步事件)
    目录一、叙述Spring的事件需要遵循如下流程Spring框架中事件二、上Demo示例1. pom文件2. 自定义一个事件继承ApplicationEvent3. 自定义一个监听器实...
    99+
    2023-02-14
    Spring Event Spring Event 异步事件 Spring异步事件
  • 教你巧用 import.meta 实现热更新的问题
    目录import.meta应用场景URL()二者结合使用import.meta import.meta 是一个给 JavaScript 模块暴露特定上下文的元数据属性的对象,它包含了...
    99+
    2024-04-02
  • 如何用Python解决LeetCode数组题目的并发问题?
    LeetCode是全球知名的在线编程网站,提供了许多算法和数据结构题目供程序员练习。在LeetCode中,数组问题是一类非常常见的问题。然而,当数组问题涉及到并发时,解决方法就会变得更加复杂。在这篇文章中,我们将介绍如何使用Python来解...
    99+
    2023-11-05
    数组 leetcode 并发
  • 如何解决redis的并发问题
    如何解决redis的并发问题?针对这个问题,今天小编总结了这篇文章,希望能帮助更多想解决这个问题的朋友找到更加简单易行的办法。redis中的并发问题使用redis作为缓存已经很久了,redis是以单进程的形...
    99+
    2024-04-02
  • Redis如何解决高并发问题
    这篇文章主要介绍Redis如何解决高并发问题,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!具体如下:redis为什么会有高并发问题redis的出身决定 redis是一种单线...
    99+
    2024-04-02
  • PHP高并发问题如何解决
    PHP高并发问题如何解决?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。重启与过载保护如果系统发生“雪崩”,贸然重启服务,是无法解决问题的。最常见的现象是,启动起...
    99+
    2023-06-15
  • 如何解决PHP高并发问题
    这篇“如何解决PHP高并发问题”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“如何解决PHP高并发问题”文章吧。秒杀会产生一个...
    99+
    2023-06-29
  • Java如何解决高并发问题
    在Java中,可以采用以下几种方式来解决高并发问题:1. 使用线程池:线程池可以有效地管理线程的创建和销毁,避免频繁地创建和销毁线程...
    99+
    2023-10-20
    Java
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作