返回顶部
首页 > 资讯 > 数据库 >MySQL 中如何定位 DDL 被阻塞的问题
  • 807
分享到

MySQL 中如何定位 DDL 被阻塞的问题

MySQL中如何定位DDL被阻塞的问题 2017-09-02 23:09:39 807人浏览 猪猪侠
摘要

DDL 被阻塞了,如何找到阻塞它的 sql? 经常碰到开发、测试童鞋会问,线下开发、测试环境,执行了一个DDL,发现很久都没有执行完,是不是被阻塞了?要怎么解决? 包括在群里,也经常会碰到类似

MySQL 中如何定位 DDL 被阻塞的问题

DDL 被阻塞了,如何找到阻塞它的 sql?

经常碰到开发测试童鞋会问,线下开发、测试环境,执行了一个DDL,发现很久都没有执行完,是不是被阻塞了?要怎么解决?

包括在群里,也经常会碰到类似问题:DDL 被阻塞了,如何找到阻塞它的 SQL ?

实际上,如何解决 DDL 被阻塞的问题,是 Mysql 中一个共性且高频的问题。

下面,就这个问题,给一个清晰明了、拿来即用的解决方案:

  1. 怎么判断一个DDL是不是被阻塞了 ?
  2. 当DDL被阻塞时,怎么找出阻塞它的会话 ?

 

怎么判断一个 DDL是不是被阻塞了?

首先,看一个简单的Demo

session1> create table sbtest.t1(id int primary key,name varchar(10));
Query OK, 0 rows affected (0.02 sec)

session1> insert into sbtest.t1 values(1,"a");
Query OK, 1 row affected (0.01 sec)

session1> begin;
Query OK, 0 rows affected (0.00 sec)

session1> select * from sbtest.t1;
+----+------+
| id | name |
+----+------+
|  1 | a    |
+----+------+
1 row in set (0.00 sec)

session2> alter table sbtest.t1 add c1 datetime;
阻塞中。。。

session3> show processlist;
+----+-----------------+-----------+------+---------+-------+---------------------------------+---------------------------------------+
| Id | User            | Host      | db   | Command | Time  | State                           | Info                                  |
+----+-----------------+-----------+------+---------+-------+---------------------------------+---------------------------------------+
|  5 | event_scheduler | localhost | NULL | Daemon  | 47628 | Waiting on empty queue          | NULL                                  |
| 24 | root            | localhost | NULL | Sleep   |    11 |                                 | NULL                                  |
| 25 | root            | localhost | NULL | Query   |     5 | Waiting for table metadata lock | alter table sbtest.t1 add c1 datetime |
| 26 | root            | localhost | NULL | Query   |     0 | init                            | show processlist                      |
+----+-----------------+-----------+------+---------+-------+---------------------------------+---------------------------------------+
4 rows in set (0.00 sec)

判断一个 DDL 是不是被阻塞了,很简单,就是执行 show processlist ,查看 DDL 操作对应的状态。

如果显示的是 Waiting for table metadata lock ,则意味着这个 DDL 被阻塞了。

DDL 一旦被阻塞了,后续针对该表的所有操作都会被阻塞,都会显示 Waiting for table metadata lock 。这也是 DDL 让人闻之色变的原因。

碰到了类似场景,要么 Kill DDL 操作,要么 Kill 阻塞 DDL 的会话。

Kill DDL 操作是一个治标不治本的方法,毕竟 DDL 操作总要执行。

除此之外,对于 DDL 操作,需要获取元数据库的阶段有两个:DDL 开始之初和 DDL 结束之前。如果是后者,就意味着之前的操作都要回滚,成本相对较高。

所以,碰到类似场景,我们一般都会 Kill 阻塞 DDL 的会话。

那么,怎么知道是哪些会话阻塞了 DDL 呢?

下面我们看看具体的定位方法。

 

定位方法

方法一:sys.schema_table_lock_waits

sys.schema_table_lock_waits 是mysql 5.7引入的,用来定位 DDL 被阻塞的问题。

针对上面这个Demo。

我们看看sys.schema_table_lock_waits的输出。

mysql> select * from sys.schema_table_lock_waitsG
*************************** 1. row ***************************
               object_schema: sbtest
                 object_name: t1
           waiting_thread_id: 62
                 waiting_pid: 25
             waiting_account: root@localhost
           waiting_lock_type: EXCLUSIVE
       waiting_lock_duration: TRANSACTION
               waiting_query: alter table sbtest.t1 add c1 datetime
          waiting_query_secs: 17
 waiting_query_rows_affected: 0
 waiting_query_rows_examined: 0
          blocking_thread_id: 61
                blocking_pid: 24
            blocking_account: root@localhost
          blocking_lock_type: SHARED_READ
      blocking_lock_duration: TRANSACTION
     sql_kill_blocking_query: KILL QUERY 24
sql_kill_blocking_connection: KILL 24
*************************** 2. row ***************************
               object_schema: sbtest
                 object_name: t1
           waiting_thread_id: 62
                 waiting_pid: 25
             waiting_account: root@localhost
           waiting_lock_type: EXCLUSIVE
       waiting_lock_duration: TRANSACTION
               waiting_query: alter table sbtest.t1 add c1 datetime
          waiting_query_secs: 17
 waiting_query_rows_affected: 0
 waiting_query_rows_examined: 0
          blocking_thread_id: 62
                blocking_pid: 25
            blocking_account: root@localhost
          blocking_lock_type: SHARED_UPGRADABLE
      blocking_lock_duration: TRANSACTION
     sql_kill_blocking_query: KILL QUERY 25
sql_kill_blocking_connection: KILL 25
2 rows in set (0.00 sec)

只有一个 alter 操作,却产生了两条记录,而且两条记录的 Kill 对象还不一样,其中一条 Kill 的对象还是 alter 操作本身。

如果对表结构不熟悉或不仔细看记录内容的话,难免会 Kill 错对象。

不仅如此,在 DDL 操作被阻塞后,如果后续有 N 个查询被 DDL 操作堵塞,还会产生 N*2 条记录。

在定位问题时,这 N*2 条记录完全是个噪音。

这个时候,就需要我们对上述记录进行过滤了。

过滤的关键是 blocking_lock_type 不等于 SHARED_UPGRADABLE。

SHARED_UPGRADABLE 是一个可升级的共享元数据锁,加锁期间,允许并发查询和更新,常用在 DDL 操作的第一阶段。

所以,阻塞DDL的不会是SHARED_UPGRADABLE。

故而,针对上面这个 case,我们可以通过下面这个查询来精确地定位出需要 Kill 的会话。

SELECT sql_kill_blocking_connection
FROM sys.schema_table_lock_waits
WHERE blocking_lock_type <> "SHARED_UPGRADABLE"
 AND waiting_query = "alter table sbtest.t1 add c1 datetime";

 

方法二:Kill DDL 之前的会话

sys.schema_table_lock_waits 是 MySQL 5.7 才引入的。

但在实际生产环境,MySQL 5.6还是占有相当多的份额。

如何解决MySQL 5.6的这个痛点呢 ?

细究下来,导致 DDL 被阻塞的操作,无非两类:

  1. 表上有慢查询未结束。

  2. 表上有事务未提交。

其中,第一类比较好定位,通过 show processlist 就能发现。

而第二类仅凭 show processlist 很难定位,因为未提交事务的连接在 show processlist 中的状态同空闲连接一样,都是 Sleep 。

所以,网上有 Kill 空闲连接的说法,其实也不无道理,但这样做就太简单粗暴了,难免会误杀。

其实,既然是事务,在 infORMation_schema.innodb_trx中肯定会有记录,如 session1 中的事务,在表中的记录如下,

mysql> select * from information_schema.innodb_trxG
*************************** 1. row ***************************
                    trx_id: 421568246406360
                 trx_state: RUNNING
               trx_started: 2022-01-02 08:53:50
     trx_requested_lock_id: NULL
          trx_wait_started: NULL
                trx_weight: 0
       trx_mysql_thread_id: 24
                 trx_query: NULL
       trx_operation_state: NULL
         trx_tables_in_use: 0
         trx_tables_locked: 0
          trx_lock_structs: 0
     trx_lock_memory_bytes: 1128
           trx_rows_locked: 0
         trx_rows_modified: 0
   trx_concurrency_tickets: 0
       trx_isolation_level: REPEATABLE READ
         trx_unique_checks: 1
    trx_foreign_key_checks: 1
trx_last_foreign_key_error: NULL
 trx_adaptive_hash_latched: 0
 trx_adaptive_hash_timeout: 0
          trx_is_read_only: 0
trx_autocommit_non_locking: 0
       trx_schedule_weight: NULL
1 row in set (0.00 sec)

其中 trx_mysql_thread_id 是线程 id ,结合 information_schema.processlist ,可进一步缩小范围。

所以,我们可以通过下面这个 SQL ,定位出执行时间早于 DDL 的事务。

SELECT concat("kill ", i.trx_mysql_thread_id, ";")
FROM information_schema.innodb_trx i, (
    SELECT MAX(time) AS max_time
    FROM information_schema.processlist
    WHERE state = "Waiting for table metadata lock"
      AND (info LIKE "alter%"
      OR info LIKE "create%"
      OR info LIKE "drop%"
      OR info LIKE "truncate%"
      OR info LIKE "rename%"
  )) p
WHERE timestampdiff(second, i.trx_started, now()) > p.max_time;

可喜的是,当前正在执行的查询也会显示在information_schema.innodb_trx中。

所以,上面这个 SQL 同样也适用于慢查询未结束的场景。

 

MySQL 5.7中使用sys.schema_table_lock_waits的注意事项

sys.schema_table_lock_waits 视图依赖了一张 MDL 相关的表-performance_schema.metadata_locks。

该表是 MySQL 5.7 引入的,会显示 MDL 的相关信息,包括作用对象、锁的类型及锁的状态等。

但在 MySQL 5.7 中,该表默认为空,因为与之相关的 instrument 默认没有开启。MySQL 8.0 才默认开启。

mysql> select * from performance_schema.setup_instruments where name="wait/lock/metadata/sql/mdl";
+----------------------------+---------+-------+
| NAME                       | ENABLED | TIMED |
+----------------------------+---------+-------+
| wait/lock/metadata/sql/mdl | NO      | NO    |
+----------------------------+---------+-------+
1 row in set (0.00 sec)

所以,在 MySQL 5.7 中,如果我们要使用 sys.schema_table_lock_waits ,必须首先开启 MDL 相关的 instrument。

开启方式很简单,直接修改 performance_schema.setup_instruments 表即可。

具体SQL如下。

UPDATE performance_schema.setup_instruments SET ENABLED = "YES", TIMED = "YES"
WHERE NAME = "wait/lock/metadata/sql/mdl";

但这种方式是临时生效,实例重启后,又会恢复为默认值。

建议同步修改配置文件。

[mysqld]
performance-schema-instrument="wait/lock/metadata/sql/mdl=ON"

 

总结

1. 执行 show processlist ,如果 DDL 的状态是 Waiting for table metadata lock  ,则意味着这个 DDL 被阻塞了。

2. 定位导致 DDL 被阻塞的会话,常用的方法有两种:

1 sys.schema_table_lock_waits

SELECT sql_kill_blocking_connection
FROM sys.schema_table_lock_waits
WHERE blocking_lock_type <> "SHARED_UPGRADABLE"
  AND (waiting_query LIKE "alter%"
  OR waiting_query LIKE "create%"
  OR waiting_query LIKE "drop%"
  OR waiting_query LIKE "truncate%"
  OR waiting_query LIKE "rename%");

这种方法适用于 MySQL 5.7 和 8.0。

注意,MySQL 5.7 中,MDL 相关的 instrument 默认没有打开。

2 Kill DDL 之前的会话

SELECT concat("kill ", i.trx_mysql_thread_id, ";")
FROM information_schema.innodb_trx i, (
    SELECT MAX(time) AS max_time
    FROM information_schema.processlist
    WHERE state = "Waiting for table metadata lock"
      AND (info LIKE "alter%"
      OR info LIKE "create%"
      OR info LIKE "drop%"
      OR info LIKE "truncate%"
      OR info LIKE "rename%"
  )) p
WHERE timestampdiff(second, i.trx_started, now()) > p.max_time;

如果 MySQL 5.7 中 MDL 相关的 instrument 没有打开或在 MySQL 5.6 中,可使用该方法。

您可能感兴趣的文档:

--结束END--

本文标题: MySQL 中如何定位 DDL 被阻塞的问题

本文链接: https://lsjlt.com/news/9048.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • MySQL 中如何定位 DDL 被阻塞的问题
    DDL 被阻塞了,如何找到阻塞它的 SQL 经常碰到开发、测试童鞋会问,线下开发、测试环境,执行了一个DDL,发现很久都没有执行完,是不是被阻塞了?要怎么解决? 包括在群里,也经常会碰到类似问...
    99+
    2017-09-02
    MySQL 中如何定位 DDL 被阻塞的问题
  • 【Mysql】MySQL 5.7中如何定位DDL被阻塞的问题
    原文地址:https://mp.weixin.qq.com/s/lD2gjyUgt4pmWdVXqqXk3w 在上篇文章《 MySQL表结构变更,不可不知的Metadata Lock 》中,我们介...
    99+
    2024-04-02
  • MySQL 5.6中怎么定位DDL被阻塞的问题
    这篇文章将为大家详细讲解有关MySQL 5.6中怎么定位DDL被阻塞的问题,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。对于DDL被阻塞问题的定位,我们主要是基于MySQ...
    99+
    2024-04-02
  • 怎么解决MySQL 5.7中定位DDL被阻塞的问题
    这篇文章主要为大家展示了“怎么解决MySQL 5.7中定位DDL被阻塞的问题”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“怎么解决MySQL 5.7中定位DDL...
    99+
    2024-04-02
  • MySQL 中定位 DDL 被阻塞的问题及解决方案
    DDL 被阻塞了,如何找到阻塞它的 SQL 经常碰到开发、测试童鞋会问,线下开发、测试环境,执行了一个DDL,发现很久都没有执行完,是不是被阻塞了?要怎么解决? 包括在群里,也经常会...
    99+
    2024-04-02
  • C#中定时任务被阻塞问题的解决方法
    目录1.摘要2.C#中定时任务的最简方法3.定时任务阻塞现象4.阻塞现象原因分析5.问题解决总结1.摘要 本文会介绍一个C#中最简单定时任务的使用方法,以及会遇到的定时任务被阻塞现...
    99+
    2024-04-02
  • 如何解决Process.getInputStream()阻塞的问题
    这篇文章主要介绍了如何解决Process.getInputStream()阻塞的问题,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。Process.getInputStream...
    99+
    2023-06-15
  • Linux进程间socketpair通信被阻塞的问题
    在Linux系统中,使用socketpair函数创建的套接字对可以用于进程间通信。但是,在进行通信时可能会遇到阻塞的问题。一种常见的...
    99+
    2023-09-08
    Linux
  • 如何解决TCP socket的阻塞问题
    目录解决TCP socket的阻塞问题在异常处理程序当中退出socket连接TCP连接阻塞的监控和处理我们整理出符合该类异常的特征如下如何查看一个连接的创建时间解决TCP socke...
    99+
    2024-04-02
  • 如何解决基于Process#waitFor()阻塞问题
    这篇文章主要介绍了如何解决基于Process#waitFor()阻塞问题,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。Process#waitFor()阻塞问题有时需要在程序...
    99+
    2023-06-22
  • 重定向时如何避免PHP数组操作的阻塞问题?
    随着互联网的发展,网站的流量也越来越大,对于网站的性能要求也越来越高。PHP作为一种流行的服务器端脚本语言,它的性能也受到了广泛的关注。在PHP中,数组操作是一种常见的数据处理方式,但是在高并发的环境下,数组操作也会成为性能瓶颈之一。在重定...
    99+
    2023-10-30
    数组 异步编程 重定向
  • Redis bigkeys命令会阻塞问题如何解决
    这篇文章主要介绍“Redis bigkeys命令会阻塞问题如何解决”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Redis bigkeys命令会阻塞问题如何解决”文章能帮助大家解...
    99+
    2023-07-05
  • 如何解决java调用process线程阻塞的问题
    这篇文章将为大家详细讲解有关 如何解决java调用process线程阻塞的问题,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。java调用process线程阻塞问题项目需求中涉及java调用.bat文件进行...
    99+
    2023-06-15
  • Java中常用阻塞队列的问题小结
    Java常用阻塞队列 ArrayBlockingQueue 内部由一个固定长度的数组来实现阻塞队列 final Object[] items; int takeIndex; ...
    99+
    2024-04-02
  • mysql中如何实现定位空闲会话事务没提交导致锁阻塞的脚本
    这篇文章主要为大家展示了“mysql中如何实现定位空闲会话事务没提交导致锁阻塞的脚本”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“mysql中如何实现定位空闲会...
    99+
    2024-04-02
  • Java中常用阻塞队列的问题是什么
    本篇内容主要讲解“Java中常用阻塞队列的问题是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Java中常用阻塞队列的问题是什么”吧!Java常用阻塞队列ArrayBlockingQueue...
    99+
    2023-06-29
  • css中如何解决绝对定位元素被遮挡的问题
    这篇文章主要介绍css中如何解决绝对定位元素被遮挡的问题,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!具体方法如下:ie7下绝对定位元素即使z-index值很高,如果其设置相对定位的...
    99+
    2024-04-02
  • Spring Boot多个定时任务阻塞问题的解决方法
    目录前言1、重写SchedulingConfigurer#configureTasks()2、通过配置开启3、结合@Async总结前言 今天这篇文章介绍一下Spring Boot 中...
    99+
    2024-04-02
  • 如何解决jQuery同步Ajax带来的UI线程阻塞问题
    这篇文章主要介绍如何解决jQuery同步Ajax带来的UI线程阻塞问题,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!事情起因是这样的,因为页面上有多个相似的异步请求动作,本着提高代码...
    99+
    2024-04-02
  • Spring Boot多个定时任务阻塞问题的解决方法是什么
    Spring Boot多个定时任务阻塞问题的解决方法是什么,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。前言今天介绍一下Spring Boot 中 如...
    99+
    2023-06-22
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作