返回顶部
首页 > 资讯 > 数据库 >Mysql排序的特性详情
  • 307
分享到

Mysql排序的特性详情

2024-04-02 19:04:59 307人浏览 泡泡鱼
摘要

目录1、问题场景2、原因分析3、解决方案4、拓展知识4.1 limit查询优化4.2 limit与order by结合使用5、小结1、问题场景 新上线一个交易记录导出功能,逻辑很简单

1、问题场景

新上线一个交易记录导出功能,逻辑很简单:根据查询条件,导出对应的数据。由于数据量比较大,在查询数据库时采用了分页查询,每次查询1000条数据。

自测正常,测试环境正常,上线之后运营反馈导出的数据有重复记录

原本是以为业务逻辑问题,重新Review了一遍代码,依旧未找到问题原因。最后只好把sql语句拿出来单独执行,导出数据,对比发现竟然是SQL语句查询结果乱序导致的。

2、原因分析

查询语句以create_time进行倒序排序,通过limit进行分页,在正常情况下不会出现问题。但当业务并发量比较大,导致create_time存在大量相同值时,再基于limit进行分页,就会出现乱序问题。

出现的场景是:create_time排序,当create_time存在相同值,通过limit分页,导致分页数据乱序。

比如,查询1000条数据,其中有一批create_time记录值都为”2021-10-28 12:12:12“,当创建时间相同的这些数据,一部分出现在第一页,一部分出现在第二页,在查询第二页的数据时,可能会出现第一页已经查过的数据。

也就是说,数据会来回跳动,一会儿出现在第一页,一会儿出现在第二页,这就导致导出的数据一部分重复,一部分缺失。

查看了Mysql 5.7和8.0的官方文档,描述如下:

If multiple rows have identical values in the ORDER BY columns, the server is free to return those rows in any order, and may do so differently depending on the overall execution plan. In other Words, the sort order of those rows is nondeterministic with respect to the nonordered columns.

上述内容概述:在使用ORDER BY对列进行排序时,如果对应(ORDER BY的列)列存在多行相同数据,(Mysql服务器会按照任意顺序返回这些行,并且可能会根据整体执行计划以不同的方式返回。

简单来说就是:ORDER BY查询的数据,如果ORDER BY列存在多行相同数据,mysql会随机返回。这就会导致虽然使用了排序,但也会发生乱序的状况。

3、解决方案

针对上述问题,基本的解决思路是:避免ORDER BY列的值出现重复。因此,可以加入其他维度,比如ID等其他排序列。


select * from tb_order order by create_time ,id desc;

这样,在create_time相同时,会根据id进行排序,而id肯定是不同的,就再不会出现上述问题了。

4、拓展知识

其实,上述内容在Mysql的官网已经有明确说明,而且还举了例子。下面对官网的内容和例子做一个简单的汇总总结

4.1 limit查询优化

如果我们只是查询一个结果集的一部分,那么不要查询所有数据,然后再丢弃不需要的数据,而是要通过limit条件来进行限制。

在没使用having条件时,Mysql可能会对limit条件优化:

  • 如果只查询几条数据,建议使用limit,这样Mysql可能会用到索引,而通常情况下Mysql是全表扫描;
  • 如果将limit row_countorder by结合使用,Mysql会在找到第一个row_count结果集后立刻停止排序,而不是对整个结果集进行排序。如果此时基于索引进行操作,速度会更快。如果必须进行文件排序,在找到row_count结果集之前,会对部分或所有符合条件的结果进行排序。但当找到row_count结果之后,便不会对剩余部分进行排序了。这种特性的一个表现就是我们前面提到的带有limit和不带limit进行查询时,返回的结果顺序可能不同。
  • 如果将limit row_count和distinct结合使用,Mysql会在找到row_count结果集唯一行后立马停止。
  • 在某些情况下,可以通过按照顺序读取索引(或对索引进行排序),然后计算摘要直到索引变化来实现group by。在这种情况下,limit row_count不会计算任何不必要的group by值。
  • 一旦MySQL向客户端发送了所需数量的行,就会中止查询,除非使用了SQL_CALC_FOUND_ROWS。在这种情况下,可以使用 SELECT FOUND_ROWS() 检索行数。
  • LIMIT 0会快速返回一个空集合,通常可用于检查SQL的有效性。还可以用于在应用程序中获得结果集的类型。在Mysql客户端中,可以使用--column-type-info来显示结果列类型。
  • 如果使用临时表来解析查询,Mysql会使用 limit row_count来计算需要多少空间。
  • 如果order by未使用索引,且存在limit条件,则优化器可能会避免使用合并文件,而采用内存filesort操作对内存中的行进行排序。

了解了limit的一些特性,下面再回到本文的重点,limit row_countorder by结合使用特性。

4.2 limit与order by结合使用

在上面第二条中已经提到,limit row_countorder by结合呈现的特性之一就是结果返回的顺序是不确定的。而影响执行计划的一个因素就是limit,因此带有limit与不带有limit执行同样的查询语句,返回结果的顺序可能不同。

下面示例中,根据category列进行排序查询,而id和rating是不确定的:


mysql> SELECT * FROM ratings ORDER BY cateGory;
+----+----------+--------+
| id | category | rating |
+----+----------+--------+
|  1 |        1 |    4.5 |
|  5 |        1 |    3.2 |
|  3 |        2 |    3.7 |
|  4 |        2 |    3.5 |
|  6 |        2 |    3.5 |
|  2 |        3 |    5.0 |
|  7 |        3 |    2.7 |
+----+----------+--------+

当查询语句包含limit时,可能会影响到category值相同的数据:


mysql> SELECT * FROM ratings ORDER BY category LIMIT 5;
+----+----------+--------+
| id | category | rating |
+----+----------+--------+
|  1 |        1 |    4.5 |
|  5 |        1 |    3.2 |
|  4 |        2 |    3.5 |
|  3 |        2 |    3.7 |
|  6 |        2 |    3.5 |
+----+----------+--------+

其中id为3和4的结果位置发生了变化。

在实践中,保持查询结果的顺序性往往非常重要,此时就需要引入其他列来保证结果的顺序性了。

当上述实例引入id之后,查询语句及结果如下:


mysql> SELECT * FROM ratings ORDER BY category, id;
+----+----------+--------+
| id | category | rating |
+----+----------+--------+
|  1 |        1 |    4.5 |
|  5 |        1 |    3.2 |
|  3 |        2 |    3.7 |
|  4 |        2 |    3.5 |
|  6 |        2 |    3.5 |
|  2 |        3 |    5.0 |
|  7 |        3 |    2.7 |
+----+----------+--------+
​
mysql> SELECT * FROM ratings ORDER BY category, id LIMIT 5;
+----+----------+--------+
| id | category | rating |
+----+----------+--------+
|  1 |        1 |    4.5 |
|  5 |        1 |    3.2 |
|  3 |        2 |    3.7 |
|  4 |        2 |    3.5 |
|  6 |        2 |    3.5 |
+----+----------+--------+

可以看出,当添加了id列的排序,即使category相同,也不会出现乱序问题。这正与我们最初的解决方案一致。

5、小结

本来通过实践中偶发的一个坑,聊到了Mysqllimit查询语句的优化,同时提供了解决方案,即满足了业务需求,又避免了业务逻辑的错误。

很多朋友都在使用order bylimit语句进行查询,但如果不知道Mysql的这些优化特性,很可能已经入坑,只不过数据量没有触发呈现而已。

到此这篇关于Mysql排序的特性详情的文章就介绍到这了,更多相关Mysql排序特性内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

您可能感兴趣的文档:

--结束END--

本文标题: Mysql排序的特性详情

本文链接: https://lsjlt.com/news/155923.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Mysql排序的特性详情
    目录1、问题场景2、原因分析3、解决方案4、拓展知识4.1 limit查询优化4.2 limit与order by结合使用5、小结1、问题场景 新上线一个交易记录导出功能,逻辑很简单...
    99+
    2024-04-02
  • Mysql排序的特性是什么
    本篇内容主要讲解“Mysql排序的特性是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Mysql排序的特性是什么”吧!1、问题场景新上线一个交易记录导出功能,逻辑很简单:根据查询条件,导出对...
    99+
    2023-06-25
  • js 实现拖拽排序详情
    目录1、前言2、实现3、为何不使用HTML拖放API实现?4、总结1、前言 拖拽排序对于小伙伴们来说应该不陌生,平时工作的时候,可能会选择使用类似Sortable.js这样的开源库来...
    99+
    2024-04-02
  • Golang 高效排序数据详情
    目录1.介绍2.切片排序3.自定义集合排序4总结 1.介绍 在 Golang 语言项目开发中,经常会遇到数据排序问题。Golang 语言标准库 sort 包,为我们提供了数据排序的功...
    99+
    2024-04-02
  • C语言完整特性详情
    目录C# 10 完整特性介绍1、record struct2、sealed record ToString 方法3、struct 无参构造函数4、匿名对象的 with5、全局的 us...
    99+
    2024-04-02
  • mysql中怎么按照特定顺序排序
    mysql中怎么按照特定顺序排序,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。 Mysql查询IN,并按照特定顺序...
    99+
    2024-04-02
  • 关于MySQL的ORDERBY排序详解
    目录前言ORDER BY 语法实践出真知实践准备静态排序动态排序总结前言 工作中常常会使用ORDER BY进行排序,了解ORDER BY多种排序方式是非常有必要的。 ORDER BY...
    99+
    2023-05-19
    MySQL 排序 MySQL ORDER BY
  • MySQL读取my.cnf的顺序问题详情
    目录MySQL读取my.cnf的顺序一、mysql.server启动方式二、mysqld_safe启动方式三、关于mysqld和my_print_defaults读取my.cnf顺序...
    99+
    2024-04-02
  • 关于MySQL的ORDER BY排序详解
    目录前言ORDER BY 语法实践出真知实践准备静态排序动态排序总结前言 工作中常常会使用ORDER BY进行排序,了解ORDER BY多种排序方式是非常有必要的。 ORDER BY 排序可以分为静态排序和动态排序,当然...
    99+
    2023-05-12
    MySQL 排序 MySQL ORDER BY
  • mysql怎么按照性别排序
    mysql中实现根据性别进行排序的方法首先,在命令行中启动MySQL服务;service mysql start  MySQL服务启动后,在命令行中输入mysql的用户名和密码登录到MySQL;mysql -u root -p登录到MySQ...
    99+
    2024-04-02
  • C#9特性record 类型、模式匹配、init 属性详情
    目录C#的特性record 类型、模式匹配、init 属性一、record 类型二、模式匹配(Pattern Matching)三、属性的 init 访问器C#的特性record 类...
    99+
    2024-04-02
  • Mysql中的CHECK约束特性详解
    功能说明 在mysql 8.0.16以前, CREATE TABLE允许从语法层面输入下列CHECK约束,但实际没有效果: CHECK (expr) 在 MySQL 8.0.16,CREATE TABLE添加了针对所有存...
    99+
    2022-08-08
    mysql check约束 MySQL检查约束 mysql设置check约束 mysqlcheck约束怎么写
  • Java选择排序和垃圾回收机制详情
    目录一、垃圾回收机制二、Arrays类三、选择排序法四、总结一、垃圾回收机制 创建对象就会占据内存,如果程序在执行过程中不能再使用某个对象,这个对象是徒耗内存的垃圾。作为程序员不用关...
    99+
    2024-04-02
  • mysql的数据压缩性能对比详情
    目录1. 测试环境1.1 软硬件1.2 表结构2. 测试目的2.1 压缩空间对比2.2 查询性能对比3. 测试工具3.1 mysqlslap3.2 测试query4.测试结论数据魔方...
    99+
    2024-04-02
  • 详解MySQL中Order By排序和filesort排序的原理及实现
    目录1.Order By原理2.filesort排序算法3.优化排序1.Order By原理 mysql的Order By操作用于排序,并且会有多种不同的排序算法,他们的性能都是不一样的。 假设有一个表,建表的sql如下...
    99+
    2022-08-16
    MySQLOrderBy排序 MySQLfilesort排序 MySQLOrderBy排序filesort排序
  • Java高性能序列化工具Kryo详情
    目录概述基础用法Kryo 的序列化Kryo 的注册Kryo 的序列化器对象引用线程不安全ThreadLocal + Kryo 解决线程不安全对象池 + Kryo 解决线程不安全小结概...
    99+
    2024-04-02
  • MySQL InnoDB引擎的缓存特性详解
    目录1. 背景2. 存储器性能差异3. Buffer Pool4. Free链表5. Flush链表6. LRU链表7. 其它1. 背景 对于各种用户数据、索引数据等各种数据都是需要持久化存储到磁盘,然后以“...
    99+
    2024-04-02
  • MySQL InnoDB引擎的缓存特性详解
    目录1. 背景2. 存储器性能差异3. Buffer Pool4. Free链表5. Flush链表6. LRU链表7. 其它1. 背景 对于各种用户数据、索引数据等各种数据都是需要...
    99+
    2024-04-02
  • 详解高性能mysql之MySQL高级特性总结
    MySQL是一款广泛使用的关系型数据库管理系统,具有高性能和高可靠性的特点。在高性能MySQL中,有一些高级特性可以帮助提升数据库的...
    99+
    2023-09-22
    MySQL
  • MySQL自定义排序方法详解
    MySQL自定义排序方法详解 在MySQL中,我们通常使用ORDER BY语句进行排序,但是有时候我们需要进行特殊的排序操作,比如按照某些字段的特定值进行排序。这时候就需要用到MySQL中的自定义排序方法。本文将为大家详细介绍MySQL中的...
    99+
    2023-09-03
    数据库 mysql java
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作