114、案例实战:亿级数据量商品系统的SQL调优实战(3)
00 分钟
2022-8-26

114、案例实战:亿级数据量商品系统的SQL调优实战(3)

接下来我们分析一下这个案例背后的一些事情,上次我们提到了一系列的问题,包括:
  • 为什么在这个案例中MySQL默认会选择对主键的聚簇索引进行扫描?
  • 为什么没使用index_category这个二级索引进行扫描?
  • 即使用了聚簇索引,为什么这个SQL以前没有问题,现在突然就有问题了?
关于这些问题,咱们得一步一步的来解决。首先,第一个问题,为什么针对:
这样一个SQL语句,MySQL要选择对聚簇索引进行扫描呢?
其实关于这个逻辑,说起来也并不是太复杂,因为大家都知道,这个表是一个亿级数据量的大表,那么对于他来说,index_category这个二级索引也是比较大的。
所以此时对于MySQL来说,他有这么一个判断,他觉得如果要是从index_category二级索引里来查找到符合where条件的一波数据,接着还得回表,回到聚簇索引里去。
因为SQL语句是要select *的,所以这里必然涉及到一次回表操作,回到聚簇索引里去把所有字段的数据都查出来,但是在回表之前,他必然要做完order by id desc limit xx,xx这个操作
举个例子吧,比如他根据where category=‘xx’ and sub_category = ‘xx’,从index_category二级索引里查找出了一大波数据。
比如从二级索引里假设查出来了几万条数据,接着因为二级索引里是包含主键id值的,所以此时他就得按照order by id desc这个排序语法,对着几万条数据基于临时磁盘进行filesort磁盘排序,排序完了以后,再按照limit xx,xx语法,把指定位置的几条数据都拿出来,假设就是limit 0,10, 那么就是把10条数据拿出来。
拿出来10条数据之后,再回到聚簇索引里去根据id查找,把这10条数据的完整字段都查出来,这就是MySQL认为如果你使用index_category的话,可能会发生的一个情况。
所以他担心的是,你根据where category=‘xx’ and sub_category = ‘xx’, 从index_category二级索引里查出来的数据太多了,还得在临时磁盘里排序,可能性能会很差,因此MySQL就把这种方式判定为一种不太好的方式。
因此他才会选择换一种方式,也就是说,直接扫描主键的聚簇索引,因为聚簇索引都是按照id值有序的,所以扫描的时候,直接按order by id desc这个倒序排序扫描过去就可以了,然后因为他知道你是limit 0,10,也就知道你仅仅只要拿到10数据就行了
所以他在按顺序扫描聚簇索引的时候,就会对每一条数据都采用Using where的方式,跟where category = ‘xx’ and sub_category = ’xx’条件进行比对,符合条件的就直接放入结果集里去,最多就是放10条数据进行就可以返回了。
此时MySQL认为,按顺序扫描聚簇索引,拿到10条符合where条件的数据,应该数据是很快的,很可能比使用index_category二级索引那个方案更快,因此此时他就采用了扫描聚簇索引的这种方式
那接下来我们又要考虑一个问题了,那就是这个SQL语句,实际上之前在线上系统运行一直没什么问题,也就是说,之前在线上系统而言,即使采用扫描聚簇索引的方案,其实这个SQL语句也确实一般都运行不慢,最起码是不会超过1s的。
那么为什么会在某一天晚上突然就大量报慢查询,耗时几十秒了呢?
原因也很简单,其实就是因为之前的时候,where category=‘xx’ and sub_category=’xx’这个条件通常都是有返回值的,就是说根据条件里的取值,扫描据区索引的时候,通常都是很快就能找到符合条件的值以及返回的,所以之前其实性能也没什么问题。
但是后来可能是商品系统里的运营人员,在商品管理的时候家了几种商品分类和子类,但是这几种分类和子类的组合其实没有对应的商品 也就说,那一天晚上很多用户使用这种分类和子类去筛选商品,where category=‘新分类’ and sub_category=’新子类’这条件实际上是查不到任何数据的。
所以说,底层在扫描聚簇索引的时候,扫来扫去都扫不到符合where条件的结果,一下子就把聚簇索引全部扫了一遍,等于是上亿数据全表扫描了一遍,都没找到符合where category=‘新分类’ and sub_category=’新子类’这个条件的数据
也正是因为如此,才导致这个SQL语句频繁的出现几十秒的慢查询,进而导致MySQL连接资源打满,商品系统崩溃
因此到此为止,这个案例就彻底分析清楚了,包括案例背后的故事也给大家讲明白了,其实SQL调优并没那么难,核心在于你一定要看懂SQL的执行计划,理解他为什么会慢,只要你理解了,就是想各种办法去解决,这个解决办法可能不是专栏可以讲完的,我们会提供几种经典的方案,但是往往需要你在发现问题的试试自己想办法,或者网上搜索。
比如我们上次讲到的第一个案例,就是通过禁用MySQL的半连接优化或者是改写SQL语句结构来避免自动半连接优化,第二个案例就得通过force index语法来强制某个SQL用我们制定的索引,这些都是属于比较经典的解决方案

评论