绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
访问方法access method---单表访问方法(三十六)
2023-02-01 09:47:26

上篇文章回忆了innodDB的独立表空间和系统表空间的结构,因为需要梳理的知识点太多,所以额外用一篇。

单表的访问方法

对我们开发来说,mysql就是个软件,用sql查询我们需要的数据,当遇到性能差的sql,如果我们连怎么优化都不知道,岂不是很尴尬。我们前面说过mysqlSql Service 有一个查询优化器的模块,一条sql进行预发解析后会进行查询优化,生成一个执行计划,这个执行计表明有哪些索引进行查询,表之间的链接顺序是什么样的,后调用执行计划的步骤来真正的查询,吧结果返回给用户。不过查询优化这里的信息有点大,我们这里先看看单表的访问方法(from 单表那种)。


访问方法(access method)的概念

举个例子,大家用地图找路线的时候 ,地图会给你好几种路线,甚至你可以选择吧中国绕一遍再去到目的地,但不论哪种路线,你都能去到目的地,只是耗费的时间不同。回到mysql,我们只要获取到自己的需要的数据,至于mysql优化器怎么优化成执行计划查出来,是mysql的事。对于单表查询,mysql大致分为两种:

  1. 使用全表扫描进行查询:这种顾名思义,为了查询数据,吧整个表都遍历一遍,基本算是笨的方法,但什么数据都能找到。
  2. 使用索引进行查询:因为使用全表扫描的方法代价太大,所以可以查询搜索语句中加入索引查询,使用索引查询又分为,1)针对主键或者二级索引的等值查询。2)针对普通二级索引的等值查询。3)针对索引列的范围查询。4)直接扫描整个索引。

Mysql吧这种查询语句的方式称为访问方法或者访问类型。同一个sql语句可能有多种不同的查询方法,但查询的结果都是一样的。下面介绍各自方法的具体内容。

先建立个表single_table,给他五个索引,id为主键索引,key1和key3为普通索引,key2为索引,idx_key_part为联合索引。然后自己可以写个程序给他插入10000条数据。

mysql> create table single_table(
    ->  id int not null auto_increment,
    ->  key1 varchar(100),
    ->  key2 int,
    ->  key3 varchar(100),
    ->  key_part1 varchar(100),
    ->  key_part2 varchar(100),
    ->  key_part3 varchar(100),
    ->  common_field varchar(100),
    ->  primary key(id),
    ->  key idx_key1 (key1),
    ->  unique key idx_key2 (key2),
    ->  key idx_key3 (key3),
    ->  key idx_key_part(key_part1,key_part2,key_part3)
    -> 
    -> )engine=innoDB charset=utf8;
Query OK, 0 rows affected (0.10 sec)
 

Const

当用主键查询和用二级索引查询的时候,查询的是const方式,这种方式表示速度非常快,性能消耗基本忽略不计,为什么呢?

SELECT * FROM single_table WHERE id = 1438;

SELECT * FROM single_table WHERE key2 = 3841;

我们前面说了主键查询是直接在聚簇索引的b+树叶子节点上查询的,聚簇索引叶子节点存放的是当前列的所有数据,所以只要直接查询就可以获取所有数据。

当我们用二级索引查询的时候,多也就回表查询一次,因为二级索引的叶子几点存放的是对应的id,再用id回表从聚簇索引b+树查询一次。

至于的二级索引比较特殊,比如这样:

SELECT * FROM single_table WHERE key2 IS NULL;

因为二级索引并不限制null值的数量,所以导致可能查询多条数据,这样sql优化机制就没办法就const方法来进行查询。

ref

上面的情况是二级索引查询,那如果普通二级索引查询呢?

SELECT * FROM single_table WHERE key1 = 'abc';

这时候,速度就是ref,比const效率差一点点,因为普通二级索引没有性,可能会查询来多条数据,所以并不能根主键查询和二级索引那样效率更高,前面的如果是坐火箭的话,这里大概是坐高铁差不多。查询的数据主要还是要看在二级索引的叶子节点会查出多少条id,如果id太多,回表的频率高,就非常影响性能,如果回表次数少,那效率还是非常高的。

1、二级索引列为null的情况:这点二级索引和普通二级索引都一样,因为null可能存在多条,这种情况多效率就是ref。

2、对于那种联合索引的二级索引来说,必须是where语句后面跟着常树相等的参数,比如

SELECT * FROM single_table WHERE key_part1 = 'god like'; SELECT * FROM single_table WHERE key_part1 = 'god like' AND key_part2 = 'legendary'; SELECT * FROM single_table WHERE key_part1 = 'god like' AND key_part2 = 'legendary' AND key_part3 = 'penta kill';

效率就是ref方法访问数据库,

如果是这种,则就不能达到ref方法访问数据库的效率。

SELECT * FROM single_table WHERE key_part1 = 'god like' AND key_part2 > 'legendary';

ref_or_null

当我们查询索引加null值的sql:

SELECT * FROM single_table WHERE key1 = 'abc' OR key1 IS NULL;

当这种情况,我们通过查询null值,并且这个sql没走全表扫描的时候,大部分is null都会放弃索引进行全表扫描,因为索引里没有存储null,如果这里走的是索引查询,则是用ref_or_null访问数据库。

range

这种区间方法查询数据库,如下sql会发生:

SELECT * FROM single_table WHERE key2 IN (1438, 6328) OR (key2 >= 38 AND key2 <= 79);

当前查询的区间是,1438数据和6328数据,以及38~79之间,这些数据都是sql需要的,这个sql可以用全表查询,或者二级索引+回表查询,此时查询就不是对某一个常量来匹配了,而是对这是哪个区间进行匹配。

1438和6328为单点范围区间,而38~79为连续范围区间,这种在mysql里面是用range方法来查询数据库的。

index

接下来看这个sql:

SELECT key_part1, key_part2, key_part3 FROM single_table WHERE key_part2 = 'abc';

这个sql特点是他们都属于联合索引,联合索引的特点是后面的如果查询使用到索引,必须左边那个数据是相等的,简称左原则,所以这里并不能用range和ref方法区查询数据库。

但这里他可以通过遍历二级联合索引,来查询我们所需要的值,并且这里前面需要查询的数据,都在二级叶子节点里,所以并不需要回表去聚簇索引叶子节点查询。

all

这种是性能差的全表查询,大家在写sql时候尽量避免这种方法访问数据库。

文章来源:知乎平台  原文地址:https://zhuanlan.zhihu.com/p/409610106

分享好友

分享这个小栈给你的朋友们,一起进步吧。

MySQL干货资料
创建时间:2020-05-06 14:18:32
每天都有干货输出哦
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • 飘絮絮絮丶
    专家
戳我,来吐槽~