连接查询-mysql详解（五）

2023-02-08 09:54:46

上篇文章说了，mysql5.6.6版本之前数据默认在系统表空间，之后默认在独立表空间，innodb因为索引和数据在一个b+树，所以两个文件，一个文件结构，一个存数据，myISAM则是三个文件。一个聚簇索引有两个段，叶子段和非叶子段，一个段有他专属的区，数据刚开始存在碎片区，不属于任何段，直属表空间。

Mysql访问方法

Access method的概念主要通过两种方法获取数据，种是全表扫描获取，第二种是通过索引获取，至于采用什么方式访问代价更低，这是mysql优化器该做的事。

Const：当我们采用主键或者键的时候，速度则是高效的，但这是建立在查询条件没查询null的情况下，如果是查询null，因为就不是，会查询到多条数据，这时候效率则是ref_null。

Ref：当我们用普通索引等值查询时候，这时候效率则是ref，他的经过是先查询二级索引b+树，再回表查询主表，这就意味着回表的数据越多，效率则越低，所以取决于二次查询的数据量，太多不会采用ref，当然，查询的前提也是没有null的情况。

Ref_or_null：当我们用索引列查询null的时候，效率就没有上面的高，于是就是当前等级。

Range：前面介绍都是等值查询，当前这个是范围查询，

Index：当我们查询的条件没有符合左索引，但是查询的列都包含复合索引，结果查询条件是从第二列开始，这时候他不会走复合索引，但是他会遍历复合索引。

All：这就是直接全表扫描。

当有两个二级索引出现的时候，一般只会用一个二级索引来查询，比如a、b两个二级索引，mysql优化器，会看哪个索引查询的数据更少，再用更少的数据来回表查询聚簇索引真实数据，查到真实数据后在过滤其他条件。

联合索引，前面刚说了当两个二级索引出现的时候，只会有一个二级索引查询，这也不是百分百的，1、如果两个二级索引都是查找，没有区间查找，这时候也是会触发两个二级索引查询。2、当主键id区间查找，也会触发两个索引查询。

因为单独索引mysql优化器内部会有union或和intersection且的消耗，当时使用两个索引的时候，于是联合索引肯定是更优的选择，在时间和空间都得到提升。

连接查询

当我们连接查询的时候，就有了驱动表的概念，mysql优化器会选择代价更小的作为驱动表，也就是个需要查询的表，而另一个表就是被驱动表，被驱动表查询的次数取决于驱动表查询数据的多少，驱动表查询一次，查询出来的数据，再多次查询被驱动表，多少条数据则查询多少次。

连接查询分为内连接和外连接，当查询的需求是驱动表有数据，而被驱动表没有数据，这时候则需要考虑用外连接，外连接则由on关键字需要使用，表示需要查询的结果即使没有查询到，也需要放入到结果集，而where查询的过滤条件不会放入结果集。Left join则是以左边表为驱动表，right join则是右边表为驱动表。

内连接和外连接大的区别就是on后面的过滤条件，会不会在结果集返回，内连接的on可以直接理解为where。

Nested_loop join：前面说了，驱动表查询的时候，只会访问一次，然后通过结果集查询被驱动表，这时候被驱动表会查询多次，那如果三个表四个表进行查询呢，就需要再次重复第二步操作，用结果集再次查询第三张表，依次嵌套查询下去，这个过程就像是嵌套循环，所以连接查询超过三次则会非常影响效率。

虽然被驱动表是需要查询多次的，但是也是可以走索引查询，因为mysql优化器会把sql优化成单表查询，然后走索引，当表1的a字段和表2的b字段相等的情况下，直接把驱动表表1确定常数，然后把值带入b字段单表查询表2，从而可以走索引。

Join buffer：扫描表的过程是先把磁盘上的数据刷新到内存上，然后在处理join，但实际场景中查询数据太大，这时候后面的数据磁盘io的情况下，前面的数据就需要释放。于是joinbuffer就出来了，这个参数可以用join buffer size来设置大小，他会把驱动表的结果集放入这个内存中，当然更好的效果还是在被驱动表的查询条件上加上索引，这样查询效率更高。

分享好友

分享这个小栈给你的朋友们，一起进步吧。

MySQL干货资料

创建时间：2020-05-06 14:18:32

每天都有干货输出哦

展开

订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅：虚拟交易，一经交易不退款；若特殊情况，可3日内客服咨询

• 专区发布评论属默认订阅所评论专区（除付费小栈外）

技术专家

查看更多

飘絮絮絮丶
专家