上篇文章说了b+树索引的方案,因为用之前二分法查找,前提条件是索引必须是挨着的,而受到用户记录数的启发,建立了和用户记录真实数据页一样的目录记录页(索引),并且高三层,高层是根节点,底层是叶子节点,其他是非叶子节点,record_type为0 代表普通数据页,1代表目录记录页。
聚簇索引
上面我们介绍的b+树本身就是个目录,或者本身就是个索引,他有两个特点:
使用主键值大小进行记录和页的排序:1)页之间的双向链表通过主键值排序。2)页内的数据也是通过主键值连接成单项链表。3)目录记录页也是通过主键值连接成双向链表。
B+树的叶子节点存储的是完整的用户记录信息,包括隐藏页。
当满足这两个特点时,这就叫做聚簇索引,所有完整记录都记录在叶子节点。这种并不需要我们用sql语句显示的使用index创建,innoDB引擎会自动给我们创建聚簇索引。在innoDB中,聚簇索引就是数据的存储方式(所有记录都在叶子节点中),也就是索引即是数据,数据即是索引。
二级索引(secondary index)
上面的聚簇索引只有在查询主键的时候,才有效果,所以聚簇索引又叫主键索引。二级索引又叫辅助索引,二级索引的特点:
使用我们表里的列c2进行记录和页的排序:1)页之间的双向链表通过c2列排序。2)页内的数据通过c2列连接成单向链表。3)目录记录页也是通过c2列连接成双向链表。
二级索引的B+树的叶子节点不是用户存储数据,只存储c2列+他的主键。
二级索引的目录页不再是主键+页号,而是c2列+页号。
我们聚簇索引查询的时候是过程呢?
先根节点查询到我们的非叶子节点,非叶子节点在通过主键查询页码,二分查找法找到底层页码槽点,遍历槽点里的数据找到我们需要的所有值。
二级索引查找过程呢?
先根目录节点定位到我们c2非叶子节点,在根据c2非叶子几点对应的页码,找到对应的c2列和主键,后再回表,重新通过c2的主键查询一次b+树,通过聚簇索引的方法。
也就是当我们用二级索引,辅助索引的时候,需要遍历两颗b+树。那为什么需要回表的操作呢,确实可以吧所有数据页放在c2列的叶子节点处,但这样就和组件的叶子节点的数据冗余,太占内存。
文章来源:知乎平台 原文地址:https://zhuanlan.zhihu.com/p/401952444