InnoDB-索引页(数据页)

页是什么?

页是innoDB中管理储存空间的基本单位,页有很多中,存放数据的叫做索引页。其他先不说。

WechatIMG7.png
file header 页通用数据
page header 页专有数据
infimumsupremum 最小记录和最大记录
user records 用户记录
free space 闲置空间
page directory 页面目录,槽
file trailer 文件尾部,验证作用

先说说插入一条记录,这条记录是什么样子的

WechatIMG9.png

这里重要的几点
n_owned 当前记录的记录数
next_record 下条记录相对位置
delete_mask 标记是否删除
heap_no 当前记录在页中的位置

因为数据储存是一个单向链表,这个值是记录的该条数据真实值,到下一条记录真实值的地址偏移。这样用就可以通过上一条记录找到下一条记录。
下一条记录是指的下一个索引值的记录,而不是插入的顺序。在innoDB中,删除一条数据的操作,只会将delete_mask标记为1,上一条记录的next_record会自动变成下一条有效数据的地址偏移。
因为删除这个记录,会需要重排所有记录值,这样性能会有问题,但是被标记删除的记录位置,会变成可重用位置。之后再插入索引值为该位置的时候,会将此处重写。也就是说,单向链表,永远是按照索引顺序排列,新插入未制定索引都会插入到最后位置。
页初始化会有最大最小记录,最大记录的next_record为0,说明这就是最后一条。

查询中发生了什么?

如果傻瓜式查询,从头开始查,什么时候查到了,什么时候结束,这就太傻了。
所以innoDB觉得不能这么傻,决定搞点东西,让查询更快一些。
于是想到了目录这个东西。
因为所有数据都是在一个链表中,所以要给这个链表做一个目录
目录怎么做?
他会将所有数据,包括最大最小,分组。再将每组最后一条数据的真实数据位置偏移,放在页面的page directory中,这个就是页的目录了。
每组中最后一条数据的n_owned是表示该组一共有多少条。

WechatIMG13.png
这个分组是什么规则,为啥最小记录自己一组?
规定就是,最小记录分组只能他自己,别问我为什么,规定
最大记录的那组,可以是1-8条,剩下的只能是4-8条
来走一遍逻辑
当一条都没有的时候,最小记录自己一组,最大记录自己一组
当有7条记录的时候,最小记录一组,七条数据和最大记录一组,最大记录的n_owned为8
在加一条数据的时候,会先去槽中找一下,找索引值比他大,且差值最小的,(因为槽记录的是组中最大的数据)。如果该组到了8条,那就分出去4条成为新的组,剩下四条和这个新数据组成一个组,槽会跟着改变。
组搞好了,那就很简单了,直接用二分法找到对应的槽,然后遍历槽中的数据就可以了。毕竟槽中的数据很少了。
槽中的第一条数据可以通过上一个槽的next_record找到。

Page Header(页面头部)

先只说说
PAGE_LAST_INSERT最后插入记录的位置
PAGE_DIRECTION记录插入的方向
PAGE_N_DIRECTION一个方向连续插入的记录数量
如果新插入的记录的索引值,比上一条大(PAGE_LAST_INSERT可以看到上一条),那就是往右,这就是方向。如果连续方向都是一样的PAGE_N_DIRECTION就会记录这个数量,方向改变,就会清零。

File Header(文件头部)

FIL_PAGE_OFFSET页号
FIL_PAGE_PREV上一个页的页号
FIL_PAGE_NEXT下一个页的页号
每一页中的数据,是单向链表,也就是每条记录只记录下一条记录位置。
但是页是双向链表,每页会记录上一页下一页。这个是page header是页面特有属性,这个是索引页的属性,不代表所有类型的页都有。

File Trailer

这个是起校验作用的东西
可以分成两部分
第一部分:校验和
和fileheader是一样的,从内存同步到磁盘的时候,会先吧这个写进去。等同步完成,页尾的校验和,会和头部相同。
如果同步一半没电了,那就不会一样。
后面部分也是相同功能。


https://www.jianshu.com/p/e13e70b90a45

发表评论

电子邮件地址不会被公开。