InnoDB
是一个将表中的数据存储到磁盘上的存储引擎,所以即便关机后重启咱们的数据还是存在的。而真正处理数据的进程是发生在内存中的,所以需求把磁盘中的数据加载到内存中,假如是处理写入或修正恳求的话,还需求把内存中的内容刷新到磁盘上。
读写磁盘的速度十分慢,和内存读写差了几个数量级,所以当咱们想从表中获取某些记载时,InnoDB
存储引擎需求一条一条的把记载从磁盘上读出来么?不,那样会慢死,InnoDB
采取的方法是:将数据划分为若干个页,以页作为磁盘和内存之间交互的基本单位,InnoDB中页的巨细一般为16KB。也便是在一般情况下,一次最少从磁盘中读取16KB的内容到内存中,一次最少把内存中的16KB内容刷新到磁盘中。
InnoDB
为了不同的目的而设计了许多种不同类型的页
。常见的页类型有数据页(索引页)、Undo 页、体系页、业务数据页等。本文首要剖析的是数据页。
下面是关于数据页结构的简单描绘:
称号 | 中文名 | 占用空间巨细 | 简单描绘 |
---|---|---|---|
File Header |
文件头部 |
38 字节 |
页的一些通用信息 |
Page Header |
页面头部 |
56 字节 |
数据页专有的一些信息 |
Infimum + Supremum |
最小记载和最大记载 |
26 字节 |
两个虚拟的行记载 |
User Records |
用户记载 | 不确认 | 实践存储的行记载内容 |
Free Space |
闲暇空间 | 不确认 | 页中没有运用的空间 |
Page Directory |
页面目录 | 不确认 | 页中的某些记载的相对方位 |
File Trailer |
文件尾部 |
8 字节 |
校验页是否完好 |
一、File Header
File Header表明页的一些通用信息,占固定的38字节。由下面这些内容组成的:
称号 | 占用空间巨细 | 描绘 |
---|---|---|
FIL_PAGE_SPACE_OR_CHKSUM |
4 字节 |
页的校验和(checksum值) |
FIL_PAGE_OFFSET |
4 字节 |
页号 |
FIL_PAGE_PREV |
4 字节 |
上一个页的页号 |
FIL_PAGE_NEXT |
4 字节 |
下一个页的页号 |
FIL_PAGE_LSN |
8 字节 |
页面被最终修正时对应的日志序列方位(英文名是:Log Sequence Number) |
FIL_PAGE_TYPE |
2 字节 |
该页的类型 |
FIL_PAGE_FILE_FLUSH_LSN |
8 字节 |
仅在体系表空间的一个页中界说,代表文件至少被刷新到了对应的LSN值 |
FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID |
4 字节 |
该页归于哪个表空间 |
数据页的文件头部中记载了上一页和下一页的地址,证明叶子结点构成的是**双向链表
**。
1.1 FIL_PAGE_SPACE_OR_CHKSUM:校验和
用于确保页同步完好
。File Trailer的前四个字节是和File Header的FIL_PAGE_SPACE_OR_CHKSUM值对应,每当一个页修正了同步页到磁盘的时候,就会先同步File Header的FIL_PAGE_SPACE_OR_CHKSUM。最终才会同步File Trailer前四个字节的FIL_PAGE_SPACE_OR_CHKSUM。假如整个页同步正常,那么最终这两个的校验和将是共同的,反之则说明同步异常。
1.2 FIL_PAGE_TYPE
标识该存储页的类型。InnoDB其他类型的页,具体如下:
类型称号 | 十六进制 | 描绘 |
---|---|---|
FIL_PAGE_TYPE_ALLOCATED |
0x0000 | 最新分配,还没运用 |
FIL_PAGE_UNDO_LOG |
0x0002 | Undo日志页 |
FIL_PAGE_INODE |
0x0003 | 段信息节点 |
FIL_PAGE_IBUF_FREE_LIST |
0x0004 | Insert Buffer闲暇列表 |
FIL_PAGE_IBUF_BITMAP |
0x0005 | Insert Buffer位图 |
FIL_PAGE_TYPE_SYS |
0x0006 | 体系页 |
FIL_PAGE_TYPE_TRX_SYS |
0x0007 | 业务体系数据 |
FIL_PAGE_TYPE_FSP_HDR |
0x0008 | 表空间头部信息 |
FIL_PAGE_TYPE_XDES |
0x0009 | 扩展描绘页 |
FIL_PAGE_TYPE_BLOB |
0x000A | BLOB页 |
FIL_PAGE_INDEX |
0x45BF | 索引页,也便是咱们所说的数据页
|
二、Page Header
Page Header是用来记载数据页的状况信息的,由14个部分组成,共占56个字节 。由下面这些内容组成的:
称号 | 占用空间巨细 | 描绘 |
---|---|---|
PAGE_N_DIR_SLOTS |
2 字节 |
在页目录中的槽数量 |
PAGE_HEAP_TOP |
2 字节 |
还未运用的空间最小地址,也便是说从该地址之后便是Free Space
|
PAGE_N_HEAP |
2 字节 |
本页中的记载的数量(包含最小和最大记载以及符号为删去的记载) |
PAGE_FREE |
2 字节 |
第一个现已符号为删去的记载地址(各个已删去的记载经过next_record 也会组成一个单链表,这个单链表中的记载能够被重新利用) |
PAGE_GARBAGE |
2 字节 |
已删去记载占用的字节数 |
PAGE_LAST_INSERT |
2 字节 |
最终刺进记载的方位 |
PAGE_DIRECTION |
2 字节 |
记载刺进的方向 |
PAGE_N_DIRECTION |
2 字节 |
一个方向连续刺进的记载数量 |
PAGE_N_RECS |
2 字节 |
该页中记载的数量(不包含最小和最大记载以及被符号为删去的记载) |
PAGE_MAX_TRX_ID |
8 字节 |
修正当前页的最大业务ID,该值仅在二级索引中界说 |
PAGE_LEVEL |
2 字节 |
当前页在B+树中地点的层级 |
PAGE_INDEX_ID |
8 字节 |
索引ID,表明当前页归于哪个索引 |
PAGE_BTR_SEG_LEAF |
10 字节 |
B+树叶子段的头部信息,仅在B+树的Root页界说 |
PAGE_BTR_SEG_TOP |
10 字节 |
B+树非叶子段的头部信息,仅在B+树的Root页界说 |
三、Infimum + Supremum
Infimum和Supremum是InnoDB
界说的特殊行记载,没有变长字段长度列表和NULL值列表,分别为最小记载与最大记载。
留意:最小记载和最大记载的记载头会有默认值
- Infimum:
heap_no=0
record_type=2
- Supremum:
heap_no=1
record_type=3
3.1 Infimum
3.2 Supremum
四、User Records
存储行格局
的当地,行格局的记载头信息
称号 | 巨细(单位:bit) | 描绘 |
---|---|---|
预留位1 |
1 |
没有运用 |
预留位2 |
1 |
没有运用 |
delete_mask |
1 |
符号该记载是否被删去 |
min_rec_mask |
1 |
B+树的每层非叶子节点中的最小记载都会增加该符号 |
n_owned |
4 |
表明当前记载具有的记载数 |
heap_no |
13 |
表明当前记载在记载堆的方位信息 |
record_type |
3 |
表明当前记载的类型,0 表明普通记载,1 表明B+树非叶子节点记载,2 表明最小记载,3 表明最大记载 |
next_record |
16 |
表明下一条记载的相对方位 |
-
delete_mask
删去符号为1记载不会立即从磁盘上移除,是由于移除它们之后把其他的记载在磁盘上重新排列需求功能耗费,所以只是打一个删去符号而已,一切被删去掉的记载都会组成一个所谓的
垃圾链表
,在这个链表中的记载占用的空间称之为所谓的可重用空间
,之后假如有新记载刺进到表中的话,可能把这些被删去的记载占用的存储空间覆盖
掉。 -
next_record(
单链表
)表明从当前记载的实在数据到下一条记载的实在数据的地址偏移量。
比方说第一条记载的next_record
值为32
,意味着从第一条记载的实在数据的地址处向后找32
个字节便是下一条记载的实在数据。留意:
-
下一条记载
指得并不是依照咱们刺进次序的下一条记载,而是依照主键值由小到大的次序的下一条记载。而且规定Infimum记载(也便是最小记载)的下一条记载便是本页中主键值最小的用户记载 -
未被删去的记载
(delete_mask = 0)会依照主键从小到大的次序构成了一个单链表
-
五、Free Space
自己存储的记载会依照咱们指定的行格局
存储到User Records
部分。可是在一开始生成页的时候,其实并没有User Records
这个部分,每当咱们刺进一条记载,都会从Free Space
部分,也便是没有运用的存储空间中申请一个记载巨细的空间划分到User Records
部分,当Free Space
部分的空间悉数被User Records
部分替代掉之后,也就意味着这个页运用完了,假如还有新的记载刺进的话,就需求去申请新的页了,这个进程的图示如下:
六、Page Directory
InnoDB
为了快速定位记载制作了一个类似书目录相同的页目录
6.1 页目录的进程
- 将一切正常的记载(包含最大和最小记载,不包含符号为已删去的记载)划分为几个组。
- 每个组的最终一条记载(也便是组内最大的那条记载)的头信息中的
n_owned
特点表明该记载具有多少条记载,也便是该组内共有几条记载。 - 将每个组的最终一条记载的地址偏移量单独提取出来按次序存储到接近
页
的尾部的当地,这个当地便是所谓的Page Directory
,也便是页目录
(此时应该回来头看看页面各个部分的图)。页面目录中的这些地址偏移量被称为槽
(英文名:Slot
),所以这个页面目录便是由槽
组成的。
留意:
关于最小记载地点的分组只能有1条记载,最大记载地点的分组具有的记载条数只能在1~8条之间,剩下的分组中记载的条数规模只能在是4~8条之间。
6.2 分组进程
- 初始情况下一个数据页里只有最小记载和最大记载两条记载,它们分归于两个分组。
- 之后每刺进一条记载,都会从
页目录
中找到主键值比本记载的主键值大而且差值最小的槽,然后把该槽对应的记载的n_owned
值加1,表明本组内又增加了一条记载,直到该组中的记载数等于8个。 - 在一个组中的记载数等于8个后再刺进一条记载时,会将组中的记载拆分成两个组,一个组中4条记载,另一个5条记载。这个进程会在
页目录
中新增一个槽
来记载这个新增分组中最大的那条记载的偏移量。
6.3查询记载的进程
进程分为两步:
经过二分法确认该记载地点的槽,并找到该槽中主键值最小的那条记载。
经过记载的 next_record 特点遍历该槽地点的组中的各个记载。
由于各个槽代表的记载的主键值都是从小到大排序的,所以咱们能够运用所谓的二分法
来进行快速查找。4个槽的编号分别是:0
、1
、2
、3
、4
,所以初始情况下最低的槽便是low=0
,最高的槽便是high=4
。比方说咱们想找主键值为6
的记载,进程是这样的:
- 核算中心槽的方位:
(0+4)/2=2
,所以检查槽2
对应记载的主键值为8
,又由于8 > 6
,所以设置high=2
,low
坚持不变。 - 重新核算中心槽的方位:
(0+2)/2=1
,所以检查槽1
对应的主键值为4
,又由于4 < 6
,所以设置low=1
,high
坚持不变。 - 由于
high - low
的值为1,所以确认主键值为5
的记载在槽2
对应的组中。此刻咱们需求找到槽2
中主键值最小的那条记载,然后沿着单向链表遍历槽2
中的记载。可是咱们前面又说过,每个槽对应的记载都是该组中主键值最大的记载,这里槽2
对应的记载是主键值为8
的记载,怎么定位一个组中最小的记载呢?别忘了各个槽都是挨着的,咱们能够很容易的拿到槽1
对应的记载(主键值为4
),该条记载的下一条记载便是槽2
中主键值最小的记载,该记载的主键值为5
。所以咱们能够从这条主键值为5
的记载动身,遍历槽2
中的各条记载,直到找到主键值为6
的那条记载即可。由于一个组中包含的记载条数只能是1~8条,所以遍历一个组中的记载的价值是很小的。
七、File Trailer
为了校验页是否完好,每个页的尾部都加了一个File Trailer
部分,这个部分由8
个字节组成,能够分成2个小部分:
-
前4个字节代表页的校验和
这个部分是和
File Header
中的校验和相对应的。每当一个页面在内存中修正了,在同步之前就要把它的校验和算出来,由于File Header
在页面的前面,所以校验和会被首要同步到磁盘,当彻底写完时,校验和也会被写到页的尾部,假如彻底同步成功,则页的首部和尾部的校验和应该是共同的。假如写了一半儿断电了,那么在File Header
中的校验和就代表着现已修正过的页,而在File Trialer
中的校验和代表着原先的页,二者不同则意味着同步中心出了错。 -
后4个字节代表页面被最终修正时对应的日志序列方位(LSN)