InnoDB是一个将表中的数据存储到磁盘上的存储引擎,所以即便关机后重启咱们的数据还是存在的。而真正处理数据的进程是发生在内存中的,所以需求把磁盘中的数据加载到内存中,假如是处理写入或修正恳求的话,还需求把内存中的内容刷新到磁盘上。

读写磁盘的速度十分慢,和内存读写差了几个数量级,所以当咱们想从表中获取某些记载时,InnoDB存储引擎需求一条一条的把记载从磁盘上读出来么?不,那样会慢死,InnoDB采取的方法是:将数据划分为若干个页,以页作为磁盘和内存之间交互的基本单位,InnoDB中页的巨细一般为16KB。也便是在一般情况下,一次最少从磁盘中读取16KB的内容到内存中,一次最少把内存中的16KB内容刷新到磁盘中。

InnoDB为了不同的目的而设计了许多种不同类型的。常见的页类型有数据页(索引页)、Undo 页、体系页、业务数据页等。本文首要剖析的是数据页。

InnoDB数据(索引)页普通的用户记录结构

下面是关于数据页结构的简单描绘:

称号 中文名 占用空间巨细 简单描绘
File Header 文件头部 38字节 页的一些通用信息
Page Header 页面头部 56字节 数据页专有的一些信息
Infimum + Supremum 最小记载和最大记载 26字节 两个虚拟的行记载
User Records 用户记载 不确认 实践存储的行记载内容
Free Space 闲暇空间 不确认 页中没有运用的空间
Page Directory 页面目录 不确认 页中的某些记载的相对方位
File Trailer 文件尾部 8字节 校验页是否完好

一、File Header

File Header表明页的一些通用信息,占固定的38字节。由下面这些内容组成的:

称号 占用空间巨细 描绘
FIL_PAGE_SPACE_OR_CHKSUM 4字节 页的校验和(checksum值)
FIL_PAGE_OFFSET 4字节 页号
FIL_PAGE_PREV 4字节 上一个页的页号
FIL_PAGE_NEXT 4字节 下一个页的页号
FIL_PAGE_LSN 8字节 页面被最终修正时对应的日志序列方位(英文名是:Log Sequence Number)
FIL_PAGE_TYPE 2字节 该页的类型
FIL_PAGE_FILE_FLUSH_LSN 8字节 仅在体系表空间的一个页中界说,代表文件至少被刷新到了对应的LSN值
FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID 4字节 该页归于哪个表空间

数据页的文件头部中记载了上一页和下一页的地址,证明叶子结点构成的是**双向链表**。

1.1 FIL_PAGE_SPACE_OR_CHKSUM:校验和

用于确保页同步完好。File Trailer的前四个字节是和File Header的FIL_PAGE_SPACE_OR_CHKSUM值对应,每当一个页修正了同步页到磁盘的时候,就会先同步File Header的FIL_PAGE_SPACE_OR_CHKSUM。最终才会同步File Trailer前四个字节的FIL_PAGE_SPACE_OR_CHKSUM。假如整个页同步正常,那么最终这两个的校验和将是共同的,反之则说明同步异常。

1.2 FIL_PAGE_TYPE

标识该存储页的类型。InnoDB其他类型的页,具体如下:

类型称号 十六进制 描绘
FIL_PAGE_TYPE_ALLOCATED 0x0000 最新分配,还没运用
FIL_PAGE_UNDO_LOG 0x0002 Undo日志页
FIL_PAGE_INODE 0x0003 段信息节点
FIL_PAGE_IBUF_FREE_LIST 0x0004 Insert Buffer闲暇列表
FIL_PAGE_IBUF_BITMAP 0x0005 Insert Buffer位图
FIL_PAGE_TYPE_SYS 0x0006 体系页
FIL_PAGE_TYPE_TRX_SYS 0x0007 业务体系数据
FIL_PAGE_TYPE_FSP_HDR 0x0008 表空间头部信息
FIL_PAGE_TYPE_XDES 0x0009 扩展描绘页
FIL_PAGE_TYPE_BLOB 0x000A BLOB页
FIL_PAGE_INDEX 0x45BF 索引页,也便是咱们所说的数据页

二、Page Header

Page Header是用来记载数据页的状况信息的,由14个部分组成,共占56个字节 。由下面这些内容组成的:

称号 占用空间巨细 描绘
PAGE_N_DIR_SLOTS 2字节 在页目录中的槽数量
PAGE_HEAP_TOP 2字节 还未运用的空间最小地址,也便是说从该地址之后便是Free Space
PAGE_N_HEAP 2字节 本页中的记载的数量(包含最小和最大记载以及符号为删去的记载)
PAGE_FREE 2字节 第一个现已符号为删去的记载地址(各个已删去的记载经过next_record也会组成一个单链表,这个单链表中的记载能够被重新利用)
PAGE_GARBAGE 2字节 已删去记载占用的字节数
PAGE_LAST_INSERT 2字节 最终刺进记载的方位
PAGE_DIRECTION 2字节 记载刺进的方向
PAGE_N_DIRECTION 2字节 一个方向连续刺进的记载数量
PAGE_N_RECS 2字节 该页中记载的数量(不包含最小和最大记载以及被符号为删去的记载)
PAGE_MAX_TRX_ID 8字节 修正当前页的最大业务ID,该值仅在二级索引中界说
PAGE_LEVEL 2字节 当前页在B+树中地点的层级
PAGE_INDEX_ID 8字节 索引ID,表明当前页归于哪个索引
PAGE_BTR_SEG_LEAF 10字节 B+树叶子段的头部信息,仅在B+树的Root页界说
PAGE_BTR_SEG_TOP 10字节 B+树非叶子段的头部信息,仅在B+树的Root页界说

三、Infimum + Supremum

Infimum和Supremum是InnoDB界说的特殊行记载,没有变长字段长度列表和NULL值列表,分别为最小记载与最大记载。

留意:最小记载和最大记载的记载头会有默认值

  • Infimum:heap_no=0 record_type=2
  • Supremum:heap_no=1 record_type=3

3.1 Infimum

InnoDB数据(索引)页普通的用户记录结构

3.2 Supremum

InnoDB数据(索引)页普通的用户记录结构

四、User Records

存储行格局的当地,行格局的记载头信息

称号 巨细(单位:bit) 描绘
预留位1 1 没有运用
预留位2 1 没有运用
delete_mask 1 符号该记载是否被删去
min_rec_mask 1 B+树的每层非叶子节点中的最小记载都会增加该符号
n_owned 4 表明当前记载具有的记载数
heap_no 13 表明当前记载在记载堆的方位信息
record_type 3 表明当前记载的类型,0表明普通记载,1表明B+树非叶子节点记载,2表明最小记载,3表明最大记载
next_record 16 表明下一条记载的相对方位
  • delete_mask

    删去符号为1记载不会立即从磁盘上移除,是由于移除它们之后把其他的记载在磁盘上重新排列需求功能耗费,所以只是打一个删去符号而已,一切被删去掉的记载都会组成一个所谓的垃圾链表,在这个链表中的记载占用的空间称之为所谓的可重用空间,之后假如有新记载刺进到表中的话,可能把这些被删去的记载占用的存储空间覆盖掉。

  • next_record(单链表)

    表明从当前记载的实在数据到下一条记载的实在数据的地址偏移量。 比方说第一条记载的next_record值为32,意味着从第一条记载的实在数据的地址处向后找32个字节便是下一条记载的实在数据。

    留意:

    • 下一条记载指得并不是依照咱们刺进次序的下一条记载,而是依照主键值由小到大的次序的下一条记载。而且规定Infimum记载(也便是最小记载)的下一条记载便是本页中主键值最小的用户记载
    • 未被删去的记载(delete_mask = 0)会依照主键从小到大的次序构成了一个单链表

InnoDB数据(索引)页普通的用户记录结构

五、Free Space

自己存储的记载会依照咱们指定的行格局存储到User Records部分。可是在一开始生成页的时候,其实并没有User Records这个部分,每当咱们刺进一条记载,都会从Free Space部分,也便是没有运用的存储空间中申请一个记载巨细的空间划分到User Records部分,当Free Space部分的空间悉数被User Records部分替代掉之后,也就意味着这个页运用完了,假如还有新的记载刺进的话,就需求去申请新的页了,这个进程的图示如下:

InnoDB数据(索引)页普通的用户记录结构

六、Page Directory

InnoDB为了快速定位记载制作了一个类似书目录相同的页目录

6.1 页目录的进程

  1. 将一切正常的记载(包含最大和最小记载,不包含符号为已删去的记载)划分为几个组。
  2. 每个组的最终一条记载(也便是组内最大的那条记载)的头信息中的n_owned特点表明该记载具有多少条记载,也便是该组内共有几条记载。
  3. 将每个组的最终一条记载的地址偏移量单独提取出来按次序存储到接近的尾部的当地,这个当地便是所谓的Page Directory,也便是页目录(此时应该回来头看看页面各个部分的图)。页面目录中的这些地址偏移量被称为(英文名:Slot),所以这个页面目录便是由组成的。

留意:

关于最小记载地点的分组只能有1条记载,最大记载地点的分组具有的记载条数只能在1~8条之间,剩下的分组中记载的条数规模只能在是4~8条之间。

6.2 分组进程

  1. 初始情况下一个数据页里只有最小记载和最大记载两条记载,它们分归于两个分组。
  2. 之后每刺进一条记载,都会从页目录中找到主键值比本记载的主键值大而且差值最小的槽,然后把该槽对应的记载的n_owned值加1,表明本组内又增加了一条记载,直到该组中的记载数等于8个。
  3. 在一个组中的记载数等于8个后再刺进一条记载时,会将组中的记载拆分成两个组,一个组中4条记载,另一个5条记载。这个进程会在页目录中新增一个来记载这个新增分组中最大的那条记载的偏移量。

InnoDB数据(索引)页普通的用户记录结构

6.3查询记载的进程

进程分为两步:

  1. 经过二分法确认该记载地点的槽,并找到该槽中主键值最小的那条记载。
  2. 经过记载的 next_record 特点遍历该槽地点的组中的各个记载。

由于各个槽代表的记载的主键值都是从小到大排序的,所以咱们能够运用所谓的二分法来进行快速查找。4个槽的编号分别是:01234,所以初始情况下最低的槽便是low=0,最高的槽便是high=4。比方说咱们想找主键值为6的记载,进程是这样的:

  1. 核算中心槽的方位:(0+4)/2=2,所以检查槽2对应记载的主键值为8,又由于8 > 6,所以设置high=2low坚持不变。
  2. 重新核算中心槽的方位:(0+2)/2=1,所以检查槽1对应的主键值为4,又由于4 < 6,所以设置low=1high坚持不变。
  3. 由于high - low的值为1,所以确认主键值为5的记载在槽2对应的组中。此刻咱们需求找到槽2中主键值最小的那条记载,然后沿着单向链表遍历槽2中的记载。可是咱们前面又说过,每个槽对应的记载都是该组中主键值最大的记载,这里槽2对应的记载是主键值为8的记载,怎么定位一个组中最小的记载呢?别忘了各个槽都是挨着的,咱们能够很容易的拿到槽1对应的记载(主键值为4),该条记载的下一条记载便是槽2中主键值最小的记载,该记载的主键值为5。所以咱们能够从这条主键值为5的记载动身,遍历槽2中的各条记载,直到找到主键值为6的那条记载即可。由于一个组中包含的记载条数只能是1~8条,所以遍历一个组中的记载的价值是很小的。

七、File Trailer

为了校验页是否完好,每个页的尾部都加了一个File Trailer部分,这个部分由8个字节组成,能够分成2个小部分:

  • 前4个字节代表页的校验和

      这个部分是和File Header中的校验和相对应的。每当一个页面在内存中修正了,在同步之前就要把它的校验和算出来,由于File Header在页面的前面,所以校验和会被首要同步到磁盘,当彻底写完时,校验和也会被写到页的尾部,假如彻底同步成功,则页的首部和尾部的校验和应该是共同的。假如写了一半儿断电了,那么在File Header中的校验和就代表着现已修正过的页,而在File Trialer中的校验和代表着原先的页,二者不同则意味着同步中心出了错。

  • 后4个字节代表页面被最终修正时对应的日志序列方位(LSN)