根本概念

ACID 准则

ACID，即 Atomicity（原子性）、Consistency（一致性）、Isolation（阻隔性）、Durability（持久性）四种特性的缩写。

ACID 也是一种比较出名的描绘一致性的准则，一般呈现在分布式数据库等依据业务进程的体系中。

具体来说，ACID 准则描绘了分布式数据库需要满意的一致性需求，同时答应支付可用性的代价。

Atomicity：每次业务是原子的，业务包含的所有操作要么悉数成功，要么悉数不履行。一旦有操作失利，则需要回退状况到履行业务之前；
Consistency：数据库的状况在业务履行前后的状况是一致的和完好的，无中间状况。即只能处于成功业务提交后的状况；
Isolation：各种业务能够并发履行，但彼此之间相互不影响。按照标准 SQL 规范，从弱到强能够分为未授权读取、授权读取、可重复读取和串行化四种阻隔等级；
Durability：状况的改变是持久的，不会失效。一旦某个业务提交，则它造成的状况改变便是永久性的。

延伸-BASE与CAP

BASE准则

与 ACID 相对的一个准则是 eBay 技术专家 Dan Pritchett 提出的 BASE（Basic Availability，Soft-state，Eventual Consistency）准则。BASE 准则面向大型高可用分布式体系，主张献身掉对强一致性的追求，而实现终究一致性，来换取必定的可用性。

根本可用（Basically Available）：体系确保在呈现毛病或许异常状况时，依然能够确保根本的可用性，即体系能够正常呼应用户请求，可是或许会呈现一些数据的不一致或许过错。
软状况（Soft State）：体系中的数据状况不需要是强一致性的，即答应数据在一段时刻内处于中间状况，而不是有必要确保数据在任何时刻点都是完全一致的。这样能够进步体系的可扩展性和容错性。
终究一致性（Eventual Consistency）：体系确保终究会到达一致性状况，可是在数据更新后，不同节点之间或许存在一段时刻的数据不一致。这种不一致是暂时的，随着时刻的推移会逐步被修复，直到所有节点都到达一致性状况。

BASE的规划理念是为了满意大规模分布式体系的需求，它与ACID的规划理念不同，不要求在所有状况下都严格确保数据的一致性，而是答应在某些状况下献身一部分的一致性，以换取更高的可用性和可扩展性。可是，在实践的应用中，需要依据具体的业务需求和体系特色，挑选合适的数据办理体系规划理念，综合考虑数据的一致性、可用性和可扩展性等方面的要素。

CAP

CAP是指分布式体系中三个根本特性的缩写：

一致性（Consistency）：所有节点在同一时刻看到的数据是一致的，即所有节点都具有相同的数据副本。在分布式体系中，这意味着在进行更新操作之后，所有节点有必要终究到达一致的状况。
可用性（Availability）：体系能够在任何时刻点正常呼应用户请求，即体系的服务不会由于某些异常状况而停止呼应。
分区容错性（Partition tolerance）：分布式体系能够在网络分区或许节点毛病的状况下持续运转。这意味着体系在遇到网络分区或许节点毛病时，依然能够确保数据的一致性和可用性。

CAP理论指出，在一个分布式体系中，最多只能同时满意其间的两个特性，而不能同时满意所有三个特性。因此，当体系遇到网络分区或许节点毛病时，分布式体系需要做出权衡，挑选满意一致性和可用性中的哪一个特性，然后确保体系的正确性和可靠性。假如挑选了分区容错性，那么体系或许会呈现数据不一致的状况；假如挑选了一致性和可用性，那么体系或许会呈现停机和延迟呼应等问题。

在实践的分布式体系中，需要依据具体的业务需求和体系特色，挑选合适的CAP特性，综合考虑数据的一致性、可用性和容错性等方面的要素。

数据库并发业务存在问题

脏读（dirty read）、不可重复读（non-repeatable read）、幻读（phantom read）都是数据库中的并发操控问题，首要影响业务的阻隔性。

脏读（Dirty read）：指一个业务读取了另一个业务还未提交的未经提交的数据。假如另一个业务回滚，那么第一个业务读取的数据便是无效的，这或许会导致数据的不一致性。
不可重复读（Non-repeatable read）：指一个业务在读取同一行记载时，不同时刻内读取到的数据不一致。这是由于在两次读取之间，另一个业务修正或删除了该行记载。
幻读（Phantom read）：指一个业务在读取一组记载时，第2次读取时发现多了或少了一些记载。这是由于在两次读取之间，另一个业务插入了一些记载或许删除了一些记载。

脏读、不可重复读、幻读都是由于并发业务之间的竞赛而导致的问题，能够通过加锁或许运用更高等级的阻隔等级来解决。

数据库阻隔等级

SQL 标准的业务阻隔等级包含：读未提交（read uncommitted）、读提交（read committed）、可重复读（repeatable read）和串行化（serializable ）。

读未提交是指，一个业务还没提交时，它做的改变就能被别的业务看到。
读提交是指，一个业务提交之后，它做的改变才会被其他业务看到。
可重复读是指，一个业务履行进程中看到的数据，总是跟这个业务在启动时看到的数据是一致的。当然在可重复读阻隔等级下，未提交改变对其他业务也是不可见的。
串行化，顾名思义是对于同一行记载，“写”会加“写锁”，“读”会加“读锁”。当呈现读写锁抵触的时分，后拜访的业务有必要等前一个业务履行完成，才干持续履行。

阻隔等级解决并发问题

数据库默许阻隔等级

MYSQL

默许阻隔等级是可重复读

mysql> show variables like 'transaction_isolation';
+-----------------------+-----------------+
| Variable_name         | Value           |
+-----------------------+-----------------+
| transaction_isolation | REPEATABLE-READ |
+-----------------------+-----------------+
1 row in set (0.01 sec)
mysql> show global variables like 'transaction_isolation';
+-----------------------+-----------------+
| Variable_name         | Value           |
+-----------------------+-----------------+
| transaction_isolation | REPEATABLE-READ |
+-----------------------+-----------------+
1 row in set (0.00 sec)

延伸：SESSION阻隔等级是指在一个 MySQL 会话中，能够通过设置阻隔等级来操控该会话中的业务阻隔等级。在同一个 MySQL 实例中，不同会话能够设置不同的阻隔等级。能够运用以下指令来设置 SESSION 阻隔等级：

SET SESSION TRANSACTION ISOLATION LEVEL <isolation_level>;

其间，isolation_level 表示要设置的阻隔等级，能够是 READ UNCOMMITTED、READ COMMITTED、REPEATABLE READ或 SERIALIZABLE。

ORACLE

Oracle默许的阻隔等级是读已提交（Read Committed）

一条查询SQL履行进程

SQL句子履行全体流程如下，在前面的全体架构图中也介绍过

客户端

客户端首要是通过MYSQL驱动来和数据库进行通讯，MySQL 驱动是一种软件组件，用于在应用程序和 MySQL 数据库之间树立衔接，以便应用程序能够拜访和操作 MySQL 数据库。MySQL 驱动一般有以下几种类型：
JDBC驱动（Java Database Connectivity）、ODBC驱动（Open Database Connectivity）、Connector/C 驱动等客户端需要频频运用数据库衔接，采用池化技术-数据库衔接池来进行办理：维护必定的衔接数，方便体系获取衔接，运用就去池子中获取，用完放回去就能够了，咱们不需要关怀衔接的创建与毁掉，也不需要关怀线程池是怎样去维护这些衔接的。

常见的数据库衔接池有 Druid、C3P0、DBCP，后面有一节专门叙述

衔接器

衔接器担任跟客户端树立衔接、获取权限、维持和办理衔接。
指令如下：

/home/mysql/mysql3306/bin/mysql -uroot -p -S /home/mysql/mysql3306/mysqld.sock

衔接指令中的 mysql 是客户端东西，用来跟服务端树立衔接。在完成经典的 TCP 握手后，衔接器就要开端认证你的身份，这个时分用的便是你输入的用户名和暗码。

假如用户名或暗码不对，你就会收到一个”Access denied for user”的过错，然后客户端程序完毕履行。
假如用户名暗码认证通过，衔接器会到权限表里边查出你具有的权限。之后，这个衔接里边的权限判别逻辑，都将依赖于此时读到的权限。

划要点：一个用户成功树立衔接后，即使你用办理员账号对这个用户的权限做了修正，也不会影响现已存在衔接的权限。修正完成后，只有再新建的衔接才会运用新的权限设置。

show processlist 能够检查当时衔接

mysql> show processlist;
+----+------+---------------------------+------+---------+------+----------+------------------+
| Id | User | Host                      | db   | Command | Time | State    | Info             |
+----+------+---------------------------+------+---------+------+----------+------------------+
|  2 | root | localhost                 | NULL | Query   |    0 | starting | show processlist |
|  8 | root | TOBY-HYW.mshome.net:24708 | NULL | Sleep   |   27 |          | NULL             |
|  9 | root | TOBY-HYW.mshome.net:24709 | NULL | Sleep   |   27 |          | NULL             |
+----+------+---------------------------+------+---------+------+----------+------------------+
3 rows in set (0.00 sec)

客户端假如太长时刻没动静，衔接器就会自动将它断开。这个时刻是由参数 wait_timeout 操控的，默许值是 8 小时。

mysql> show variables like 'wait_timeout';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| wait_timeout  | 28800 |
+---------------+-------+
1 row in set (0.01 sec)

树立衔接的进程一般是比较复杂的，所以我主张你在运用中要尽量削减树立衔接的动作，也便是尽量运用长衔接。 MySQL 占用内存涨得特别快，这是由于 MySQL 在履行进程中临时运用的内存是办理在衔接目标里边的。这些资源会在衔接断开的时分才释放。解决此问题：

定时断开长衔接。运用一段时刻，或许程序里边判别履行过一个占用内存的大查询后，断开衔接，之后要查询再重连。
假如你用的是 MySQL 5.7 或更新版别，能够在每次履行一个比较大的操作后，通过履行 mysql_reset_connection 来从头初始化衔接资源。这个进程不需要重连和从头做权限验证，可是会将衔接康复到刚刚创建完时的状况。

查询缓存

命中则直接完毕，一般不运用。查询缓存的失效十分频频，只要有对一个表的更新，这个表上所有的查询缓存都会被清空。query_cache_type(OFF|ON|DEMAND 按需，运用select SQL_CACHE * from T where ID=10显示指定)操控默许是封闭的

mysql> show variables like 'query_cache_type';
+------------------+-------+
| Variable_name    | Value |
+------------------+-------+
| query_cache_type | OFF   |
+------------------+-------+

MySQL 8.0 版别直接将查询缓存的整块功用删掉了，也便是说 8.0 开端彻底没有这个功用了。

分析器

词法分析、语法分析假如你的句子不对，就会收到“You have an error in your SQL syntax”的过错提醒

优化器

优化器是在表里边有多个索引的时分，决议运用哪个索引；或许在一个句子有多表关联（join）的时分，决议各个表的衔接顺序。

履行器

MySQL 通过分析器知道了你要做什么，通过优化器知道了该怎样做，所以就进入了履行器阶段，开端履行句子。

开端履行的时分，要先判别一下你对这个表有没有履行查询的权限，假如没有，就会回来没有权限的过错，假如有权限，就翻开表持续履行。翻开表的时分，履行器就会依据表的引擎定义，去运用这个引擎供给的接口。

引擎层

供给接口给履行层运用，分为多个履行引擎，后面独自叙述

问题解答

问题1

假如表 T 中没有字段 k，而你履行了这个句子 select * from T where k=1, 那肯定是会报“不存在这个列”的过错： “Unknown column ‘k’ in ‘where clause’”。你觉得这个过错是在咱们上面提到的哪个阶段报出来的呢？

答案：分析器

一条更新SQL履行进程

更新SQL和查询SQL在server层是一样的（在查询缓存时将缓存失效调），在引擎层不一样，更新流程还涉及两个重要的日志模块

参阅
1.一条SQL句子是怎么履行的
2.MySQL – 一条 SQL 的履行进程详解

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

MYSQL系列-基本概念和SQL执行过程