第二层包括大部分的 MySQL 核心服务功能, 包括查询解析, 分析, 优化, 缓存以及所有的内置函数, 所有跨存储引擎的功能都在这一层实现: 存储过程, 触发器, 视图等.
第三层包含了存储引擎. 存储引擎负责 MySQL 中数据的存储和提取. 每个存储引擎都有它的优势和劣势. 服务器通过 API 与存储引擎进行通信. 这些接口屏蔽了不同存储引擎之间的差异, 使得这些差异对上层的查询过程透明. 存储引擎不会去解析 SQL, 不同存储引擎之间也不会相互通信, 只是简单的响应上层服务器的请求.
每个客户端连接都会在服务器进程中拥有一个线程, 这个连接的查询只会在这个单独线程的上下文中执行, 该线程只能轮流在某个 CPU 核心(多核)或者 CPU 中运行. 服务器会负责缓存线程, 因此不需要为每一个新建的连接创建或者销毁线程.
当客户端(应用)连接到 MySQL 服务器时, 服务器需要对其进行认证. 认证基于用户名, 原始主机信息和密码. 如果使用了安全套接字(SSL)的方式连接, 还可以使用 X.509 证书认证. 一旦客户端连接成功, 服务器会继续验证该客户端是否具有执行某个特定查询的权限(例如, 是否允许客户端对 world 数据库的 Country 表执行 SELECT 语句).
MySQL 会解析查询, 并创建内部数据结构(解析树), 然后对其进行各种优化, 包括重写查询, 决定表的读取顺序, 以及选择合适的索引等. 用户可以通过特殊的关键字提示(hint)优化器, 影响它的决策过程. 也可以请求优化器解释(explain)优化过程的各个因素, 使用户可以知道服务器是如何进行优化决策的, 并提供一个参考基准, 便于用户重构查询和 schema, 修改相关配置, 使应用尽可能高效运行. 第6章我们将讨论更多优化器的细节.
优化器并不关心表使用的是什么存储引擎, 但存储引擎对于优化查询是有影响的. 优化器会请求存储引擎提供容量或某个具体操作的开销信息, 以及表数据的统计信息等. 例如, 某些存储引擎的某种索引, 可能对一些特定的查询有优化. 关于索引与schema的优化, 请参见第4章和第5章.
对于 SELECT 语句, 在解析查询之前, 服务器会先检查查询缓存(QueryCache), 如果能够在其中找到对应的查询, 服务器就不必再执行查询解析, 优化和执行的整个过程, 而是直接返回查询缓存中的结果集. 第7章详细讨论了相关内容.
无论何时, 只要有多个查询需要在同一时刻修改数据, 都会产生并发控制的问题. 本章的目的是讨论 MySQL 在两个层面的并发控制: 服务器层与存储引擎层. 并发控制是一个内容庞大的话题, 有大量的理论文献对其进行过详细的论述. 本章只简要地讨论 MySQL 如何控制并发读写, 因此读者需要有相关的知识来理解本章接下来的内容.
以 Unix 系统的 emailbox 为例, 典型的 mbox 文件格式是非常简单的. 一个 mbox 邮箱中的所有邮件都串行在一起, 彼此首尾相连. 这种格式对于读取和分析邮件信息非常友好, 同时投递邮件也很容易, 只要在文件末尾附加新的邮件内容即可.
但如果两个进程在同一时刻对同一个邮箱投递邮件, 会发生什么情况? 显然, 邮箱的数据会被破坏, 两封邮件的内容会交叉地附加在邮箱文件的末尾. 设计良好的邮箱投递系统会通过锁(lock)来防止数据损坏. 如果客户试图投递邮件, 而邮箱已经被其他客户锁住, 那就必须等待, 直到锁释放才能进行投递.
这种锁的方案在实际应用环境中虽然工作良好, 但并不支持并发处理. 因为在任意一个时刻, 只有一个进程可以修改邮箱的数据, 这在大容量的邮箱系统中是个问题.
从邮箱中读取数据没有这样的麻烦, 即使同一时刻多个用户并发读取也不会有什么问题. 因为读取不会修改数据, 所以不会出错. 但如果某个客户正在读取邮箱, 同时另外一个用户试图删除编号为25的邮件, 会产生什么结果?结论是不确定, 读的客户可能会报错退出, 也可能读取到不一致的邮箱数据. 所以, 为安全起见, 即使是读取邮箱也需要特别注意.
如果把上述的邮箱当成数据库中的一张表, 把邮件当成表中的一行记录, 就很容易看出, 同样的问题依然存在. 从很多方面来说, 邮箱就是一张简单的数据库表. 修改数据库表中的记录, 和删除或者修改邮箱中的邮件信息, 十分类似.
解决这类经典问题的方法就是并发控制, 其实非常简单. 在处理并发读或者写时, 可以通过实现一个由两种类型的锁组成的锁系统来解决问题. 这两种类型的锁通常被称为共享锁(sharedlock)和排他锁(exclusivelock), 也叫读锁(readlock)和写锁(writelock).
这里先不讨论锁的具体实现, 描述一下锁的概念如下: 读锁是共享的, 或者说是相互不阻塞的. 多个客户在同一时刻可以同时读取同一个资源, 而互不干扰. 写锁则是排他的, 也就是说一个写锁会阻塞其他的写锁和读锁, 这是出于安全策略的考虑, 只有这样, 才能确保在给定的时间里, 只有一个用户能执行写入, 并防止其他用户读取正在写入的同一资源.
在实际的数据库系统中, 每时每刻都在发生锁定, 当某个用户在修改某一部分数据时, MySQL 会通过锁定防止其他用户读取同一数据. 大多数时候, MySQL 锁的内部管理都是透明的.
一种提高共享资源并发性的方式就是让锁定对象更有选择性. 尽量只锁定需要修改的部分数据, 而不是所有的资源. 更理想的方式是, 只对会修改的数据片进行精确的锁定. 任何时候, 在给定的资源上, 锁定的数据量越少, 则系统的并发程度越高, 只要相互之间不发生冲突即可.
问题是加锁也需要消耗资源. 锁的各种操作, 包括获得锁、检查锁是否已经解除、释放锁等, 都会增加系统的开销. 如果系统花费大量的时间来管理锁, 而不是存取数据, 那么系统的性能可能会因此受到影响.
所谓的锁策略, 就是在锁的开销和数据的安全性之间寻求平衡, 这种平衡当然也会影响到性能. 大多数商业数据库系统没有提供更多的选择, 一般都是在表上施加行级锁(row-level lock), 并以各种复杂的方式来实现, 以便在锁比较多的情况下尽可能地提供更好的性能.
而 MySQL 则提供了多种选择. 每种 MySQL 存储引擎都可以实现自己的锁策略和锁粒度. 在存储引擎的设计中, 锁管理是个非常重要的决定. 将锁粒度固定在某个级别, 可以为某些特定的应用场景提供更好的性能, 但同时却会失去对另外一些应用场景的良好支持. 好在 MySQL 支持多个存储引擎的架构, 所以不需要单一的通用解决方案. 下面将介绍两种最重要的锁策略.
表锁是MySQL中最基本的锁策略, 并且是开销最小的策略. 表锁非常类似于前文描述的邮箱加锁机制: 它会锁定整张表. 一个用户在对表进行写操作(插入、删除、更新等)前, 需要先获得写锁, 这会阻塞其他用户对该表的所有读写操作. 只有没有写锁时, 其他读取的用户才能获得读锁, 读锁之间是不相互阻塞的. 在特定的场景中, 表锁也可能有良好的性能. 例如, READLOCAL表锁支持某些类型的并发写操作. 另外, 写锁也比读锁有更高的优先级, 因此一个写锁请求可能会被插入到读锁队列的前面(写锁可以插入到锁队列中读锁的前面, 反之读锁则不能插入到写锁的前面). 尽管存储引擎可以管理自己的锁, MySQL本身还是会使用各种有效的表锁来实现不同的目的. 例如, 服务器会为诸如ALTERTABLE 之类的语句使用表锁, 而忽略存储引擎的锁机制.
行级锁可以最大程度地支持并发处理(同时也带来了最大的锁开销). 众所周知, 在 InnoDB 和 XtraDB, 以及其他一些存储引擎中实现了行级锁. 行级锁只在存储引擎层实现, 而MySQL服务器层(如有必要, 请回顾前文的逻辑架构图)没有实现. 服务器层完全不了解存储引擎中的锁实现. 在本章的后续内容以及中, 所有的存储引擎都以自己的方式显现了锁机制.
在理解事务的概念之前, 接触数据库系统的其他高级特性还言之过早. 事务就是一组原子性的 SQL 查询, 或者说一个独立的工作单元. 如果数据库引擎能够成功地对数据库应用该组查询的全部语句, 那么就执行该组查询. 如果其中有任何一条语句因为崩溃或其他原因无法执行, 那么所有的语句都不会执行. 也就是说, 事务内的语句, 要么全部执行成功, 要么全部执行失败.
本节的内容并非专属于 MySQL, 如果读者已经熟悉了事务的 ACID 的概念, 可以直接跳转到 1.3.4 节.
银行应用是解释事务必要性的一个经典例子. 假设一个银行的数据库有两张表: 支票(checking)表和储蓄(savings)表. 现在要从用户 Jane 的支票账户转移 200 美元到她的储蓄账户, 那么需要至少三个步骤:
- 检查支票账户的余额高于200美元.
- 从支票账户余额中减去200美元.
- 在储蓄账户余额中增加200美元.
上述三个步骤的操作必须打包在一个事务中, 任何一个步骤失败, 则必须回滚所有的步骤. 可以用 START TRANSACTION 语句开始一个事务, 然后要么使用 COMMIT 提交事务将修改的数据持久保留, 要么使用 ROLLBACK 撤销所有的修改. 事务 SQL 的样本如下:
1 START TRANSACTION;
2 SELECT balance FROM checking WHERE customer_id=10233276;
3 UPDATE checking SET balance=balance-200.00 WHERE customer_id=10233276;
4 UPDATE savings SET balance=balance+200.00 WHERE customer_id=10233276;
5 COMMIT;单纯的事务概念并不是故事的全部. 试想一下, 如果执行到第四条语句时服务器崩溃了, 会发生什么?天知道, 用户可能会损失 200 美元. 再假如, 在执行到第三条语句和第四条语句之间时, 另外一个进程要删除支票账户的所有余额, 那么结果可能就是银行在不知道这个逻辑的情况下白白给了 Jane 200 美元.
除非系统通过严格的 ACID 测试, 否则空谈事务的概念是不够的. ACID 表示原子性(atomicity)、一致性(consistency)、隔离性(isolation)和持久性(durability). 一个运行良好的事务处理系统, 必须具备这些标准特征.
原子性(atomicity) 一个事务必须被视为一个不可分割的最小工作单元, 整个事务中的所有操作要么全部提交成功, 要么全部失败回滚, 对于一个事务来说, 不可能只执行其中的一部分操作, 这就是事务的原子性.
一致性(consistency) 数据库总是从一个一致性的状态转换到另外一个一致性的状态. 在前面的例子中, 一致性确保了, 即使在执行第三、四条语句之间时系统崩溃, 支票账户中也不会损失200美元, 因为事务最终没有提交, 所以事务中所做的修改也不会保存到数据库中.
思考: 一致性可能是从客户端的角度来说的, 意思是所有的客户看到的状态都是相同的
隔离性(isolation)
通常来说, 一个事务所做的修改在最终提交以前, 对其他事务是不可见的. 在前面的例子中, 当执行完第三条语句、第四条语句还未开始时, 此时有另外一个账户汇总程序开始运行, 则其看到的支票账户的余额并没有被减去 200 美元. 后面我们讨论隔离级别(Isolationlevel)的时候, 会发现为什么我们要说 "通常来说" 是不可见的.
持久性(durability) 一旦事务提交, 则其所做的修改就会永久保存到数据库中. 此时即使系统崩溃, 修改的数据也不会丢失. 持久性是个有点模糊的概念, 因为实际上持久性也分很多不同的级别. 有些持久性策略能够提供非常强的安全保障, 而有些则未必. 而且不可能有能做到 100% 的持久性保证的策略(如果数据库本身就能做到真正的持久性, 那么备份又怎么能增加持久性呢?). 在后面的一些章节中, 我们会继续讨论 MySQL 中持久性的真正含义.
事务的 ACID 特性可以确保银行不会弄丢你的钱. 而在应用逻辑中, 要实现这一点非常难, 甚至可以说是不可能完成的任务. 一个兼容 ACID 的数据库系统, 需要做很多复杂但可能用户并没有觉察到的工作, 才能确保 ACID 的实现.
就像锁粒度的升级会增加系统开销一样, 这种事务处理过程中额外的安全性, 也会需要数据库系统做更多的额外工作. 一个实现了 ACID 的数据库, 相比没有实现 ACID 的数据库, 通常会需要更强的 CPU 处理能力、更大的内存和更多的磁盘空间. 正如本章不断重复的, 这也正是 MySQL 的存储引擎架构可以发挥优势的地方. 用户可以根据业务是否需要事务处理, 来选择合适的存储引擎. 对于一些不需要事务的查询类应用, 选择一个非事务型的存储引擎, 可以获得更高的性能. 即使存储引擎不支持事务, 也可以通过 LOCK TABLES 语句为应用提供一定程度的保护, 这些选择用户都可以自主决定.
隔离性其实比想象的要复杂. 在 SQL 标准中定义了四种隔离级别, 每一种级别都规定了一个事务中所做的修改, 哪些在事务内和事务间是可见的, 哪些是不可见的. 较低级别的隔离通常可以执行更高的并发, 系统的开销也更低.
每种存储引擎实现的隔离级别不尽相同. 如果熟悉其他的数据库产品, 可能会发现某些特性和你期望的会有些不一样(但本节不打算讨论更详细的内容). 读者可以根据所选择的存储引擎, 查阅相关的手册. 下面简单地介绍一下四种隔离级别.
READ UNCOMMITTED(未提交读)
在 READ UNCOMMITTED 级别, 事务中的修改, 即使没有提交, 对其他事务也都是可见的. 事务可以读取未提交的数据, 这也被称为脏读(DirtyRead). 这个级别会导致很多问题, 从性能上来说, READ UNCOMMITTED 不会比其他的级别好太多, 但却缺乏其他级别的很多好处, 除非真的有非常必要的理由, 在实际应用中一般很少使用.
READ COMMITTED(提交读)
大多数数据库系统的默认隔离级别都是 READ COMMITTED(但 MySQL 不是). READ COMMITTED 满足前面提到的隔离性的简单定义:一个事务开始时, 只能 "看见" 已经提交的事务所做的修改. 换句话说, 一个事务从开始直到提交之前, 所做的任何修改对其他事务都是不可见的. 这个级别有时候也叫做不可重复读(non repeatable read), 因为在一个事务中两次执行同样的查询, 可能会得到不一样的结果.
REPEATABLEREAD(可重复读)
REPEATABLEREAD解决了脏读的问题. 该级别保证了在同一个事务中多次读取同样记录的结果是一致的. 但是理论上, 可重复读隔离级别还是无法解决另外一个幻读(PhantomRead)的问题. 所谓幻读, 指的是当某个事务在读取某个范围内的记录时, 另外一个事务又在该范围内插入了新的记录, 当之前的事务再次读取该范围的记录时, 会产生幻行(PhantomRow). InnoDB 和 XtraDB 存储引擎通过多版本并发控制(MVCC, MultiversionConcurrencyControl)解决了幻读的问题. 本章稍后会做进一步的讨论. 可重复读是 MySQL 的默认事务隔离级别.
SERIALIZABLE(可串行化)
SERIALIZABLE 是最高的隔离级别. 它通过强制事务串行执行, 避免了前面说的幻读的问题. 简单来说, SERIALIZABLE会在读取的每一行数据上都加锁, 所以可能导致大量的超时和锁争用的问题. 实际应用中也很少用到这个隔离级别, 只有在非常需要确保数据的一致性而且可以接受没有并发的情况下, 才考虑采用该级别.
表 1-1: ANSI SQL 隔离级别
死锁是指两个或者多个事务在同一资源上相互占用, 并请求锁定对方占用的资源, 从而导致恶性循环的现象. 当多个事务试图以不同的顺序锁定资源时, 就可能会产生死锁. 多个事务同时锁定同一个资源时, 也会产生死锁.
为了解决这种问题, 数据库系统实现了各种死锁检测和死锁超时机制. 越复杂的系统, 比如 InnoDB 存储引擎, 越能检测到死锁的循环依赖, 并立即返回一个错误. 这种解决方式很有效, 否则死锁会导致出现非常慢的查询. 还有一种解决方式, 就是当查询的时间达到锁等待超时的设定后放弃锁请求, 这种方式通常来说不太好. InnoDB 目前处理死锁的方法是, 将持有最少行级排他锁的事务进行回滚(这是相对比较简单的死锁回滚算法).
锁的行为和顺序是和存储引擎相关的. 以同样的顺序执行语句, 有些存储引擎会产生死锁, 有些则不会. 死锁的产生有双重原因: 有些是因为真正的数据冲突, 这种情况通常很难避免, 但有些则完全是由于存储引擎的实现方式导致的. 死锁发生以后, 只有部分或者完全回滚其中一个事务, 才能打破死锁. 对于事务型的系统, 这是无法避免的, 所以应用程序在设计时必须考虑如何处理死锁. 大多数情况下只需要重新执行因死锁回滚的事务即可.
事务日志可以帮助提高事务的效率. 使用事务日志, 存储引擎在修改表的数据时只需要修改其内存拷贝, 再把该修改行为记录到持久在硬盘上的事务日志中, 而不用每次都将修改的数据本身持久到磁盘. 事务日志采用的是追加的方式, 因此写日志的操作是磁盘上一小块区域内的顺序 I/O, 而不像随机 I/O需要在磁盘的多个地方移动磁头, 所以采用事务日志的方式相对来说要快得多. 事务日志持久以后, 内存中被修改的数据在后台可以慢慢地刷回到磁盘. 目前大多数存储引擎都是这样实现的, 我们通常称之为预写式日志(Write-AheadLogging), 修改数据需要写两次磁盘.
如果数据的修改已经记录到事务日志并持久化, 但数据本身还没有写回磁盘, 此时系统崩溃, 存储引擎在重启时能够自动恢复这部分修改的数据. 具体的恢复方式则视存储引擎而定.
思考: 内存拷贝是必须的, 用来验证事务是否可行
MySQL 提供了两种事务型的存储引擎: InnoDB 和 NDBCluster. 另外还有一些第三方存储引擎也支持事务, 比较知名的包括 XtraDB 和 PBXT. 后面将详细讨论它们各自的一些特点.
自动提交(AUTOCOMMIT)
MySQL 默认采用自动提交(AUTOCOMMIT)模式. 也就是说, 如果不是显式地开始一个事务, 则每个查询都被当作一个事务执行提交操作. 在当前连接中, 可以通过设置 AUTOCOMMIT 变量来启用或者禁用自动提交模式:

