1. 引言

首先，我们通过下面的SQL语句建立一张表，并插入5行数据：

CREATE TABLE T(
    id int(11) not null,
    c int(11) default null,
    d int(11) default null,
    primary key (id),
    key c(c)
)ENGINE=InnoDB;

insert into t values(0,0,0),(5,5,5),(10,10,10),(15,15.15),(20,20,20),(25,25,25);

接着，我们执行下面这条语句：

begin
select * from t where d=5 for update;
commit;

for update 会为d=5的行加上一个锁，这个锁会在commit语句执行时被释放。

由于字段d上没有索引，所以会进行全表扫描。但是，在进行全表扫描的时候，不满足d=5的行会不会被加锁呢？

因为InnoDB的默认事务隔离级别是可重复读，所以下面的讨论都基于可重复读隔离级别。

2. 幻读是什么？

我们先来假设，仅仅只在d=5的行行加锁，而其他行不加锁的话，会怎么样？

假设有这样下面这样一个场景：

Session A的三次查询我们分别定义为Q1,Q2,Q3。因为都使用了for update，所以是当前读，且会对d=5的行进行加锁。我们来分析下三次查询的结果：

Q1只会返回id=5的行。
由于在T2时刻，session B将id=0的d值修改成了5，因此Q2查询出来id=0和id=5这两行。
由于在T4时刻，session C插入一行(1,1,5)，因此Q3查询出来id=0,id=1和id=5三行。

其中，Q3查询到id=1这种现象，我们称之为“幻读”。幻读是指一个事务在前后两次查询同一个范围的时候，后一次查询看到了前一次查询没有看到的行。

有几个需要注意的点：

在可重复读隔离级别下，普通的查询时快照读，是不会看到其他事务插入的数据的。因此，幻读只会在“当前读”才会出现。
在Q2中，session B修改了结果被session A的当前读看到，我们不称为时幻读。幻读专指“新插入的行”。

但是，上面的场景其实是存在问题的。

第一个问题是语义。 session A在T1时刻就执行了for update，也就是语义上会将所有d=5的行锁住，不准别的事务进行读写操作。但是实际上语义就被破坏了。

又如下面这个场景：

理论上session A会在T1时刻将所有d=5的行锁住。但是session B和sessionC在后来分别修改和插入了d=5的行，但是这两行并没有被锁住，所以就违背了语义。

第二个问题是数据一致性。 数据一致性包括数据库内部数据状态的一致性、数据和日志在逻辑上的一致性。

我们来看下面这个场景：

这个场景在T1时刻的session A中加入了update语句，会把锁了的d=5的行的值修改成100。数据库的执行如下：

经过T1时刻，id=5这一行变成（5,5,100），当然这个结果会在T6时刻才提交
经过T2时刻，id=0这一行变成(0,5,5)
经过T4时刻，表里面多了一行(1,5,5)

我们再来看binlog里面的内容：

T2时刻，session B事务提交，写入了两条语句
T4时刻，session C事务提交，写入了两条语句
T6时刻，session A事务提交，写入了update t set d=100 where d=5这条语句

所以在binlog中，由于T6时刻session A执行了update t set d=100 where d=5这条语句，所以三行变成了(0,5,100),(1,5,100),(5,5,100)。我们就会发现binlog和数据库的不一致性。

因此仅仅只在d=5的行行加锁，而其他行不加锁的假设是不合理的。

如果是会在所有扫描过的行都加锁的话，我们再看下执行效果：

由于session A的Q1会将所有的行锁住，所以session B会被阻塞，直到session A提交事务才会继续执行，这样id=0的结果就会是(0,5,5)，保证了数据库和binlog的一致性。

但是对所有的行加锁， 并不能阻止session C中的幻读。因为在Q1语句进行加锁的时候，id=1这一行还不存在，所以没法进行加锁。

3. 如何解决幻读？

产生幻读的原因是因为行锁只能锁住行，但是新插入记录这个动作，是在行的间隙中的。因此，为了解决幻读，InnoDB引入了间隙锁（Gap Lock）。

在表t中，初始有6个记录，也就有7个间隙，如下图：

当执行for update的时候，不止对6个记录加入了行锁，还同时加了7个间隙锁，这就保证了无法插入新的记录。

我们之前学习过行锁，行锁是分为读锁和写锁的，这两种锁可能会存在冲突关系：

但是，间隙锁之间是不存在冲突关系的。例如下面这个场景：

session A和session B都执行了for update语句，都会加上间隙锁，但是它们具有共同的目标：保护这个间隙，不允许插入新值，因此它们之间是不会冲突的。

间隙锁和行锁合称next-key lock，每个next-key lock是前开后闭区间。next-key lock就是锁住满足条件的行和这些行前面的间隙。

间隙锁的引入解决了幻读问题，但是也存在一些问题。如下面这个问题：

我们来分析上面场景的执行流程：
我们假设id=9这一行起初是不存在的

session A执行for update语句，由于id=9不存在，因此加上间隙锁(5,10)
session B执行for update语句，同样加上间隙锁(5,10)
session B试图插入一行(9,9,9)，被session A的间隙锁挡住，进入等待
session A试图插入一行(9,9,9)，被session B的间隙锁挡住，进入等待

这样就出现了死锁的问题。只能让session A进行回滚了。

4. 总结

对于for update语句，它是一种悲观锁：

如果查询的是主键\索引列，则是行锁。
如果查询的是没有主键\索引的话，则是表锁。

对于for update加的是行锁还是表锁，可以看面试官问：select…for update会锁表还是锁行？

幻读是什么，幻读有什么问题

1. 引言

2. 幻读是什么？

3. 如何解决幻读？

4. 总结

菜鸟笔记

热门教程

推荐教程