背景 在工作中碰到一次死锁问题,业务背景是在mq接收商品主数据时会更新商品其他数据,由于商品主数据和商品其他信息是一对多的关系,所以采用先删后增的方式,结果异常监管平
背景在工作中碰到一次死锁问题,业务背景是在mq接收商品主数据时会更新商品其他数据,由于商品主数据和商品其他信息是一对多的关系,所以采用先删后增的方式,结果异常监管平台报出来死锁警告。 这是商品其他信息表,数据库隔离级别是RC,表有一个唯一联合索引,这个唯一索引就是引起死锁的关键。 死锁分析下面是线上的一个死锁日志
RC级别下对于唯一索引的插入只会锁定记录,是可以并发插入的,所以应该不是两个insert 语句并发产生的问题。 之后查看代码发现插入之前有一个delete操作,而且查看数据发现这两条数据是相邻的。 之后我在本地复现了一下整个过程。 查看加锁信息 这里当时有两个疑惑 对于第一个问题,网上很多博客视频都会说RC下间隙锁会失效,然后搬出官网的原话
但后面还有一句
意思是RC情况下间隙锁会用于外键和唯一键检查。 此刻又有个疑惑,为什么唯一冲突检查一定要在标有delete-marked的记录之后加间隙锁,我翻了很多博客资料,包括MySQL官方文档,都没有给出明确的解释。 至少现在我们从源码的层面知道了为什么在RC级别下为什么会有间隙锁存在。 现在还有第二个问题,为什么两个事务会同时等待12256633763记录上的X锁,在delete时,事务2已经获取了12256633763的记录锁,自身在获取X锁时应该不会发生冲突。 这里我也找到了加锁源码 按照源码理解,事务1需要锁住11-63记录的间隙以及63记录本身,相当于next-key,在对63加X锁时,由于事务2已经持有了63的记录锁,这两个锁的都属于排他锁但锁的模式不同,从加锁记录中也可以看出。所以事务1会创建一个锁对象,lock_mode X waiting放入请求队列中,等待事务2记录锁释放。 死锁解决到这里疑惑基本都解决了,而引起该死锁的原因就是先删后增的操作。之后我们优化了代码逻辑,因为我们每次都是下发的全量数据,所以mq下发的记录数据库中已存在的就更新,没有的就新增,而数据库中有的mq下发的没有的记录就删除。至此死锁问题得到了解决。 |
2021-06-02
2021-06-05
2022-06-27
2022-10-12
2019-09-11