广告位联系
返回顶部
分享到

Mysql锁内部实现机制之C源码

Mysql 来源:互联网 作者:佚名 发布时间:2022-08-23 16:03:56 人浏览
摘要

概述 虽然现在关系型数据库越来越相似,但其背后的实现机制可能大相径庭。实际使用方面,因为SQL语法规范的存在使得我们熟悉多种关系型数据库并非难事,但是有多少种数据库可能

概述

虽然现在关系型数据库越来越相似,但其背后的实现机制可能大相径庭。实际使用方面,因为SQL语法规范的存在使得我们熟悉多种关系型数据库并非难事,但是有多少种数据库可能就有多少种锁的实现方法。

Microsoft Sql Server2005之前只提供页锁,直到2005版本才开始支持乐观并发、悲观并发,乐观模式下允许实现行级别锁,在Sql Server的设计中锁是一种稀缺资源,锁的数量越多,开销就越大,为了避免因为锁的数量快速攀升导致性能断崖式下跌,其支持一种称为锁升级的机制,一旦行锁升级为页锁,并发性能就又回到原点。

事实上,即使在同一个数据库,不同的执行引擎对锁这一功能的诠释依然是百家争鸣。对于MyISAM而言仅仅支持表锁,并发读取尚可,并发修改可就捉襟见肘了。Innodb则和Oracle非常相似,提供非锁定一致性读取、行锁支持,与Sql Server明显不同的是随着锁总数的上升,Innodb仅仅只需要付出一点点代价。

行锁结构

Innodb支持行锁,且对于锁的描述并不会存在特别大的开销。因此不需要锁升级这一机制作为大量锁导致性能下降之后的抢救措施。

摘自lock0priv.h文件,Innodb对于行锁的定义如下:

1

2

3

4

5

6

7

8

9

10

11

12

/** Record lock for a page */

struct lock_rec_t {

    /* space id */

    ulint  space;  

    /* page number */

    ulint  page_no;

    /**

     * number of bits in the lock bitmap;

     * NOTE: the lock bitmap is placed immediately after the lock struct

     */

    ulint  n_bits;         

};

不难看出虽然并发控制可以细化到行级别,但是锁以页的粒度组织管理。Innodb的设计中通过space id、page number两个必要条件就可以确定唯一一个数据页,n_bits表示描述该页行锁信息需要多少bit位。

同一数据页中每条记录都分配唯一的连续的递增序号:heap_no,若要知道某一行记录是否上锁,则只需要判断位图heap_no位置的数字是否为一即可。由于lock bitmap根据数据页的记录数量进行内存空间分配的,因此没有显式定义,且该页记录可能还会继续增加,因此预留了LOCK_PAGE_BITMAP_MARGIN大小的空间。

1

2

3

4

5

6

/**

 * Safety margin when creating a new record lock: this many extra records

 * can be inserted to the page without need to create a lock with

 * a bigger bitmap

 */

#define LOCK_PAGE_BITMAP_MARGIN  64

假设space id = 20,page number = 100的数据页目前有160条记录,heap_no为2、3、4的记录已经被锁,则对应的lock_rec_t结构与数据页应该被这样刻画:

注:

  • 内存中的lock bitmap应该是线性分布的,图中所示二维结构是为了方便描述
  • bitmap与lock_rec_t结构是一块连续内存,图中引用关系也是绘图需要

可以看到该页对应的bitmap第二三四位置全部置一,描述一个数据页行锁所消耗内存从感官上相当有限,那具体占用多少呢?我们可以计算一下:

160 / 8 + 8 + 1 = 29byte。

  • 160条记录对应160bit
  • +8是因为需要预留出64bit
  • +1是因为源码中还预留了1字节

这里还额外+1,应该是为了避免因为整除导致的结果数值偏小的问题。假如是161条记录如果不+1则计算出来的20byte不够描述所有记录的锁信息(不动用预留位)。

摘自lock0priv.h文件:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

/* lock_rec_create函数代码片段 */

n_bits = page_dir_get_n_heap(page) + LOCK_PAGE_BITMAP_MARGIN;

n_bytes = 1 + n_bits / 8;

/* 注意这里是分配的连续内存 */

lock = static_cast<lock_t*>(

    mem_heap_alloc(trx->lock.lock_heap, sizeof(lock_t) + n_bytes)

);

/**

 * Gets the number of records in the heap.

 * @return number of user records

 */

UNIV_INLINE ulint page_dir_get_n_heap(const page_t* page)  

{

    return(page_header_get_field(page, PAGE_N_HEAP) & 0x7fff);

}

表锁结构

Innodb还支持表锁,表锁可分为两大类:意向锁,自增锁其数据结构定义如下:

摘自lock0priv.h文件

1

2

3

4

5

6

struct lock_table_t {

    /* database table in dictionary cache */

    dict_table_t*  table;

    /* list of locks on the same table */

    UT_LIST_NODE_T(lock_t)  locks;

};

摘自ut0lst.h文件

1

2

3

4

5

6

7

struct ut_list_node {

    /* pointer to the previous node, NULL if start of list */

    TYPE*  prev;

    /* pointer to next node, NULL if end of list */

    TYPE*  next;

};

#define UT_LIST_NODE_T(TYPE)  ut_list_node<TYPE>

事务中锁的描述

上述lock_rec_t、lock_table_t结构只是单独的定义,锁产生于事务之中,因此每个事务对应的行锁、表锁会有一个相应的锁的结构,其定义如下:

摘自lock0priv.h文件

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

/** Lock struct; protected by lock_sys->mutex */

struct lock_t {

    /* transaction owning the lock */

    trx_t*  trx;

    /* list of the locks of the transaction */

    UT_LIST_NODE_T(lock_t)  trx_locks; 

    /**

     * lock type, mode, LOCK_GAP or LOCK_REC_NOT_GAP,

     * LOCK_INSERT_INTENTION, wait flag, ORed

     */

    ulint  type_mode;

    /* hash chain node for a record lock */

    hash_node_t  hash; 

    /*!< index for a record lock */

    dict_index_t*  index;

    /* lock details */

    union {

        /* table lock */

        lock_table_t  tab_lock;

        /* record lock */

        lock_rec_t  rec_lock;

    } un_member;

};

lock_t是根据每个事务每个页(或表)来定义的,但是一个事务往往涉及到多个页,因此需要链表trx_locks串联起一个事务相关的所有锁信息。除了需要根据事务查询到所有锁信息,实际场景还要求系统必须能够快速高效的检测出某个行记录是否已经上锁。因此必须有一个全局变量支持对行记录进行锁信息的查询。Innodb选择了哈希表,其定义如下:

摘自lock0lock.h文件

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

/** The lock system struct */

struct lock_sys_t {

    /* Mutex protecting the locks */

    ib_mutex_t  mutex;     

    /* 就是这里: hash table of the record locks */

    hash_table_t*  rec_hash;   

    /* Mutex protecting the next two fields */

    ib_mutex_t  wait_mutex;

    /**

     * Array  of user threads suspended while waiting forlocks within InnoDB,

     * protected by the lock_sys->wait_mutex

     */

    srv_slot_t*  waiting_threads;

    /*

     * highest slot ever used in the waiting_threads array,

     * protected by lock_sys->wait_mutex

     */

    srv_slot_t*  last_slot;

    /**

     * TRUE if rollback of all recovered transactions is complete.

     * Protected by lock_sys->mutex

     */

    ibool  rollback_complete;

    /* Max wait time */

    ulint  n_lock_max_wait_time;

    /**

     * Set to the event that is created in the lock wait monitor thread.

     * A value of 0 means the thread is not active

     */

    os_event_t  timeout_event;     

    /* True if the timeout thread is running */

    bool  timeout_thread_active;

};

函数lock_sys_create在database start之际负责初始化lock_sys_t结构。rec_hash的hash slot数量由srv_lock_table_size变量决定。rec_hash哈希表的key值通过页的space id,page number计算得出。

摘自lock0lock.ic、ut0rnd.ic 文件

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

/**

 * Calculates the fold value of a page file address: used in inserting or

 * searching for a lock in the hash table.

 *

 * @return folded value

 */

UNIV_INLINE ulint lock_rec_fold(ulint space, ulint page_no)

{

    return(ut_fold_ulint_pair(space, page_no));

}

/**

 * Folds a pair of ulints.

 *

 * @return folded value

 */

UNIV_INLINE ulint ut_fold_ulint_pair(ulint n1, ulint n2)

{

    return (

        (

            (((n1 ^ n2 ^ UT_HASH_RANDOM_MASK2) << 8) + n1)

            ^ UT_HASH_RANDOM_MASK

        )

        + n2

    );

}

这将意味着无法提供一个手段使得我们可以直接得知某一行是否上锁。而是应该先通过其所在的页得到space id、page number通过lock_rec_fold函数得出key值而后经过hash查询得到lock_rec_t,而后根据heap_no扫描bit map,最终确定锁信息。lock_rec_get_first函数实现了上述逻辑:

这里返回的其实是lock_t对象,摘自lock0lock.cc文件

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

/**

 * Gets the first explicit lock request on a record.

 *

 * @param block   : block containing the record

 * @param heap_no : heap number of the record

 *

 * @return first lock, NULL if none exists

 */

UNIV_INLINE lock_t* lock_rec_get_first(const buf_block_t* block, ulint heap_no)

{

    lock_t*  lock;

    ut_ad(lock_mutex_own());

    for (lock = lock_rec_get_first_on_page(block); lock;

         lock = lock_rec_get_next_on_page(lock)

    ) {

        if (lock_rec_get_nth_bit(lock, heap_no)) {

            break;

        }

    }

    return(lock);

}

锁维护以页的粒度,不是一个最高效直接的方式,明显的时间换空间,这种设计使得锁的开销很小。某一事务对任一行上锁的开销都是一样的,锁数量的上升也不会带来额外的内存消耗。

每个事务都对应一个trx_t的内存对象,其中保存着该事务锁信息链表和正在等待的锁信息。因此存在如下两种途径对锁进行查询:

  • 根据事务: 通过trx_t对象的trx_locks链表,再通过lock_t对象中的trx_locks遍历可得某事务持有、等待的所有锁信息。
  • 根据记录: 根据记录所在的页,通过space id、page number在lock_sys_t结构中定位到lock_t对象,扫描bitmap找到heap_no对应的bit位。

上述各种数据结构,对其整理关系如下图所示:

注:

lock_sys_t中的slot颜色与lock_t颜色相同则表明lock_sys_t slot持有lock_t 指针信息,实在是没法连线,不然图很混乱


版权声明 : 本文内容来源于互联网或用户自行发布贡献,该文观点仅代表原作者本人。本站仅提供信息存储空间服务和不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权, 违法违规的内容, 请发送邮件至2530232025#qq.cn(#换@)举报,一经查实,本站将立刻删除。
原文链接 : https://blog.csdn.net/m0_73311735/article/details/126464001?spm=1001.2014.3001.5502
相关文章
  • 深入了解MySQL中的慢查询
    一、什么是慢查询 什么是MySQL慢查询呢?其实就是查询的SQL语句耗费较长的时间。 具体耗费多久算慢查询呢?这其实因人而异,有些公司慢
  • MySQL中with rollup的用法及说明

    MySQL中with rollup的用法及说明
    MySQL with rollup的用法 当需要对数据库数据进行分类统计的时候,往往会用上groupby进行分组。 而在groupby后面还可以加入withcube和withrollup等关
  • mysql分组统计并求出百分比的方法

    mysql分组统计并求出百分比的方法
    mysql分组统计并求出百分比 1、mysql 分组统计并列出百分比 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 SELECT point_id, pname_cn, play_
  • 30种SQL语句优化的方法总结
    1)对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2)应尽量避免在 where 子句中使用!=或操作符
  • 达梦数据库获取SQL实际执行计划的方法

    达梦数据库获取SQL实际执行计划的方法
    环境说明: 操作系统:银河麒麟V10 数据库:DM8 相关关键字:DM数据库、SQL实际执行计划 一、set autotrace trace disql下执行set autotrace trace开启
  • MySQL数据库约束的介绍

    MySQL数据库约束的介绍
    基本介绍 约束用于确保数据库的数据满足特定的商业规则 在mysql中,约束包括:not null,unique,primary key,foreign key 和check5种 1.primary key(主键
  • MySQL索引的介绍

    MySQL索引的介绍
    1. MySQL 索引的最左前缀原则 左前缀原则是联合索引在使用时要遵循的原则,查询索引可以使用联合索引的一部分,但是必须从最左侧开始。
  • windows下Mysql多实例部署的操作方法
    当存在多个项目的时候,需要同时部署时,且只有一台服务器时,哪么就需要部署Mysql多个实例,原理很简单,多个mysql服务运行使用不同的
  • MySQL客户端/服务器运行架构介绍

    MySQL客户端/服务器运行架构介绍
    之前对MySQL的认知只限于会写些SQL,本篇开始进行对MySQL进行深入的学习,记录和整理下自己对MySQL不熟悉的地方。如果有需要可以关注我的
  • mysql8.0主从复制搭建与配置方案

    mysql8.0主从复制搭建与配置方案
    mysql主从搭建 环境:ubuntu20.04.1,mysql:8.0.22。 主:192.168.87.3 备:192.168.87.6 安装数据库 1 2 3 sudo apt-get install mysql-server sudo apt-get install mysql
  • 本站所有内容来源于互联网或用户自行发布,本站仅提供信息存储空间服务,不拥有版权,不承担法律责任。如有侵犯您的权益,请您联系站长处理!
  • Copyright © 2017-2022 F11.CN All Rights Reserved. F11站长开发者网 版权所有 | 苏ICP备2022031554号-1 | 51LA统计