暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

沙尘暴也阻挡不了学习的脚步-- 面试官:你竟然不知道MySQL的组提交?

Echo1024 2021-05-11
337



《为研发同学定制的MySQL面试指南》 
贯穿单机、集群、中间件!
面试官都关注了!你还犹豫?

Hi,大家好!我是白日梦!本文是MySQL专题的第 29 篇

下文还是白日梦以自导自演的方式,从“ MySQL的两阶段提交、组提交 ”开始,发散开一系列的问题,看看你能抗到第几问吧 迎关注!持续更新中~

开始之前让大家看看北京的沙尘暴,长这么大头一次,还以为是地球末日呢...

1
好!我们开始吧! 













                              











库尼奇瓦,同学,听说你上一面表现的还可以,这一面要不咱继续?


嗯,好啊!




好,你了解MySQL的两阶段提交不?说说看


嗯,了解。 简单来说两阶段提交就是将事务提交分成两部分,经过这两步处理后,我们称这个事务被提交了。




嗯,那两个阶段呢?你说说看!


可以看下面这张图:我们当执行commit命令时,会按照如下进行。


第一阶段:写redo log,并标识上prepare。

-- 中间穿插写binlog --

第二阶段:写redo log,完成事务的最终提交。




嗯,那你知不知道为什么事务的提交要分成两个阶段?


嗯,你看上图中的两阶段是redolog-prepare、redolog-commit这两个阶段,然后在这两个阶段中又写了binlog。


这个redolog主要提供的能力是对事务进行rollback、并且redolog是存储引擎层面记录的日志。


而binlog的作用是方面我们进行数据的备份以及MySQL集群主从之间的数据同步使用,并且binlog是MySQL上层,也就是Server层面记录的日志。


综上:MySQL的两阶段提交是为了保证redolog、binlog两者在逻辑上的一致性。才能进一步保证。事务的回滚、数据备份、已经MySQL集群之间的数据才是安全可靠的




嗯,那你能不能举个例子,更直观的告诉我,redolog、binlog两者在逻辑一致的必要性以及用途?


嗯,好啊!,比如这个例子:


在这个例子中,进行完第三步之后,没来得及写binlog,然后主库就挂了,事务也没来得及提交。


这时主库从新启动之后会选择将这个事务丢弃,因为如果它将事务提交了,从库们相对主库来说就少了这条数据,造成了主从数据不一致问题




嗯,在看这个例子

在这个例子中主库宕机前虽然也没有完成对事务对提交,但是它已经写了redolog-prepare、还写了binlog,binlog写完之后很可能从库已经收到这个最新的binlog,并且将这个binlog中的数据回放到自己身上了。


所以主库重新启动之后呢,会选择按照redolog将宕机前的事务状态从内存中恢复出来,也就是说把内存中的缓存页改成脏数据页,然后提交事务


这时主库如果不提交事务,那主库就比从库少了一条数据,同时会造成主从不一致的情况出现。



白日梦补充:
本小节我们重点看MySQL的组提交,而不是两阶段提交,想更多的两阶段提交的故事,可以点击查看白日梦写的:全网最牛X的两阶段提交笔记


嗯,你说的没错。我有个问题哈,你看你画的这张图,事务提交时写了好几次日志。


而且一般我们线上的数据库都有这两个配置

    # 该参数控制binlog的落盘时机
    # 设置为1表示当事务被提交时将binlog落盘
    # 设置为0表示由文件系统自己控制binlog的落盘时机
    sync_binlog=1
    # 该参数控制redolog的落盘时机
    # 设置为1表示当事务被提交时将redolog落盘
    innodb_flush_log_at_trx_commit=1

    那你有没有想过:即使写日志是磁盘的顺序IO速度极快,即使固态硬盘的性能很🐂,那终究也还是在跟磁盘打交道啊! 


    那你是否了解MySQL针对这个现状有什么优化的落地实现方案吗?


    我提醒你一下,比如:组提交


    哦!我还真了解一些group commit的概念!


    在MySQL早期的设计中,所谓的组提交,也就是 group commit 实际上提交的是group commit redolog。(而不是binlog)



    而且MySQL写redolog并不是产生一条redolog就写一条redo log的!而是以redo log block为单位写入磁盘,而且在redo log block 之上还有个redo log buffer的概念


    总结来说就是:写redolog要分成2大步:


    Step1:将redolog写入内存buffer中。

    Step2:将redolog fsync到磁盘中。



    白日梦补充:
    点击查看白日梦的redolog笔记:传说中的redo log到底是什么?
    点击查看白日梦笔记:fsync系统调用到底是什么?


    而组提交的概念是说:当进行fsync时,一下子将多个事务日志写入到磁盘中。 通俗来讲,假如说你写一次磁盘需要10ms,如果我们按条每个redolog都写一次磁盘的话,10条redolog就需要100ms的耗时。


    现在我们有了组提交,可以一次fsync将10条redolog一次磁盘IO就持久化到磁盘中,耗时可能也就十几ms的样子。性能是有所提升的。




    嗯,你说的没错!而且我还注意到了你说的一个细节问题,你上面说,原来的group commit针对的是redolog,而不是binlog。这个缘由你能展开说一下吗?


    .....


    好的,这个问题就得从binlog的作用说起了。MySQL不可能无缘无故的就写binlog,它之所以记录binlog是因为它想获取到写binlog带给它的红利。



    那什么红利呢?其实前面说了很多遍了,主要的红利就是:binlog给了MySQL搭建集群的可能性,以及数据备份的能力。 


    而且默认情况下binlog是不会开启的。其实说白了,如果你不需要binlog带给我们的能力,比如你偏偏就不需要做数据的备份、或者搭建集群,那么其实你直接使用默认配置不开启binlog就好了。此时的两阶段提交也不复存在。


    但是事实并不是这样的,线上的数据库都是以集群的形式存在、并且也需要数据备份。也就是说binlog是开启的状态。事务的提交也是走的两阶段提交。


     那,回到我们组提交的话题来看,其实在早期的MySQL中,并没有一个很好的机制让 组提交和两阶段提交共存的!




    嗯,为什么这么说?


    嗯,其实你大概一想就知道为什么了。根本原因就在用 binlog是MySQL的上层(Server层)记录的。而redolog是下层的存储引擎层记录的。


    所以你突然整一个redolog的组提交出来,那两阶段提交怎么办?你为了性能哐当一下将内存中的redolog全落盘了,但是两阶段提交中每一步写日志的顺序是有要求的呀。它俩正好相违背。


    所以其实在InnoDB1.2版本之前,当开启binlog使用两阶段提交时,组提交会失效....




    嗯,你说的没错。那后来没有比较好的解决方式呢?


    嗯,其实是有的,早在2010年facebook的MySQL技术组,Percona公司就给出了解决方案。后来由MariaDB数据库的开发人员Kristian Nielsen完成了最终的完美解决方案。


    所以如果你使用的是MySQL5.6或者更好的版本,它就在两阶段提交的概念上,还加持上了组提交的buff,性能相对之前有了很多的提升。




    嗯,那你可否大概说一下如何实现的?


    嗯嗯,想了解它的具体的实现可以看这张图:

    我稍微解读一下这张图:总体来说分为三个部分,分别是Flush阶段、Sync阶段、Commit阶段


    并且它引入了一个新的概念:队列,事务按提交的顺序进入队列中,队列有先进先出的概念,最先进入队列的事务被成为leader


    在Flush阶段就是将当前队列中的所有事务的binlog统一写入内存中,Sync就是将当前队列中的所有事务的binlog通过一次fsync统一写入到磁盘中。(相当于批量将binlog落盘)


    最后的commit阶段,由队列中的leader根据一定的顺序调用存储引擎层的事务提交,完成两阶段的第二阶段提交。事务结束...



     这时就会形成一个比较理想的状态,当一组事务发生Commit时,新的事务可以去Flush。让整个过程中的组提交不断的生效。




    嗯,你继续说


    但是如果每次队列中都只有一个事务,那可能会导致性能还不如之前没有这种队列的设计




    嗯,你继续往下说。


    还有就是我还了解关于组提交相关的一个控制参数

      binlog_max_flush_queue_time

      这个参数可以控制Flush阶段的等待时间。默认情况下该参数设置为0,推荐设置也为0。


      如果我们不把它设置为0,意思就是说想让队列中的事务攒一攒,攒多了再统一处理,想获取到一次fsync将大量日志落盘带来的速度快的红利。但是这样同样会导致事务的响应时间变慢。




      嗯!你说的没问题,整体上看你的回答的还可以!


      我没有问题了,你还有什么想问我的吗?


      没有问题了,感谢大佬百忙抽空来给我面试!




      哈哈,客气!好好准备,期待你下一面优秀的表现


      2
      推荐阅读

      1、MySQL的修仙之路,图文谈谈如何学MySQL、如何进阶!
      2、数据库面经,常见的面试题
      3、谈谈MySQL中基数是什么?
      4、聊聊什么是慢查?如何监控?如何排查?
      5、对Not Null字段插入Null值有啥现象?
      6、能谈谈year、date、datetime、time、timestamp的区别吗?
      7、你有没有搞混查询缓存和Buffer Pool?谈谈看!
      8、你知道数据库缓冲池中的LRU-List吗?
      9、了解InnoDB的FreeList吗?谈谈看!
      10、了解Flush-List吗?顺便说一下脏页的落盘机制!
      11、用 11 张图讲清楚,当你CRUD时BufferPool中发生了什么!以及BufferPool的优化!
      12、了解 MySQL的表空间 和 数据表吗?谈谈看!
      13、了解 MySQL的数据行吗?行溢出机制呢?谈谈看!
      14、了解MySQL数据页吗?说说什么是页分裂吧!
      15、用一分钟了解fsync这个系统调用
      16、简述undo log、truncate、以及undo log如何帮你回滚事务?
      17、我劝!这位年轻人不讲MVCC,耗子尾汁!
      18、传说中的MySQL的redo log是什么?谈谈看!
      19、LSN、Checkpoint?谈谈MYSQL的崩溃恢复是怎么回事!
      20、MySQL的 bin log有啥用?在哪里?谁写的?怎么配置?
      21、bin log有哪些格式?有啥区别?优缺点?线上用哪种格式?
      22、删库后!除了跑路还能干嘛?
      23、全网最牛X的!MySQL两阶段提交串讲!没有之一!
      24、自导自演的数据库面试现场--谈谈MySQL的10种文件
      25、大型面试现场:一条update sql的执行都经历了什么?
      26、大型翻车现场:如何实现记录存在的话就更新,如果记录不存在的话就插入。
      27、如何实现记录存在的话就更新,如果记录不存在的话就插入--续
      28、面试现场:说说char和varchar的区别你了解多少?
      3
      欢迎关注


      长按二维码、关注白日梦

      赠送精美脑图

      (操作系统、网络、Java基础...)

      长按二维码

      关注白日梦吧!


      文章转载自Echo1024,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

      评论