暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

DB吐槽大会,第44期 - PG 同步复制不支持自动升降级

原创 digoal 2022-01-20
242

作者

digoal

日期

2021-09-15

标签

PostgreSQL , 同步流复制 , 异步 , 同步 , 降级 , 升级


视频回放

1、产品的问题点
- PG 同步复制不支持自动升降级

2、问题点背后涉及的技术原理
- PG 支持多种事务提交级别 (synchronous_commit):
- 本地wal bufferio完成(异步, 未持久化)
- 本地wal持久化
- wal多副本: 远程wal bufferio完成
- wal多副本: 远程wal持久化
- wal多副本: 远程wal恢复完成

https://www.postgresql.org/docs/14/runtime-config-replication.html#RUNTIME-CONFIG-REPLICATION-PRIMARY

synchronous_commit = local, remote_write, remote_apply, on, off  
synchronous_standby_names =   
[FIRST] num_sync ( standby_name [, ...] )  
ANY num_sync ( standby_name [, ...] )  
standby_name [, ...]  
复制

3、这个问题将影响哪些行业以及业务场景
- 使用PG 流复制作为高可用搭建基础, 并且开启了同步复制模式的场景.

4、会导致什么问题?
- 如果用户的事务选择了wal多副本模式, 并且远程节点一直未响应(或者响应的节点数未凑够副本数), commit将在队列中死等, 客户端收不到事务结束信号, 导致事务提交hang的现象.

5、业务上应该如何避免这个坑
- 主动cancel等待, 会收到一个warning, 表示事务在远程可能没有同步
- 管理员修改PG的事务提交模式设置, 同时发信号给等待中的事务, 降级为异步提交
- 《PostgreSQL 如何让心跳永远不死,支持半同步自动同步、异步升降级 - udf 心跳》
- 《PostgreSQL 双节点流复制如何同时保证可用性、可靠性(rpo,rto) - (半同步,自动降级方法实践)》

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题
- 管理更加复杂
- 改成异步模式后, 还需要改回来?
- 人为的介入时间周期长, 响应不及时, 高峰期的抖动及其可能引起业务雪崩.

7、数据库未来产品迭代如何修复这个坑
- 内核层支持同步模式自动升级、降级 (半同步, 自动升级, 自动降级)
- 目前RDS PG支持, 期待polardb pg支持并开源

PostgreSQL 许愿链接

您的愿望将传达给PG kernel hacker、数据库厂商等, 帮助提高数据库产品质量和功能, 说不定下一个PG版本就有您提出的功能点. 针对非常好的提议,奖励限量版PG文化衫、纪念品、贴纸、PG热门书籍等,奖品丰富,快来许愿。开不开森.

9.9元购买3个月阿里云RDS PostgreSQL实例

PostgreSQL 解决方案集合

德哥 / digoal's github - 公益是一辈子的事.

digoal's wechat

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论