
目 录
目 录
第 1 章 前言 1
1.1 适用读者 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 相关文档 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 术语 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.4 手册约定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
第 2 章 故障恢复概述 4
2.1 什么是故障恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 故障恢复的重要性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3 故障恢复的类别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
第 3 章 读写分离集群故障恢复 5
3.1 简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 服务器状态要素 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.3 自动故障恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.1 配置方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.2 可自动恢复的故障场景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.4 手动故障恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.4.1 故障排查 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.4.1.1 集群异常状态场景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.4.1.2 故障确认操作指令 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.4.2 故障恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4.2.1 集群恢复思路 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4.2.2 集群典型异常场景恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4.2.3 集群恢复操作指令 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4.2.3.1 FR-1: 出现多主时,判断谁是新主 . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4.2.3.2 FR-2: 一键启动集群 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.4.2.3.3 FR-3: 使用 repmgr node rejoin 恢复成集群备机 . . . . . . . . . . . . . . . . 17
3.4.2.3.4 FR-4: 重做备机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.4.2.3.5 FR-5: 查询集群状态 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
I
评论