暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

MongoDB 复制集状态同步机制

SOHU-DBA 2016-04-19
206


MongoDB 复制集状态同步机制




MongoDB 复制集(3.0 版本)之间通过心跳信息来同步成员的状态信息,每个节点会周期性的向复制集内其它的成员发送心跳信息来获取状态,如 rs.status() 看到的复制集状态信息。


一次心跳请求分 3 个阶段 (主动发起心跳请求的节点称为源,接受到心跳请求的成为目标)

  1. 源向目标发送心跳请求

  2. 目标处理心跳请求,并向源发送应答

  3. 源接受到心跳应答,更新目标节点状态


接下来将介绍这 3 个阶段里的主要状态同步逻辑




阶段 1

默认配置下,复制集的节点每隔 2s 会向其他成员发送一次心跳请求,即发送 replSetHeartbeat 命令请求,心跳请求的内容类似如下(通过 mongosniff 抓包获取),主要包含 replSetName、发送心跳的节点地址、复制集版本等。

command: replSetHeartbeat
database: admin
metadata: { $replData: 1 }
commandArgs: { replSetHeartbeat: "mongo-9552", pv: 1, v: 22,
from: "10.101.72.137:9552", fromId: 3, checkEmpty: false }

复制




阶段 2

复制集成员收到心跳请求后,就开始处理请求,并将处理的结果回复给请求的节点。

  • 如果自身不是复制集模式、或复制集名称不匹配,则返回错误应答

  • 如果源节点的复制集配置 (rs.conf() 的内容) 版本比自己低,则将自身的配置加入到心跳应答消息里

  • 将节点自身的 oplog 及其他状态信息等加入到心跳应答消息

  • 如果自身是未初始化状态,则立即向源节点发送心跳请求,以更新复制集配置
    commandReply: {ok: 1.0, time: 1460705698, electionTime: new Date(6273289095791771649), e: true, rs: true, state: 1, v: 22, hbmsg: "", set:"mongo-9552", opTime: new Date(6272251740930703361) } metadata: {$replData: { term: -1, lastOpCommitted: { ts: Timestamp 1460372410000|1, t: -1}, lastOpVisible: {ts: Timestamp 0|0, t: -1}, configVersion: 22, primaryIndex: 2, syncSourceIndex: -1 } }




阶段 3

阶段 3 是最主要的处理部分,节点收到心跳应答后,会根据应答消息来更新对端节点的状态,并根据最终的状态确定是否需要进行重新选举。

  • 收到心跳应答时,如果是错误应答(心跳消息超时未应答相当于收到了错误应答),则

    • 如果当前重试次数 <= kMaxHeartbeatRetries(默认为 2),并且上一次发送心跳在 kDefaultHeartbeatTimeoutPeriod(默认为 10)时间内,则立即发送下一次心跳

    • 当失败次数超过 kMaxHeartbeatRetries,或者上一次心跳时间到现在超过 kDefaultHeartbeatTimeoutPeriod,则认为节点 down

  • 如果对端的复制集版本比自己高,则更新自己的配置并持久化到 local 数据库中

  • 根据应答消息更新对端的状态信息

  • 如果自身是主节点,当发现有优先级更高的节点可被选为主,则主动降级

  • 如果其他是主节点,但自身有更高的优先级并可被选为主,则会主动要求主节点降级(目前这个逻辑实现有 bug,主要靠主节点主动降级来保证优先级最高的节点最终会变成主, https://jira.mongodb.org/browse/SERVER-23630)

  • 如果当前没有主节点,则主动发起新的选举,当得到大多数节点同意后,即可选出新的主节点




总的来说,MongoDB 通过心跳来同步节点间信息并触发选举,最终将复制集达到统一的状态,但过程的正确性没有理论依据,MongoDB-3.2 版本里,使用了新版本的复制集通信协议,改用 raft 来选举,能进一步降低故障发现恢复时间,目前还在学习中。



http://blog.yunnotes.net/index.php/mongo-heartbeat-detail/









sohu-dba


文章转载自SOHU-DBA,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论