菜鸟乡村应用多活的改造实践之路
Cloud Native
核心业务系统仅在公共云的单一可用区部署,存在可用区级的故障风险。 保障业务快速迭代的同时,如何高效且低代价的落地容灾方案。 容灾方案的选型问题。目标是灾难发生时尽可能的缩短故障对用户的影响时长,快速恢复业务。

可用区级应用双活。从 1 个可用区拓展到 2 个可用区,2 个可用区部署对等容量的应用。基于多活接入网关产品承接所有业务流量,并按照比例或精准路由规则将流量调度到不同可用区的后端应用,多个可用区部署的应用同时对外提供服务,实现应用多活。 微服务同可用区优先调用。基于多活产品 Agent 能力,支持开启 Dubbo/SpringCloud 同可用区优先调用功能,从而避免跨可用区调用带来的RT 增长。而当机房内健康的 Provider 数量低于配置的阈值时,则优先调用策略自动失效,避免同可用区 Provider 过少支撑不住上游的流量压力。 快速容灾恢复。当某一可用区发生故障时,基于多活产品的一键切流能力,首先通过多活接入网关将 HTTP 流量切换到另一可用区, 同时基于多活产品 Agent 能力将故障可用区内的 RPC(Dubbo/SpringCloud)、MQ(RocketMQ)、定时任务(SchedulerX/XXL-Job)客户端进行故障隔离,实现全局流量的快速容灾切换。
Agent 启动验证。各类中间件的切 0 强依赖 Agent,必须确保 one Agent 能在所有业务容器正常启动、探针可正常上报至 MSHA 管控服务,且 Agent 启动后未影响到其他关联服务。 容灾切流能力验证。搭建同城双活是为了能在故障场景下及时切流,那么接入层切 0 能力验证、服务层切 0 能力验证、消息层切 0 能力验证、调度任务层切 0 能力验证、服务层流量封闭策略生效验证等都是必不可少的内容。
菜鸟乡村应用多活的业务价值
Cloud Native
借助于阿里云的同城应用多活解决方案,帮助菜鸟乡村实现了在较短的时间内业务同城容灾的目标,实现业务 7*24 小时不间断服务,即使单机房故障也能够分钟级恢复,最大程度保障业务的连续性。
了解更多相关信息,请扫描下方二维码或搜索微信号(AlibabaCloud888)添加云原生小助手!获取更多相关资讯!
文章转载自阿里巴巴云原生,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
数据库国产化替代深化:DBA的机遇与挑战
代晓磊
1191次阅读
2025-04-27 16:53:22
2025年3月国产数据库中标情况一览:TDSQL大单622万、GaussDB大单581万……
通讯员
868次阅读
2025-04-10 15:35:48
2025年4月国产数据库中标情况一览:4个千万元级项目,GaussDB与OceanBase大放异彩!
通讯员
681次阅读
2025-04-30 15:24:06
数据库,没有关税却有壁垒
多明戈教你玩狼人杀
583次阅读
2025-04-11 09:38:42
天津市政府数据库框采结果公布,7家数据库产品入选!
通讯员
570次阅读
2025-04-10 12:32:35
国产数据库需要扩大场景覆盖面才能在竞争中更有优势
白鳝的洞穴
550次阅读
2025-04-14 09:40:20
【活动】分享你的压箱底干货文档,三篇解锁进阶奖励!
墨天轮编辑部
488次阅读
2025-04-17 17:02:24
一页概览:Oracle GoldenGate
甲骨文云技术
464次阅读
2025-04-30 12:17:56
GoldenDB数据库v7.2焕新发布,助力全行业数据库平滑替代
GoldenDB分布式数据库
457次阅读
2025-04-30 12:17:50
优炫数据库成功入围新疆维吾尔自治区行政事业单位数据库2025年框架协议采购!
优炫软件
352次阅读
2025-04-18 10:01:22