上一篇介绍了zCloud的自动化部署能力(我是传送门~),本篇及下一篇将从高可用的角度,全面展示zCloud如何对数据库资源高效地维护和管理。
数据库的高可用,指多个数据库构成的整体系统,能够保证在任何时间至少有一个节点接受请求提供服务。高可用的重要性我们不做赘述,本篇则重点讲解企业在部署和维护数据库的高可用时遇到的困难,以及zCloud的高可用模块给出的解决方案。
Part1 : Oracle的高可用管理
Oracle的高可用方案常见的有Oracle RAC、Oracle DataGuard和MAA(结合RAC和DataGuard)。其中DataGuard提供了跨机房的容灾、数据保护、故障恢复等,实现数据库快速切换与灾难性恢复。例如某机房部署一台生产库,其他机房部署备库。备库可以分为物理备库和逻辑备库,物理备库主要用于生产库失败后做切换。而逻辑备库可以在主库正常访问的情况下,分担主库的读取负载,起到读写分离的作用。
DataGuard的切换模式有两种:Switchover和Failover:
(1)Switchover是计划内的角色转换,即主备角色互换,通常用于如操作系统和硬件等计划内的维护,能够确保数据不丢失;
(2)Failover是计划外的角色转换,即紧急情况下的使用(主库无法访问),根据数据的保护模式不同,可能存在少量数据丢失,其中最大保护模式和最高可用性模式能够确保数据不丢失。
DBA在复杂的环境和架构中,维护很多个Oracle的高可用时,需要花费大量的时间和精力,一旦操作不及时甚至操作失误,将造成DG切换出现问题,更严重可能会造成业务中断,得不偿失。
zCloud云管平台提供了DataGuard的管理能力,帮助用户便捷地管理数据库的高可用。zCloud能够通过一键部署高可用数据库架构,实时探测和自动故障诊断,快速发现业务节点异常状态,在保障数据完整性、一致性的前提下,快速进行高可用切换,保障业务的连续性。支持自定义高可用策略,满足不同场景、不同业务的高可用及容灾管理需求。
对于Oracle的单实例或RAC集群,zCloud都可快速自动对其搭建DataGuard高可用环境,已有的DataGuard也能够纳管到zCloud平台统一操作维护。zCloud的监控模块(后边章节将会讲到)中,具有对Oracle的DataGuard应用延迟时间监控一旦超出延迟阈值即触发告警,DBA能够通过平台,在线一键Switchover和一键Failover操作,大大提高了DataGuard维护的便捷性。zCloud还可以管理还原点,满足生产环境高可用管理和容灾切换演练等场景。
接下来介绍zCloud是怎样管理DataGuard的。
1、主备环境的拓扑图
一套数据库可以搭建多个不同地点的备库。下图中,名称为RAC19C是一套RAC集群,主库在成都环境,其中一个备库在机房环境,另一个备库在成都环境。
2、查看备库信息
zCloud能够搭建备库或者纳管环境中已有的备库,备库列表直观展示备库的日志应用状态、同步延迟、数据库状态和保护模式,也可对其进行相应的管理操作。
3、同步延迟查看功能
同步延迟能够展示详细的同步状态信息:
DG同步状态分为八类:VALID、INACTIVE、DEFERRED、ERROR、DISABLED、BAD PARAM、ALTERNATE、FULL
日志进度通过进度条展示,主库写日志进度展示主库所有节点的日志写入情况,进度代表写入到当前日志文件的具体位置;备库应用日志进度展示备库启动日志应用节点的日志应用进度,备库启动日志应用时,进度代表备库应用日志sequence以及应用该日志的百分比,备库停止应用日志时,显示的进度为已经应用到的sequence以及接收到的最大sequence的比值。
4、灾备中心
灾备中心则可以对灾备系统集中管理,统一操作。
5、操作Failover
一键Failover操作,会切换备库“RAC19CDG”的数据库角色为主库,原主库“RAC19C”不再同步数据到原备库“RAC19CDG”,并会重启新主库(即原备库)“RAC19CDG”。
任务详情可以查看运行日志和进展,整个流程遵循了最佳实践的步骤和配置。
成功执行了Failover后,查看“RAC19CDG”的状态,变成了READ WRITE读写,切换的SCN为13197573,此时“RAC19CDG”成为了新的主库,承担读写的任务。
zCloud支持一键还原备库操作,选择还原点,二次确认信息即可。此操作完成后,新主库“RAC19CDG”将转换到指定的还原点,并重新成为“RAC19C”的备库。
同样,我们可以通过任务详情查看还原备库的步骤和进度日志。
DG备库恢复到还原点之后,可以查看DG的同步状态,“RAC19C”重新成为主库,“RAC19CDG”重新成为备库。
6、操作Switchover
Switchover作为计划之内的主备切换,同样可以在zCloud平台上一键操作。切换之后,主库“RAC19C”和备库“RAC19CDG”的角色互换,“RAC19CDG”成为新的主库,“RAC19C”成为新的备库。
任务中心可以查看Switchover的进度和执行的步骤。
Switchover执行成功后,可以看到“RAC19CDG”已经成为新的主库,“RAC19C”成为新的备库。同样的,对新的备库“RAC19C”也可以再执行一次Switchover,重新成为主库。整个过程中不会存在任何数据丢失。
以上便是zCloud的dbPaaS能力之Oracle高可用管理,由于篇幅原因,下一篇将介绍zCloud的MySQL高可用管理(我是传送门~)。
zCloud目前已有众多的客户和应用实践,后续的文章依然会结合行业的真实应用给大家更形象地展示zCloud的功能设计,如果对dbPaaS平台感兴趣,可以持续关注,联系marketing@enmotech.com申请在线试用(请在邮件中备注您的姓名、电话、公司、职位和获取信息的来源,我们市场部小姐姐会第一时间联系您~)
附上本系列的链接,方便查阅:
1、什么是dbPaaS?
2、云和恩墨的dbPaaS:zCloud 数据库云管理平台
3、zCloud的dbPaaS能力(一):租户和资源管理
4、zCloud的dbPaaS能力(二):自动化部署
5、zCloud的dbPaaS能力(三):高可用管理 Part1 - Oracle
6、zCloud的dbPaaS能力(三):高可用管理 Part2 - MySQL
7、zCloud的dbPaaS能力(四):备份恢复管理
8、zCloud的dbPaaS能力(五):监控巡检和性能容量实战之数据库故障的一站式处理
9、zCloud的dbPaaS能力(六):SQL变更管理
10、zCloud的dbPaaS平台案例集锦