某天,某库两节点实例先后发生重启,实例重启前alter日志同时出现IPC Send timeout detected IPC超时。
操作系统:AIX 7100-04-07-1845(SP07) 数据库版本:oracle 11.2.0.4.0 两节点RAC
2.1 日志分析




23:23:01分节点1、节点2同时出现IPC Send timeout detected IPC超时; 23:24:48节点2 LMS进程终止了自己的实例,随后节点1 在23:24:58由PMON进程终止了自己的实例; 数据库alert 首先出现IPC Send timeout,IPC超时,随后节点2被驱逐,节点1也终止自己的实例。
2.2 DRM特性
主节点(Mater) 对于RAC系统,由于数据库同时存在多个实例,而且每个实例都会对资源(PCM 数据块,NON-PCM 各种锁资源)进行访问。也就是说GRD中的资源需要能够被多个实例同时访问,这就需要有存在一个协调者记录对应资源上的锁信息,并协调来自于多个实例的资源申请。 主节点(Master)就是用于保存资源的定义以及上面所有锁的信息,并负责协调资源申请节点。而Oracle主节点组织方式是集群中的每个节点都是资源的主节点,每个节点负责一部分资源。这种方式的优点是,工作负载被分配到各个节点,而主节点主出现问题时,资源重构的时间很短,不会影响系统的高可用性和性能。 当然,这种结构也会有些负面影响,例如:节点间的消息交互会变多,而且有些信息会被存放多份当一个资源第一次被访问的时候,Oracle会根据HASH算法计算出资源所对于的主节点,并将这个资源的定义信息,以及资源上所有的锁信息都保存在主节点上。但是这样做会使每一次访问都去访问主节点,从而增加实例间的信息交互量。

Oracle停止所有在需要进行remastering的buffer上的操作。注意:DRM是渐进的,也就是说以windows为单位,每次对一部分的buffer 进行remastering 操作。 Lmon 通知所有实例,准备进行remastering。 在旧的master实例清除对应buffer的master信息。 将master信息传递给新的master实例。 在新的master实例构建资源的最新状态。 结束,并释放所有之前所有步骤占用的资源。
不需要reconfig,即能完成resource的remaster操作; 该特性的设计初衷是为了降低跨节点频繁访问需求,通过更改所访问资源的master node。
DRM freeze 会导致资源短暂的不可用; DRM freeze 可能会导致系统hang住。
2.3 优化建议

本文作者:袁 钢(上海新炬中北团队)
本文来源:“IT那活儿”公众号

文章转载自IT那活儿,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
数据库国产化替代深化:DBA的机遇与挑战
代晓磊
1321次阅读
2025-04-27 16:53:22
【纯干货】Oracle 19C RU 19.27 发布,如何快速升级和安装?
Lucifer三思而后行
800次阅读
2025-04-18 14:18:38
2025年4月国产数据库中标情况一览:4个千万元级项目,GaussDB与OceanBase大放异彩!
通讯员
797次阅读
2025-04-30 15:24:06
Oracle数据库一键巡检并生成HTML结果,免费脚本速来下载!
陈举超
602次阅读
2025-04-20 10:07:02
【ORACLE】你以为的真的是你以为的么?--ORA-38104: Columns referenced in the ON Clause cannot be updated
DarkAthena
551次阅读
2025-04-22 00:13:51
【活动】分享你的压箱底干货文档,三篇解锁进阶奖励!
墨天轮编辑部
537次阅读
2025-04-17 17:02:24
【ORACLE】记录一些ORACLE的merge into语句的BUG
DarkAthena
511次阅读
2025-04-22 00:20:37
一页概览:Oracle GoldenGate
甲骨文云技术
503次阅读
2025-04-30 12:17:56
GoldenDB数据库v7.2焕新发布,助力全行业数据库平滑替代
GoldenDB分布式数据库
481次阅读
2025-04-30 12:17:50
火焰图--分析复杂SQL执行计划的利器
听见风的声音
473次阅读
2025-04-17 09:30:30