10多年前的问题再次出现:ocssd.log日志报"has a disk HB, but no network HB"
故障现象:
aix+oracle 11.2.0.4 RAC,节点2总被踢出去.
报错如下:
原因分析:
节点2稳压模块坏了,关机,更换重启后上述报错。
接到问题的时候,说节点2已经被踢两次。
此时检查状态均正常。后续观察运行了12小时不再报错。认为正常了,无需继续处理。
两节点检查操作:
- traceroute 对端私网心跳IP
- ifconfig -a|grep net
- grid用户检查两节点:crsctl stat res -t -init
确认心跳网络,集群服务均正常。
原因详情可参考:
http://www.itpub.net/thread-1766984-1-1.html
处理建议:
如果还报上述错误,则:
1、当两节点RAC正常运行时,首先拔掉心跳线一次,节点2被踢出集群;
2、15秒以后重新插上心跳线,节点2无法加入集群,ocssd.log日志报"has a disk HB, but no network HB";
3、此时不要灰心,再拔掉心跳线一次,15秒以后重新插上即可!
最终解决方案总结:
1、对于非需要长时间不间断运行的RAC数据库,可以同时重启两个节点服务器即可;
2、对于需要长时间不间断运行的RAC数据库,那就试试拔两次心跳线吧,一定是2次哦,或者更多次,可解决。
相关案例排查思路参考:
Oracle故障处理之HAIP异常导致RAC节点无法启动
https://mp.weixin.qq.com/s/L3-OnyVKTnsSCb7ezotYNA
最后修改时间:2023-02-23 14:17:47
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
热门文章
oracle19c rac grid安装报错的快速处理libasmclntsh19.ohso libasmperl19.ohso client_sharedlib' of makefile
2023-03-15 13354浏览
奇怪的ORA-12514: TNS:listener does not currently know of service requested in connect descriptor
2021-11-26 8403浏览
oracle19c rac+asm-->oracle 19c single+fs的adg搭建(实战于生产)
2021-11-11 5887浏览
(1)一次失败的割接经历:麒麟linux6.5+oracle 12c rac打PSU补丁
2022-09-21 5818浏览
gpu p2p多卡训练运行不正常问题
2023-03-09 5454浏览
目录