暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

ocssd.log日志报"has a disk HB, but no network HB"

原创 jieguo 2023-02-22
1634

10多年前的问题再次出现:ocssd.log日志报"has a disk HB, but no network HB"

故障现象:

aix+oracle 11.2.0.4 RAC,节点2总被踢出去.

报错如下:

image.png

原因分析:

节点2稳压模块坏了,关机,更换重启后上述报错。

接到问题的时候,说节点2已经被踢两次。

此时检查状态均正常。后续观察运行了12小时不再报错。认为正常了,无需继续处理。

两节点检查操作:

  1. traceroute 对端私网心跳IP
  2. ifconfig -a|grep net
  3. grid用户检查两节点:crsctl stat res -t -init
    image.png

image.png
确认心跳网络,集群服务均正常。

原因详情可参考:
http://www.itpub.net/thread-1766984-1-1.html

处理建议:

如果还报上述错误,则:
1、当两节点RAC正常运行时,首先拔掉心跳线一次,节点2被踢出集群;
2、15秒以后重新插上心跳线,节点2无法加入集群,ocssd.log日志报"has a disk HB, but no network HB";
3、此时不要灰心,再拔掉心跳线一次,15秒以后重新插上即可!
最终解决方案总结:
1、对于非需要长时间不间断运行的RAC数据库,可以同时重启两个节点服务器即可;
2、对于需要长时间不间断运行的RAC数据库,那就试试拔两次心跳线吧,一定是2次哦,或者更多次,可解决。

相关案例排查思路参考:
image.png
Oracle故障处理之HAIP异常导致RAC节点无法启动
https://mp.weixin.qq.com/s/L3-OnyVKTnsSCb7ezotYNA

最后修改时间:2023-02-23 14:17:47
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论