暂无图片
暂无图片
1
暂无图片
暂无图片
1
暂无图片

oracle rac集群故障排查思路

原创 狗剩儿 2022-02-28
2047

前言

在运维工作中,遇到rac无法启动是很多初学者比较头疼的事情,不知道该从哪方面下手排查,接下来就给大家整理下思路,希望有所帮助。


提示:以下是本篇文章正文内容,下面案例可供参考

一、我该如何排查?

rac不能启动,大多数情况是两方面的原因:
一个是共享存储
一个网络
可能共享存储常见原因是盘掉了,或盘坏了,或多路径软件出问题等等,而网络问题常见原因是私网网卡坏了,或节点之间网络不通信导致的

二、排查故障点

1.排查共享存储:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.执行启动监测,判断集群启动问题

在确认共享存储无误后,尝试启动集群
通过crsctl stat res -t -init观察启动过程:
在这里插入图片描述
在这里插入图片描述
如有问题可以跳到相应节点的集群日志目录下,查看集群日志:
在这里插入图片描述
还有就是alert日志。

3.检查网络通信

在这里插入图片描述
节点一、节点二相互ping,检查ICMP协议通信是否没有问题
我们需要使用traceroute命令来排查:
在这里插入图片描述
关于网络问题的解决可以尝试以下办法:
1、重启2个节点集群
2、重启网卡,down掉再up
3、确认防火墙
4、禁用HAIP
5、重启进程gipcd.bin

总结

以上,祝大家好运,永不宕机。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

墨天轮福利君
暂无图片
3年前
评论
暂无图片 0
您好,您的文章已入选合格奖,10墨值奖励已经到账请查收! ❤️我们还会实时派发您的流量收益。
3年前
暂无图片 点赞
评论