暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

联想机器IRDMA驱动影响ORACLE RAC安装的案例记录

原创 chencheng 2023-04-21
304

记录一下本周RAC安装时因网卡驱动导致的一些问题

本周在客户生产环境搭建一套19.12 3节点的RAC集群,操作系统版本为redhat 7.9 ,物理机型号为:联想的ThinkSystem SR860机器

每次在集群一节点运行grid的root.sh脚本时,在创建OCR磁盘组时,服务器就突然假死,message,grid安装日志,crs日志等相关日志中都没有任何有用的信息,搭建过程中也没有任何报错

尝试使用只使用2个节点搭建集群和先只搭建单节点的集群等组合每次都是相同的现象,

后让主机运维人员收集机器假死前的操作系统后台日志,发现机器假死前操作系统底层调用了一个'irdma_user_mmap_enrty_del_hash……'的操作系统函数

查找相关资料发现这个irdma是Intel RDMA网卡的驱动,RDMA技术(直接内存访问)允许在计算机主板上的设备直接把数据发送到内存中去,并且不需要CPU的参与,和oracle RAC的内存共享特性有些类似

并且假死节点也是在创建OCR磁盘组时,也涉及到内存共享

后面让主机同事把机器上的irdma驱动卸载掉后再重新安装grid集群,一切正常,机器不再假死,gi集群及db正常安装,实例创建后运行正常


可以确认就是irdma驱动影响了gi root.sh脚本的执行,导致root.sh脚本在创建OCR磁盘组时涉及到共享内存的操作时服务器假死,具体原因需要让主机工程师跟进排查


「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论