暂无图片
oracle ASM磁盘组一个磁盘offline问题,如何找到对应的哪块盘并修复?
我来答
分享
在路上
2025-04-08
oracle ASM磁盘组一个磁盘offline问题,如何找到对应的哪块盘并修复?

环境信息:oracle asm存储用的是一体机的cell节点里的存储。以下为排查思路,哪位帮忙看下具体怎么处理?

1.通过asmcmd  lsdg检查发现catalog磁盘组有一个offline_disks=1

2.检查votedisk也有一个offline的磁盘,但是没有对应到具体磁盘组的路径,路径怎么查?

3.执行lsop有相关任务活动

4.检查v$asm_disk,cell是3节点做的3个failgroup,每个查询catalog所在磁盘组磁盘信息如下

总共是33个记录,每个cell是10个griddisk,2个quorum,1个名字为_DROPPED_0009_CATALOG状态下线,但是没有具体的路径,不知道对应哪个磁盘?检查cell节点也都是10个catalog_cd开头的griddisk,查询都是存在的,这个offline的应该怎么找?

5.现在的问题是如何找到对应offline所在磁盘路径,然后怎么重新加入磁盘组,感谢各位大佬帮忙看看

我来答
添加附件
收藏
分享
问题补充
8条回答
默认
最新
ora_221

三个存储节点都查一下griddisk状态:

cellcli -e list griddisk attributes name,asmmodestatus,asmdeactivationoutcome

还有存储错误日志查了吗?#cellcli -e list alerthistory

暂无图片 评论
暂无图片 有用 0
打赏 0
暂无图片
陌上

查asm日志可以查到是什么时候踢的

暂无图片 评论
暂无图片 有用 0
打赏 0
在路上
题主
2025-04-08
NOTE: initial disk modes for disk 9 () in group 1 (CATALOG) is not completely online: modes 0x1 lflags 0x0 SQL> alter diskgroup catalog offline disk '_DROPPED_0009_CATALOG' SUCCESS: alter diskgroup catalog offline disk '_DROPPED_0009_CATALOG' WARNING: Disk 9 in group 1: state 0x6 mode 0x1 cannot be onlined WARNING: Disk 9 in group 1: state 0x6 mode 0x1 cannot be onlined 搜索历史的asm日志有这个记录,难道这个磁盘组就叫这个dropped名字?这个感觉是手动操作的?
陌上
答主
2025-04-09
继续往前查,肯定有个日志是刚刚offline的的
R
reddey

如果你用的是EXADATA一体机,应该进入一体机查看相应磁盘路径。

暂无图片 评论
暂无图片 有用 0
打赏 0
在路上
题主
2025-04-08
exadata里list查看 celldisk,griddisk,lun这些都没有具体的磁盘路径
JiekeXu
暂无图片

我没有使用过一体机,这个存储路径不知道是通过什么多路径软件生成的,问问系统工程师。
或则你直接用 oracle 自带的 kfod 命令试试。

https://www.modb.pro/db/44696

kfod disks=all status=true

kfod status=TRUE asm_diskstring='/dev/rhdisk*' disks=ALL
复制
暂无图片 评论
暂无图片 有用 2
打赏 0
在路上
题主
2025-04-08
好的,谢谢 我试试看有没有,一体机应该是一个物理硬盘对应一个celldisk,然后celldisk 划分多个griddisk,用作磁盘组的
ora_221

1.外观查看一体机存储节点硬盘是否有亮故障灯


2.存储系统查询

ssh <存储节点IP>

#cellcli -e list physicaldisk    //查询存储盘及状态信息

--正常状态如下:

 8:0               xxxxx                 normal
8:1 xxx                 normal
...
FLASH_1_1 xxxx     normal
....

#cellcli -e list alerthistory //存储节点alert日志


以上可以找到对应的故障硬盘,注意:故障盘是0或1号盘需注意!

暂无图片 评论
暂无图片 有用 0
打赏 0
在路上
题主
2025-04-09
这个查看硬盘是正常的,12块硬盘正常,4块闪存盘,有一个flash 闪存盘提示warning-predictive failure,这个报警应该和asm哪个offline磁盘没有关系,asm磁盘用的是ssd硬盘。不是闪存。
ora_221
暂无图片 评论
暂无图片 有用 0
打赏 0
ora_221

你从哪里查的asm没有使用flash卡

暂无图片 评论
暂无图片 有用 0
打赏 0
在路上
题主
2025-04-09
感谢回答,评论无法截图,我单独截图了请看下面。这个故障的flash卡没有被用到。用的是另外3个flash卡,这个flash报警是不是和asm磁盘offline没有关系?因为我看你发的查看cell错误日志有ora-15041应该是磁盘组空间不足的报错
在路上

fd_01_za01celadm02闪存盘告警,griddisk相关用的闪存是另外3块flash卡

下面是三个存储节点的griddisk状态,其中告警这台显示都是正常的,另外两台显示有问题,大概意思是由于那个offline的磁盘导致的

错误日志如下:大概是无法重平衡这个磁盘组

暂无图片 评论
暂无图片 有用 0
打赏 0
ora_221
2025-04-09
griddisk状态看起来是正常的,你那个offline正好在存储2#节点上,好好检查下2#存储,可能和flash卡有关联,还有查一下2#存储8:6硬盘
回答交流
Markdown


请输入正文
提交
相关推荐
插入语句,ORA-07445: 出现异常错误: 核心转储
回答 3
参考:《ORA00600[17147]ORA07445[opiaba()772]》:https://www.modb.pro/doc/2141从trace文件看,当前的绑定变量已经超过了65536个,
有没有语句可以查询Oracle中某个表的增删改查的时间点?
回答 4
这么细粒度的审计记录,可以考虑使用第三方运维管理平台来实现
连接Oracle 19C数据库ORA-28040: No matching authentication protocol 如何解决?
回答 2
是因为你客户端版本太低了。配置sqlnet.ora文件,增加如下设置,8就是兼容oracle8客户端。改完后无需重启监听和实例,但是要更改数据库密码,否则提示用户的密码错误。SQLNET.ALLOWE
Oracle 表数据删除之后修改了表字段精度 , 重建表用闪回还能找到之前的数据吗?
回答 1
DDL以后闪回就不行了
求一个,aix 6 7t数据量数据库10g升级到x86 平台19c的方案
回答 7
已采纳
不能一步到位,使用expdp或者xtts先升级到11204,然后再升级到19c.细点说就是在x86的19cRAC上装一个11204的单机,然后将你的aix610g的数据通过expdp或者xtts搞进去
oracle怎么看某段时间内有没有删除某个数据?
回答 2
已采纳
只能进行logminor的分析,看看归档日志中有没有执行过del的SQL
oracle用sqlldr导入数据,怎么在导的时候把时间格式里的横杠去除?
回答 1
已采纳
文件里是‘20211217’,但目标字段不是date类型,而是个varchar2,所以你想导入成’20211217’?是这个意思么?直接导入到date类型的字段里去不更好么?如果是导入到date类型字
Oracle 怎么让主键重新按照顺序排序?
回答 1
已采纳
默认表创建的时候是堆表,数据是不按顺序存放的。查询的时候按照主键orderby排序即可。
ORACLE 12C RAC生产环境,EM监控有会话阻塞。并且刷新监控页面,SQL*Net message from client 对应 的会话ID会有变化。
回答 2
推断是4kqcuh7s87v5y
PL/SQL语法问题
回答 2
已采纳
业务模拟程序1,每0.1秒执行一次插入,并记录日志表declarelcntinteger;lvarvarchar2(2000);beginforiin1..10000loopbegininsertin