暂无图片
分享
Coolkid
2019-03-19
ASM磁盘中有一块盘报错无权限,但查看后各磁盘权限一致且只在一个节点报错

alert报错信息如下:

Errors in file /u01/oracle/diag/rdbms/site/site1/trace/site1_ora_12013.trc:

ORA-15025: could not open disk "/dev/mapper/asmdata15"

ORA-27041: unable to open file

Linux-x86_64 Error: 13: Permission denied

Additional information: 3

ORA-00604: error occurred at recursive SQL level 2

ORA-01115: IO error reading block from file  (block # )

ORA-01110: data file 1: '+DATADG/site/datafile/system.268.960656447'

ORA-15081: failed to submit an I/O operation to a disk

双节点RAC,只有其中一个节点的日志中报该错误,频率不高,几天才出现一次,每次出现该报错最少连续三四次,asmdata15磁盘和其他磁盘的权限一致,每次都是报该盘(asmdata15)有问题,权限截图见附件图片,目前对生产无影响,感谢!

asm磁盘权限1.png

用户权限.png


收藏
分享
12条回答
默认
最新
Coolkid
上传附件:site1_ora_12013.trc
暂无图片 评论
暂无图片 有用 0
打赏 0
Moone

对2个节点做下集群检测并上传结果

./runcluvfy.sh stage -pre crsinst -n <node1>,<node2> -verbose

暂无图片 评论
暂无图片 有用 0
打赏 0
Coolkid
上传附件:site1_runcluvfy
暂无图片 评论
暂无图片 有用 0
打赏 0
Coolkid

节点1结果见附件,节点2也跑了一次,和节点1一样。。。

暂无图片 评论
暂无图片 有用 0
打赏 0
Moone

检查结果看site2的DNS解析超时报错:

site2de 

Checking the file "/etc/resolv.conf" to make sure only one of domain and search entries is defined

File "/etc/resolv.conf" does not have both domain and search entries defined

Checking if domain entry in file "/etc/resolv.conf" is consistent across the nodes...

domain entry in file "/etc/resolv.conf" is consistent across nodes

Checking if search entry in file "/etc/resolv.conf" is consistent across the nodes...

search entry in file "/etc/resolv.conf" is consistent across nodes

Checking DNS response time for an unreachable node

  Node Name                             Status                  

  ------------------------------------  ------------------------

  site2                             failed                  

  site1                             passed                  

PRVF-5636 : The DNS response time for an unreachable node exceeded "15000" ms on following nodes: site2


File "/etc/resolv.conf" is not consistent across nodes


建议:

1、确认2个节点的/rec/resolv.conf配置是否一致

2、使用nslookup分别在2个节点解析site1/2

3、如何确认无误,在/etc/resolv.conf增加如下配置:

options timeout:1

options attempts:2


暂无图片 评论
暂无图片 有用 0
打赏 0
Coolkid

DNS已配置,另外,我们的rac没有采用DNS的方式,而是使用的hosts方式。请问除了DNS问题外,大概还会有什么原因会导致这种报错呀

Checking the file "/etc/resolv.conf" to make sure only one of domain and search entries is defined

File "/etc/resolv.conf" does not have both domain and search entries defined

Checking if domain entry in file "/etc/resolv.conf" is consistent across the nodes...

domain entry in file "/etc/resolv.conf" is consistent across nodes

Checking if search entry in file "/etc/resolv.conf" is consistent across the nodes...

search entry in file "/etc/resolv.conf" is consistent across nodes

Checking DNS response time for an unreachable node

  Node Name                             Status                  

  ------------------------------------  ------------------------

  site2                             passed                  

  site1                             passed                  

The DNS response time for an unreachable node is within acceptable limit on all nodes


File "/etc/resolv.conf" is consistent across nodes


暂无图片 评论
暂无图片 有用 0
打赏 0
Kamus

这个问题还挺有趣的。

目前的故障情况再确认一下:

site1实例上没过几天会出现一下报错,每次报错都是相同的ASM数据文件无法打开,site2实例上一切正常。


那么请问,每过几天出现一次报错的时间都是不一样的,毫无规律的吗?


暂无图片 评论
暂无图片 有用 0
打赏 0
Coolkid

是的,确实是没有规律,以下是从zone告警邮件中抽取了一些报错信息及时间点:

2019-01-14 16:47:59,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"

2019-01-16 13:13:20,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"

2019-01-16 13:18:09,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"

2019-01-16 13:50:53,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"

2019-01-16 14:06:33,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"

2019-03-02 17:43:55,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"

2019-03-02 17:50:05,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"

2019-03-19 14:03:30,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"

2019-03-25 14:16:35,数据库后台报错: ORA-15025: could not open disk "/dev/mapper/asmdata15"


暂无图片 评论
暂无图片 有用 0
打赏 0
李华

kfk_debug_get_user_groups: uid:2, euid:1001, gid:0, egid:1021

把用户组信息也发下,另外还有oracle文件的权限,看样子是你们什么程序连上去查报出来的。

暂无图片 评论
暂无图片 有用 0
打赏 0
Coolkid

你好,用户组信息是一样的,检查oracle文件的时候发现了一点区别:

节点一的权限是:-rwsr-s--x. 1 oracle asmadmin 239626689 Nov 21  2017 oracle

节点二的权限是:-rwsr-s--x  1 oracle asmadmin 239626689 Nov 21  2017 oracle

对比其他集群发现正常的都是-rwsr-s--x

暂无图片 评论
暂无图片 有用 0
打赏 0
李华

kfk_debug_get_user_groups: uid:2, euid:1001, gid:0, egid:1021

你这个信息很奇怪的,uid 是2 这个用户应该是daemon 我觉得问题是出在这个上面,你那个查询的程序是启动在哪里的?怎么连接的数据库。也看下监听什么用户启动的。

暂无图片 评论
暂无图片 有用 0
打赏 0
章芋文
问题已关闭: 问题已经得到解决
暂无图片 评论
暂无图片 有用 0
打赏 0
回答交流
Markdown


请输入正文
提交
相关推荐
什么情况下应该使用B*Tree索引?
回答 1
已采纳
通常情况下,以下两种情况使用BTree索引。如果要访问表中是非常少的一部分数据,那就用BTree索引;如果要处理表中有大量的数据,但这些数据可以通过索引直接拿到,那就用BTree索引。
一个数据库实例下面有十几个用户,如何实现分用户备份各自的数据,不用一个一个exp?各用户如何实现并发备份?
回答 3
只能写脚本然后定时任务一起备份了。但是备份本来就是高IO操作。一起可能IO用尽还有竞争。没有必要并行。比如ABCDEF几个schema一起,可能不快。但是每个备份开并行能快一些。主要看你磁盘的IO能力
Oracle优化器的前世今生是怎样?
回答 2
已采纳
Oracle优化器可以让调优工作变得很轻松,它可以为那些写得较差的查询选择一条更好的执行路径。基于规则的优化器(现在已经过时,不再支持)依赖于一系列Oracle处理语句的规则。Oracle10gR2只
impdp ORA31694
回答 9
可能是文件损坏,检查两边文件大小是否一致也可能是环境变量中的字符集设置有影响可以直接导出&nbsp;metadataonly再导入试试有没有报错
安装19c RAC 1节点执行root.sh时报错,CLSRSC-119
回答 3
图中出现CRS2674faied和CLSRSC119:Startoftheexclusivemodeclusterfailed错误,应该是主机名解析出现问题了,排查下/etc/hosts和集群名称25
Oracle Rman异机恢复实例名必须相同吗?
回答 2
分区交换
回答 4
从数据字典的角度能直接修改将A1分区变成B的分区吗?
direct path read 解决什么问题,或者什么情况下会用到?
回答 2
简单的说就是为了防止大表把buffercache里的数据从内存中挤走&nbsp;直接将大表的数据放到pga一般全表扫描基本都会触发生产环境中我基本都是默认关闭的&nbsp;altersystemset
ogg配置ddl复制,遇到以下问题,怎么破?
回答 2
看你这个出错是登录oracle的出错。你先在ogg这机器上netmgr看看tnsname的对不对,测试一下。再tnsping一下。最后在sqlplus尝试一下,都可以了再进行ogg的抽取和投递。
v$process一直增长
回答 5
这个应该是前台应用程序连接数据库没有正常断开导致,如果vsessuon找不到,就从dbahistactivesesshistory或者vactivesessionhistory视图里面找找是哪个应用。
问题信息
请登录之后查看
附件列表
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~