暂无图片
Rman 备份到 NFS失败
我来答
分享
JiekeXu
暂无图片
2021-07-21
Rman 备份到 NFS失败

由于原来的 NFS 过于老旧,空间小,故换一台新的 NFS 服务器,通过修改 IP 的方式替换,但替换后,rman 无法备份到 NFS,几度怀疑是文件系统或者挂载的问题,将原来的 XFS 格式化成 ext4 挂载参数改成如下也是不行。
mount -t nfs -o rw,bg,hard,nointr,vers=3 ……

Rman(RAC 19.4)报错如下:
图片.png

RMAN-03009: failure of backup command on ORA_DISK_1 channel at 07/20/2021 20:23:53
ORA-19504: failed to create file "/nfs/orabak_edw/coaa_m904f42l_1_1"
ORA-17503: ksfdopn:11 Failed to open file /nfs/orabak_edw/coaa_m904f42l_1_1
ORA-17500: ODM err:Communication error on send
复制

顶级目录/nfs 权限为 777
drwxrwxrwx 4 root root 46 Jul 20 17:33 nfs

二级目录orabak_edw权限为777
drwxrwxrwx 2 root root 20K Jul 21 08:09 orabak_edw

oracle 用户 vi 、echo 手动写文件没有问题
echo aaa > /nfs/orabak_edw/a.test

NFS 挂载命令:
mount -t nfs 10.100.xx.xx:/oranfs/edw /nfs/orabak_edw

mount | grep ora
10.100.xx.xx:/oranfs/edw on /nfs/orabak_edw type nfs4 (rw,relatime,vers=4.1,rsize=1048576,wsize=1048576,namlen=255,hard,proto=tcp,timeo=600,retrans=2,sec=sys,clientaddr=10.100.xx.x,local_lock=none,addr=10.100.xx.xx)

服务端 mount
mount | grep ora
/dev/mapper/datavg01-lvnfs01 on /oranfs type ext4 (rw,relatime,data=ordered)

NFS 客户端和服务端操作系统版本RHEL7.6
Red Hat Enterprise Linux Server release 7.6 (Maipo)
Linux dc-edw-rac1 3.10.0-957.el7.x86_64 #1 SMP Thu Oct 4 20:48:51 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

排查尝试多次将服务端的IP 换回原来的IP后第一次备份成功了,将文件系统改成 xfs 后就不成功了,即使改回 ext4 也没有成功备份过。

最后,无奈之际将NFS服务端的 IP 修改为一个新的未使用过的 IP 重启主机,已ext4方式挂载后可以成功备份到 NFS。

现在就是想用老的 NFS IP 挂载,怎么都不会成功,请问各位专家这个问题会出在哪里?是 NFS 的问题还是 Oracle 的问题呢?

我来答
添加附件
收藏
分享
问题补充
11条回答
默认
最新
JiekeXu
暂无图片

挂载还有原来的命令,原来的方法,把客户端所在的两台数据库服务器 reboot 后,很神奇的备份到 NFS 就成功了。超出了我的认知范围。。。

暂无图片 评论
暂无图片 有用 0
打赏 0
暂无图片
cqiwen

老的nfs服务器没关或者IP没改吧,感觉是IP冲突。可以在用rman之前自己手动copy文件到那个新的nfs目录中去,看下有没有报错。

暂无图片 评论
暂无图片 有用 0
打赏 0
刘晓鹏

找存储厂商要一个官方建议的mount参数试试~
这个是我们这边用的
mount -t nfs -o rw,bg,hard,nointr,rsize=32768,wsize=32768,tcp,actimeo=0,vers=3,timeo=600 1.1.1.1:/backup /u01/rman_dbbackup

暂无图片 评论
暂无图片 有用 0
打赏 0
Murkey

我个人感觉应该还是NFS的通讯问题

暂无图片 评论
暂无图片 有用 0
打赏 0
JiekeXu
暂无图片

其实我有两个疑惑,一是 NFS 挂载存在问题,RHEL 6 的参数和 HREL7 挂载方法有区别,某些参数没有使用正确导致时灵时不灵;二是数据库里记录了 NFS 的位置了,一旦有一次报错就不会成功了,具体怎么记录在哪记录不得而知。领导更偏向于疑惑二,让从数据库层找问题。。。

暂无图片 评论
暂无图片 有用 0
打赏 0
Murkey


暂无图片 评论
暂无图片 有用 1
打赏 0
Murkey

如果是备份,我认为正常的mount的就可以,可以问问NFS提供商mount方式,配置方式是否有区别呢

暂无图片 评论
暂无图片 有用 0
打赏 0
JiekeXu
暂无图片

MOS 也已经查过了,没有找到满意的答案。

暂无图片 评论
暂无图片 有用 0
打赏 0
yqfntx

修改下nfs服务端的配置为 (rw,no_root_squash,insecure) 试试?

暂无图片 评论
暂无图片 有用 1
打赏 0
jieguo

比较像这个bug:

MOUNT DETAILS CACHED IN SGA ARE NOT CLEANED UP EVEN AFTER REMOUNT(20720667)

不过按理12.2以后版本应该fix了。

暂无图片 评论
暂无图片 有用 0
打赏 0
JiekeXu
暂无图片

本文涵盖了一些与直接 NFS 相关的常见问题(文档 ID 1496040.1)。Q. 我们在使用嵌套 NFS 挂载时遇到问题,无法访问子 NFS 挂载中的文件。使用内核 NFS 时一切正常。尝试在嵌套挂载中打开或创建文件时会出现以下错误。


ORA-01119: 创建数据库文件“*”时出错


ORA-17502: ksfdcre:4 无法创建文件*


ORA-17500: ODM err: 权限拒绝


答:默认情况下,Linux使用相同的超级块,以防NFS文件系统具有相同的fsid,对于嵌套的NFS挂载也是如此。使用相同的超级块,dNFS无法将这些嵌套的NFS 挂载识别为单独的文件系统。Linux挂载选项“noshar cache”强制内核为这些嵌套的NFS的挂载提供单独的超级块。因此,使用dNFS与嵌套的NFS进行挂载的解决方法是,在挂载父级和子级挂载时指定“noshar cache”挂载选项。


nfsserver:/vol/vol0/nested_parent on /u01 类型 nfs (rw,bg,hard,rsize=65536,wsize=6553,vers=3,nointr,timeo=600,tcp,nosharecache)


nfsserver:/vol/vol0/nested_child on /u01/oradata 类型 nfs (rw,bg,hard,rsize=65536,wsize=6553,vers=3,nointr,timeo=600,tcp,nosharecache)

暂无图片 评论
暂无图片 有用 0
打赏 0
回答交流
Markdown


请输入正文
提交
相关推荐
oracle 添加了一个job 不能自动运行,但是手动可以 , 这个参数job_queue_processes 默认的1000 可以从什么方面排查?
回答 2
selectfromdbajobs看看是真的停了吗?下一次时间是何时
Oracle 能从归档里恢复单张表的数据吗?
回答 2
如启用了FLASHBACK,可通过闪回方式恢复
Oracle硬盘读取最长活动时间100是什么原因
回答 1
存在大量读取的sql,比如大量的全表扫描
Oracle EMCC可以独立安装吗?还是必须安装到数据库服务器上?
回答 1
https://www.modb.pro/db/66272希望对你有所帮助
Oracle 用存储过程来删除数据,一次性删除300万数据用时1小时20分钟,效率低吗?
回答 4
已采纳
很低了。存储过程落地也是调用delete语句。而且一次大量delete通常要考虑好rede和undo,避免刷爆,非常危险的操作。。。建议将需要的数据通过createtablea1asselectfro
龙蜥系统上安装 Oracle11G 的,哪个版本稳定点?
回答 4
建议升级到Oracle19c
Oracle roll invalidation的超时时长怎么查看?
回答 1
已采纳
下面隐含参数可以一定程度控制,11g版本以后,下面参数只是一个基准值,会在下面参数基础上有一定浮动。optimizerinvalidationperiod18000TRUEtimewindowfori
oracle导库问题(跨版本及parallel参数)
回答 2
第一,小版本不用加参数也能导第二,导入的时候也用parallel4即可
oracle ASM磁盘组一个磁盘offline问题,如何找到对应的哪块盘并修复?
回答 8
已采纳
三个存储节点都查一下griddisk状态:cellclielistgriddiskattributesname,asmmodestatus,asmdeactivationoutcome还有存储错误日志
12C用impdp导入数据没有生成日志文件
回答 3
我创建了两个目录,一个是douyusi对应root用户下的地址/oracle/douyusi,一个是douyusi对应oracle用户下的地址/home/oracle/douyusi,在执行impdp