暂无图片
oracle rac 12c 五节点。其中一个节点$ORACLE_HOME下dbs目录误删除 导致集群连接失败
我来答
分享
勿忘心安
2022-09-05
oracle rac 12c 五节点。其中一个节点$ORACLE_HOME下dbs目录误删除 导致集群连接失败

oracle rac 12c 五节点。其中一个节点$ORACLE_HOME下dbs目录误删除 导致集群连接失败,从哪方面排查?

我来答
添加附件
收藏
分享
问题补充
13条回答
默认
最新
布衣
暂无图片

你这不是排查的问题吧,应该是怎么恢复吧。
你把另一个节点的dbs目录拷贝过来,然后把参数文件、密码文件改成误删除节点的,看看行不行。

暂无图片 评论
暂无图片 有用 1
打赏 0
勿忘心安
题主
2022-09-05
您好,已经恢复了,现在就是想知道为什么会出现这个情况
布衣
暂无图片

你的意思他是数据库自己误删除的,不是人为的?

暂无图片 评论
暂无图片 有用 1
打赏 0
勿忘心安
题主
2022-09-05
现在还没有确定是否是人为操作的
张sir

查查history,看看堡垒机上是否有留痕,这种基本上属于人为误操作或者脚本。还没碰到软件自己把自己干掉的情况。

暂无图片 评论
暂无图片 有用 1
打赏 0
勿忘心安
题主
2022-09-05
谢谢你的回答 ,感觉问题已经偏离初衷了,我的初衷是为什么dbs目录删除后,程序连接不上集群了?想知道为什么会导致这样
布衣
2022-09-05
同意, Oracle 不可能有这种BUG的。
刘贵宾

(1)首先 history 查看是否有 rm 删除的操作;
(2)其次 crontab -l 查看定时任务
(3)然后 ps -elf 查看有无异常的运行程序;
(4)最后查看各种日志,排查是否有异常日志;

暂无图片 评论
暂无图片 有用 0
打赏 0
刘贵宾

应用的jdbc是连接的数据库哪个ip?是scanip吗?

暂无图片 评论
暂无图片 有用 0
打赏 0
勿忘心安
题主
2022-09-05
不是 是指定的五个节点中的三个vip
刘贵宾

那这应该就是原因所在了

暂无图片 评论
暂无图片 有用 0
打赏 0
勿忘心安
题主
2022-09-05
我的只是其中一个节点出的问题,为什么会导致另外两个也连不上呢
刘贵宾

当时故障节点的vip漂移了么?

暂无图片 评论
暂无图片 有用 0
打赏 0
勿忘心安
题主
2022-09-05
没有 还在本机上
刘贵宾
答主
2022-09-05
当时应用连接的是故障节点么?
张sir

你可以看下哈,当时其他节点是夯死了还是确实连接不上了,我碰到一种情况就是高并发下,rac一个节点异常,会导致另一个节点短时间夯,看看正常的节点当时的活动会话情况。另外就是oracle 12c  bug比较多,不排除是bug。

暂无图片 评论
暂无图片 有用 0
打赏 0
勿忘心安
题主
2022-09-05
其他节点plsql/dev工具可以连接上
哇哈哈

把问题描述清楚吧,3个大佬都亲自来了

暂无图片 评论
暂无图片 有用 1
打赏 0
勿忘心安
题主
2022-09-05
oracle rac 12c 五节点。其中一个节点$ORACLE_HOME下dbs目录误删除 导致集群连接失败,程序配置的是其中三个节点的vip,想明确不是为什么dbs删除了,是删除了dbs为什么会导致程序连接数据库失败,报错 ora12547:连接丢失
布衣
暂无图片

image.png

内容截取:
https://www.yisu.com/zixun/266678.html

你应用配置的vip,应该把你的这3个vip都配置上,当第一个vip 连不通的话,让应用连接第二个vip。

或者你直接配置scan_ip

暂无图片 评论
暂无图片 有用 1
打赏 0
勿忘心安
题主
2022-09-05
jdbc:oracle:thin:@(description=(address_list=(address=(host=xxx.xxx.xxx.xxx)(protocol=tcp)(port=15236))(address=(host=xxx.xxx.xxx.xxx)(protocol=tcp)(port =15236))(address=(host=xxx.xxx.xxx.xxx)(protocol=tcp)(port=15236))(load_balance=yes)(failover=yes))(connect_data=(service_name=xxx))) 这个是我程序的配置三个vip 我觉得应该是当第一个vip 连不通的话,应用自动连接第二个vip 但是现实情况是连接报错
Root__Liu

oracle rac 12c 五节点。其中一个节点$ORACLE_HOME下dbs目录误删除 导致集群连接失败,程序配置的是其中三个节点的vip,想明确不是为什么dbs删除了,是删除了dbs为什么会导致程序连接数据库失败,报错 ora12547:连接丢失

配置的这三个VIP中有没有dbs被删除的节点?
按理dbs删除不会影响监听,看看监听文件的配置参数,确认下连接顺序

暂无图片 评论
暂无图片 有用 0
打赏 0
勿忘心安
题主
2022-09-05
就是配置的三个节点中的其中一个 dbs被删除了
刘贵宾

你的tnsnames.ora文件中配置了vip的信息么,你jdbc这么写,tnsnames.ora文件也需要把vip信息写上



(DESCRIPTION =

(ADDRESS_LIST =

(ADDRESS = (PROTOCOL = TCP)(HOST = w3-vip)(PORT = 1521))

(ADDRESS = (PROTOCOL = TCP)(HOST = w1-vip)(PORT = 1521))

(ADDRESS = (PROTOCOL = TCP)(HOST = w2-vip)(PORT = 1521))

)

(LOAD_BALANCE = YES)

(FAILOVER = ON)

(CONNECT_DATA =

(SERVICE_NAME = PRD1)

)

)

暂无图片 评论
暂无图片 有用 0
打赏 0
勿忘心安
题主
2022-09-05
我这边没有配置tnsname 只有jdbc连接串
布衣
暂无图片

image.png

你把你(FAILOVER = YES)改成(FAILOVER = ON)测试一下呢。

暂无图片 评论
暂无图片 有用 1
打赏 0
勿忘心安
题主
2022-09-05
好 我试一下 谢谢
回答交流
Markdown


请输入正文
提交
相关推荐
oracle执行计划显示的那个time是什么单位
回答 1
已采纳
举例:00:00:01>>0.01s10:10:10 >>10min10s0.1s
Oracle中的ora_p00x_sid的进程不释放是怎么原因?
回答 2
1、找到该进程的进程号;psef|greporap00xsid2、查看进程的会话情况selectinstid||':'||sid||','||serialssid,username,sqlid,eve
redo 大小1g 10组 这种会使rman恢复变慢吗
回答 2
已采纳
不会,后续处理redo可以删除,重新添加几组几百m的redo,clear出来就很快
数据库发生600错误,实例重启了;RAC;11.2.0.4; 这个是啥原因呢?
回答 1
没遇到过你的这个问题。Mos没有有匹配你这个ORA600kslwtfxup:1的相关说明,kslwt解释:kernelservice(VOS)latchingandpostwaitwaitinterf
rose 来双击热备 oracle,模式 是和rac 差不多的吗?
回答 2
已采纳
rose是双机高可用软件,正常来说,针对同一个实例,只能做主备模式,即主机运行,备机停止;而rac既可以实现高可用(两台机器故障任一台都不影响业务),也有负载均衡的作用,两台机器同时运行,scanip
企业现在一般用什么监控Oracle数据库,OEM CC用得多吗?
回答 2
开源的有zabbix比较好用,然后第三方监控厂家都支持oracle监控,顺便把网络设备,存储,虚拟化一并监控掉,还可以发告警短信电话什么的,不必OEM和GC香么
OCM 和 OBCE
回答 2
已采纳
这个看自己的发展规划吧,OCM的含金量在国内还是挺高的,在数据库界都是认可的。如果你工作中接触的都是OB,以后也想着一直往这方便发展,就在这方面提高一下自己,整个OBCE。至于OCM的薪资岗位各有不同
请问使用脚本一键部署12c/19c/21c,如何在部署前设置数据库字符集?
回答 2
已采纳
可以通过sql查看:selectuserenv('language')fromdual;有关userenv(‘parameter’)返回值的官网介绍如下:建议查看oracle用户的.bashprofi
ORACLE RAC备机重启后有一个LUN没挂上。可能是什么原因呀?
回答 1
已采纳
建议检查一下存储侧,之间遇到过存储侧问题导致(也不排除再重启一下主机又恢复哦)。
standby无法open
回答 5
我这边是parametervalueconvert没配置好导致的