暂无图片
分享
yg
2019-11-29
生产环境rac数据库ORA-6000不能连接
暂无图片 10M

rac数据库29号凌晨,节点1报ORA-00603: ORACLE server session terminated by fatal error
ORA-00600: internal error code, arguments: [4552], [2], [0], [], [], [], [], [], [], [], [], []
8点多业务部门报数据库不能连接,重启两个节点数据库解决,现在主要是想要找到问题的原因,自己分析下来一种是主机资源不够,另一种是bug,不是很确定,希望大神协助,谢谢

收藏
分享
9条回答
默认
最新
yg
上传附件:alert_dxwsjc1.log
暂无图片 评论
暂无图片 有用 0
打赏 0
yg
上传附件:bj日志.zip
暂无图片 评论
暂无图片 有用 0
打赏 0
章芋文

请问业务中是否有业务在分布式事物中使用了全局临时表?

暂无图片 评论
暂无图片 有用 0
打赏 0
yg
上传附件:dist_queries.html
暂无图片 评论
暂无图片 有用 0
打赏 0
yg

这个该如何查看

暂无图片 评论
暂无图片 有用 0
打赏 0
yg

oracle的建议是将参数_clusterwide_global_transactions设置为false,但是我不明白之间的联系是什么,或者说从哪里的报错可以看出是这个参数引起的bug

暂无图片 评论
暂无图片 有用 0
打赏 0
章芋文

ORA-00600 [4552], [2]这个报错就是因为分布式事务引起。

Transaction recovery: lock conflict caught and ignored
告警日志中大量的这个信息可能是分布式事物恢复。

awr中SQL ordered by Cluster Wait Time中update undo占了20%

update /*+ rule */ undo$ set name=:2, file#=:3, block#=:4, status$=:5, user#=:6, undosqn=:7, xactsqn=:8, scnbas=:9, scnwrp=:10, inst#=:11, ts#=:12, spare1=:13 where us#=:1

集群范围全局性事务(Clusterwide global transactions)是11g的新特性,一个集群范围全局性事务是一个在RAC中的每个节点均有一个本地事务的分布式事务,当_clusterwide_global_transactions=true(默认)时,
ORACLE会把这些本地事务当做一个事务对待,当_clusterwide_global_transactions=false时,ORACLE会将这些本地事务当做单独的事务
通过多阶段提交协调处理。

这个参数_clusterwide_global_transactions设置了不一定解决问题,不过可以尝试下,属于标准安装基线常规参数调整。

另外,还是建议业务中不要使用大量分布式事物,也就是通过dblink等方式插入、更新远程表,不然后面问题会很严重,尤其是性能问题。

暂无图片 评论
暂无图片 有用 0
打赏 0
yg

好的,谢谢章大师

暂无图片 评论
暂无图片 有用 0
打赏 0
yg
问题已关闭: 问题已经得到解决
暂无图片 评论
暂无图片 有用 0
打赏 0
回答交流
Markdown


请输入正文
提交
问题信息
请登录之后查看
附件列表
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏