暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

操作系统库版本问题导致数据库集群安装OMS失败问题的分析与修复

原创 GaussDB数据库 2021-12-07
924

文章转自华为云社区,作者:世纪末的魔术师,原文链接:https://bbs.huaweicloud.com/blogs/177380

一、问题描述

安装6.5.1版本的GaussDB集群时,在安装OMS的步骤遇到 step7:configuring and starting agent [fail]

报错出现在“安装双机manager”阶段,使用的安装包信息如下

使用环境是centOS 7.4

二、问题分析

1.当前安装oms失败的问题原因是由于oms节点ldap启动失败导致,具体表现为ldap启动后,使用客户端命令ldapsearch无法查询出结果,报如下错误:

ldap_sasl_bind(SIMPLE): Can’t contact LDAP server (-1)

打开ldap 服务端调试日志,发现是TLS握手失败:

对比当前问题环境,与其他正常安装的环境,发现当前失败系统升级过openssl。因此,首先尝试回退了openssl版本,回退之后,安装仍然失败,报错和调试日志信息与之前一样;因此,还需要进一步分析

2.ldapserach查询失败时,通过tcpdump抓包,发现有TLSv1.2的错误信息

3.继续分析,发现正常的环境ldapserach查询ldap服务,查询结果如下

而在当前失败的节点上,查询ldap服务监听的浮动ip,报错如下,确定了浮动ip没有问题

4.下面分析与TLS加密通信相关的系统库,比对两个环境系统库差异如下:

发现是当前nss、libcurl相关的库版本为3.44,正常环境为3.36,不兼容所致。

三、问题解决

1.对对应的nss、libcurl库进行降版本处理

yum downgrade curl-7.29.0-42.el7 libcurl-7.29.0-42.el7 nss-3.36.0-7.el7_5 nss-pem-1.0.3-4.el7 nss-softokn-3.36.0-5.el7_5 nss-softokn-freebl-3.36.0-5.el7_5 nss-sysinit-3.36.0-7.el7_5 nss-tools-3.36.0-7.el7_5 nss-util-3.36.0-1.1.el7_6

2.重新进行“安装双机Manager”步骤,重试成功

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论