暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

实例--数据中心升级过程中碰到的问题(下)

数据中心知识 2022-08-23
60

概述

    虚拟化的弹性架构、易管理性现在已经是各单位的系统管理人员所熟悉公知的好处,也让计算机运维人员从一个修电脑的真正做到了系统管理员。回想过去那些不堪的维修电脑的经历,恍如隔世。

    虚拟化应用了这么多年,软硬件不停地升级,基于生产环境中的虚拟化版本升级,现在是很多单位迫切需要解决的问题。

    我们完成过一个数据中心的升级,过程中碰到了不少问题,在此将经验和教训都分享出来,供各位待升级的朋友们参考。

    场景就不多介绍了,具体场景请各位朋友关注公众号并查看文章《实例---数据中心升级过程中碰到的问题(上)》,上篇文章有过预告,之前的几个问题,解决不掉大不了取消升级,啥都不敢就可以了,那么这篇文章就将那几个让人汗毛林立的问题介绍一下,之所以这些问题麻烦是因为这些个问题必须解决,不解决的话,谁都不好受。

问题四、某些虚拟机VMware Tools不能用

    先来个开胃小菜,VMware Tools是虚拟化架构中,作为虚拟机同主机和vcenter沟通的代理软件,主要作用是优化虚拟机的虚拟硬件驱动,向主机报告虚拟机的状态信息,接受主机发送的操作指令。如果虚拟机不安装VMware Tools,那么主机就不能识别其操作系统类型,不能发送关机/重启的指令,做不了虚拟机层级的HA。咱们将主机和vcenter的系统都更新了,自然新的系统带的VMware Tools版本自然会有所更新。

    客户出系统升级完成后,居然有台虚拟机报错【所需VMware Tools ISO映像不存在或无法访问。。。。】。这是个挺意外的问题,因为vcenter是知道ISO在哪的,vcenter会自动将路径给到虚机让虚拟机能够正确地安装VMware Tools,理论上不应该有这样的问题出现。

    看到报错就要解决,查找原因。最后原因查明,该虚拟机是非常老的Windows Server 2003的系统,vcenter7.0时代的程序员根本就忽略了还有这么老的操作系统存在。找到问题就好找到方法,找到2003系统的tools版本上传到存储上sc4020-1-4t下的iso文件夹下。登录到虚拟机的系统里,挂载Tools的ISO文件,直接安装tools就行了。

问题五、原Vcenter DB虚拟机不见了

    系统升级后,居然有虚拟机不见了!吃瓜群众也可以准备好瓜子,大事件发生了。

    用户除了这个十台机器的平台外,还有一个vcenter5.5,管理的是另外的虚拟主机,现在那一套出现了问题。本来以为只是登录认证的问题或者是启动顺序的问题,让检查一下数据源并将vcenter虚机重新启动一下,结果用户给出个截屏,真正吓到人了。

    居然数据库连接不上了。赶紧工程师开会,前面到底做了什么操作,咱做下分析。分析结果是,前面204的主机上,这台数据库虚拟机虽然关机了,不过没有迁移走,客户那边就将SD卡换了,属于远程和现场的衔接出了问题。

    问题找到了,那么解决办法就好找了。SD卡里面只是vsphere的系统,虚拟机的数据都是存放在存储里面,vcenter里面看不到虚拟机只是虚拟机没有注册,那就到存储的文件系统里面查找该虚拟机的文件,然后注册上,问题解决。重新启动vcenter后,状态正常。关于如何注册虚拟机,请关注本公众号,后期会有专文讨论。

    考虑到有这台虚拟机不见了,可能还会有其他的虚拟机有同样现象,就跟客户一起一个一个的存储卷翻找,果然又找到三四个未注册的虚拟机,都是前期在204主机上关机后没有迁移的虚拟机,虽然都是业务上不重要的机器,不过对于我们做基础架构的,不能允许有这样的事件发生。

问题六、虚拟机网络不通

    几个不重要的虚拟机不见了,客户还不是特别紧张,可是本次升级过程中还是让客户出现了紧张状态。

    各位看客瓜子是不是又准备好了?这个问题实际发生在虚拟机不见的问题之前,不过我觉得这个问题更严重,所以将这个问题放到了后面。

    在三台R730升级完成之后,上面的所有虚拟机工作一切正常,客户对升级R720就充满了信心。因为是生产环境,虚拟机上都跑着业务,所以迁移工作基本上都是晚间进行,辛苦了我们的工程师,也辛苦了客户的工程师。第一台R720上虚拟机全部迁走,关机,换SD卡,重新装系统,配置主机,新建集群,加入vcenter。一切行云流水之后,将邮件服务器迁回这台主机上。

    第二天上班后,用户反馈,邮件都发不出去了,也收不到新邮件,Ping邮件服务器的地址,用几台客户端都Ping不通。

    幸好只是邮件服务器,要不就完蛋了。R730的操作系统安装过程中选的是升级,所有配置都带到了新的系统里面,所以虚拟机工作正常。R720是更换SD卡,装完系统后,虚拟交换机都是手工配置的,问题一定出现在虚拟交换机的配置上。服务器上只配置了几个标准的虚拟交换机,那就赶快核对,到底哪个地方配置有问题。

    顶着用户那边邮件不通的压力,使用最原始的办法---比对法,看到在虚拟交换机的多网卡负载均衡设置中,有四个选项,分别是【基于源虚拟端口的路由】、【基于源MAC哈希的路由】、【基于IP哈希的路由】、【基于物理网卡负载的路由】,前期碰到的客户都是选择的默认负载均衡策略【基于源虚拟端口的路由】,而该客户的虚拟交换机配置是【基于IP哈希的路由】。赶快改过来,确认配置后,再次Ping邮件服务器,通了。告知客户后,他们邮件收发正常,问题解决。


虚拟化是个灵活的架构,能够实现业务不中断的情况下升级底层系统,甚至包括更新/更换底层硬件。可是在生产环境中的操刀可不是闹着玩的,一定得有常规问题的预见能力,出现问题的快速解决能力。这些能力都来源于扎实的理论基础和大量的实践成果。各位看客如果也有升级需求,还望能够联系我们,给我们一个服务您的机会!


需要上门解决问题时,请及时联系我们

更多案例文章,请点击!


文章转载自数据中心知识,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论