概述
虚拟化的弹性架构、易管理性现在已经是各单位的系统管理人员所熟悉公知的好处,也让计算机运维人员从一个修电脑的真正做到了系统管理员。回想过去那些不堪的维修电脑的经历,恍如隔世。
虚拟化应用了这么多年,软硬件不停地升级,基于生产环境中的虚拟化版本升级,现在是很多单位迫切需要解决的问题。
我们完成过一个数据中心的升级,过程中碰到了不少问题,在此将经验和教训都分享出来,供各位待升级的朋友们参考。
项目介绍
这次的客户是个新加坡主板上市的集团公司,购买了DELL公司的超融合设备,计划将超融合设备加入到现有的虚拟化数据中心,这样不但能做到统一管理,同时在新的业务之外,新购的资源还能分担一部分之前增长的业务,缓解原数据中心资源极度紧张的现状。
客户原数据中心用的是VMware虚拟化,共有10台主机,安装的是vsphere 6.0版本,管理这块装的是vcenter6.0版本,采用了过去常用的那种DC+DB+VC供3台虚拟机组成的架构。10台主机是两个配置,都是DELL的服务器,其中7台R720服务器,3台R730的服务器。

客户处还有两台DELL的存储用作虚拟化存储,通过光纤交换机连接到服务器上,为虚拟化架构提供共享的存储功能。

本次购买的超融合设备,需要的vcenter版本必须是7.0以上,而vcenter7.0却管理不了vsphere6.0的主机,就必须要做主机及vcenter的版本升级。

具体升级过程
首先感谢客户对我们的信任,这样重要的工作交给我们来操作。当时正是疫情期间,用户总部所在的地区正是疫情风险区域,所以整个升级过程都是通过我们技术人员的远程操作和现场客户的全力配合完成的。升级过程花了一周多的时间,过程中也出现了不少问题,通过双方的配合、沟通和理解,最终完成了整个数据中心的升级操作。
客户的数据中心管理得非常好,对数据中心的主机情况、存储情况、虚拟机情况都非常熟悉,对虚拟化的技术架构、功能也都非常了解,为我们的技术沟通提供了非常好的条件,也是能够远程完成升级操作的基础。
客户帮忙安装了一台虚拟机,在虚拟机上装了向日葵远程管理软件,交给我们vcenter的地址、账号、密码,交给我们主机的地址、账号、密码。我们登录上去检查后的情况如下:
1、现在有10台主机,其中7台R720,3台R730,安装的是vsphere6.0,一台虚拟机安装vcenter6.0做管理
2、10台机器都只有idrac基础版,没有企业版许可。7台R720的操作系统是装在本地2G的SD卡上的,3台R730的操作系统是装在本地16G的SD卡上的
3、7台R720的机器,只有一台有本地硬盘8T,其他机器均没有本地硬盘
4、10台主机上大约有70-80个虚机在工作,需要迁移。6.0的版本升级到7.0的版本,需要6.5的版本过渡
3台R730的升级,非常顺利,也没太多可介绍的,不过7台R720的升级,可是碰到了不少问题,下面将问题都罗列出来,给大家借鉴。
问题一、服务器企业版管理许可
本次的升级,涉及到的主要是服务器操作系统的安装/升级,所以基于操作系统的所有远程软件都是没有用的,只有不依赖操作系统的,硬件级别的远程管理才能够做到。或者就是刻光盘或者制作U盘来进行服务器操作系统的安装/升级。使用年限长的服务器,长期不会使用光盘的,光驱里面的激光头很多都会因为灰尘导致损坏,所以刻光盘的办法使用的人不多。制作U盘装系统是常用的方法,在本公众号中也有介绍,有兴趣的朋友可以关注本公众号,并查看文章《UItralISO制作Windows10启动盘》和《Rufus 制作 Ubuntu18.04启动盘》。
我们对DELL的服务器还是很熟悉的,DELL的服务器是能够免费试用一个月的企业版管理软件的,这一个月可以在任何时候连续使用,当然在整个生命周期里面,也只有这一次的免费使用机会。如果有需要用到的,可以联系我们,索要试用的许可文件。
本次远程操作要是使用U盘的话就太费劲了,所以工程师还是决定使用管理口装系统。使用管理口装系统的方法本公众号也有分享过文章《服务器idrac远程安装系统》,欢迎各位关注并查看。
同客户商量后,客户将10台机器的管理口都接上了交换机,并为10个管理口分别设置了管理地址。这样就为远程安装/升级操作系统做好了准备。
问题二、服务器无本地硬盘
升级过程中碰到的第二个问题是,服务器基本上都没有本地磁盘,都是通过双SD卡做成RAID1后装的虚拟化系统。这个架构非常好,不过本次升级的时候碰到了一点问题,就是升级时新版本虚拟化系统需要的磁盘空间最低3GB,而7台R720配置的SD卡容量为2GB,升级的时候会有空间不足,升级失败的现象。

倒是还有Boot From San的方案,跟客户沟通后,最后决定直接JD购买14个16G的SD卡用于更换。
这个操作花了不少时间,用户购买到货需要时间,每更换一台之前,需要将该台主机上所有的虚拟机迁移到其他主机上,然后关机更换SD卡。这块也辛苦客户的工程师了。
三、新版本系统无老的硬件驱动
这个问题,我们做IT的经常碰到,没成想这次升级的时候,又冒出这个问题来了。
具体问题是,R720的服务器上,配置的是博科825的HBA卡,服务器安装esxi7.0的时候识别不到博科825的HBA卡。

碰到了这个问题,我们就导出查相关资料,翻阅VMware官网,查看博科官网,还致电了戴尔售后。最后得到的结论是:博科825的HBA卡不支持7.0系统。不过vsphere6.5是可以装上这个HBA卡驱动的,同时vCenter Server 7.0是可以管理vsphere 6.5的。最后建议客户R720安装6.5系统,R730安装7.0系统。由vCenter Server 7.0统一管理。经过客户理解并同意后,该问题算是解决。
升级过程中还碰到几个其他的问题,因篇幅问题,下篇文章继续介绍,前面的三个问题算是开胃小菜,估计各位系统管理员朋友看了后不会有太多感觉,下篇来给大家介绍碰到的让人毛发直竖的问题,各位看官请关注本公众号后续更新。
需要上门解决问题时,请及时联系我们!




