暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

上海电信2021年全面上云工作踏出坚实第一步

中国电信云荐社区 2021-04-23
3065

    2021年是IT全面上云的关键年。上海公司共有50多个系统需要上云,系统数量多、类型多、资源需求多,这是摆在我们面前的新问题、新挑战,为了确保各系统高效上云,在总结前一年上云经验的基础上,上海电信云网运营部开展了一系列的上云支撑工作。

一、夯实上云技术底座
此前上海PaaS平台部署有容器、teledb、ctg-mq(分布式消息)、ctg-cache(分布式缓存)、分布式小文件、ELK等组件,为了满足2021年上云系统的组件需求,平台组通过与使用方组织虚拟联合团队验证、运维人员复用等方法,部署了telepg、ctg-kafka、ctg-hbase、ceph、ctg-gdb等清单内组件,在应用中摸索总结新增组件的特性,调优组件性能,完善运维规程,3月底前大部分新增组件已经交付上云系统使用。
提升云平台的资源利用率,既是缓解上云资源问题重要应对手段,长期看也是云平台的核心价值之一。平台组从去年底开始已经为后续上云腾挪资源,研发多种手段提升PaaS平台资源利用率:通过调整分片规则释放数据库表空间,引入“热点库-历史库”两级存储机制减少应用对flash高速存储资源的需求,使用容器化、虚拟化、动态扩缩容等多种手段提升部署密度,已经取得阶段性成果。预计全部调整结束后,可释放20~30T存储资源,腾出20多台物理服务器,CPU平均利用率提升200%,内存利用率提升100%
规范上云动作
针对今年比较繁重的上云任务,平台组配合规划处抓早动快,确保上云目标完成。一月即确定各中心上云接口人制度,负责本中心的相关系统上云的推进工作,并通过月例会,双周报方式紧盯上云进度,及时发现、解决问题。
工作推进内容包括上云方案评审、资源落实、上云进度及上云后评估等内容。各系统上云技术方案包括上云目标、IaaS层方案(云化部署方案与网络方案)、PaaS层方案(PaaS组件及资源需求)、SaaS层方案(微服务架构设计、前后端分离设计、云桥应用、云眼应用、云道应用)、配套方案(数据迁移、割接方案、信息与安全)等内容,比较全面地反映了系统的上云路线和最终形态。上云方案评审组通过集中培训和点对点辅导的方式,在方案制定过程中查缺补漏,如保证上云系统符合计划的上云等级(L1~L3);有公网需求的系统需要给出安全合理的DMZ区部署方案;各组件资源申请的预估用量需基于现网数据量和上云后年增长量合理估算;涉及到去商业数据库的系统必须补充数据割接方案等。
到3月15日前,完成了全部系统的上云方案评审,并制定准确的资源计划,指导平台扩容。到三月底,已经完成大部分系统的平台开发、测试权限及资源分配。
提升上云团队能力
为了落实集团关于全面上云的技术要求,保证上云的效果,需要自有人员和合作厂商都能够深入理解上云顶层设计,熟练掌握上云工具,运维团队也需要具备熟练使用PaaS平台提供的运维工具及云眼系统的能力,做好应用上云后的运维保障工作。为了达成这一目标,开展了多项上云技能培训工作,帮助应用上好云,用好云。

针对合作厂商对云翼、云道、云眼和云桥等四云技术底座不熟悉的情况,2月2日起通过线上、线下结合的方式,对上云团队进行了“四云”应用培训。培训内容涵盖集团对于上云工作的相关规范及要求、上云技术方案的编制要求以及四云平台的实操演示,为后续内部上云工作打下良好基础。2月24日组织云网部、NOC、ICT部、号百、移互部和相关厂商开展PaaS平台组件培训及四云平台帮助高效上云系列培训,向产品部介绍内部上云经验,为客户上云提供支持。

系统处也多次组织PaaS组件的相关开发培训,包含组件开发指南、组件应用端设计及开发规范,比如数据库相关的teledb开发指南及规范约束、SQL审核工具应用,分布式消息相关的ctg-mq应用端设计及开发规范,帮助上云系统开发团队使用PaaS平台交付高质量应用;针对新增组件,平台组也组织相关应用方,通过技术研讨和技术交流的方式,共同提升对telepg、ctg-gdb等新组件的应用、维护技能水平。

通过上云实践的锤炼,实施团队对目标更加清晰了,运维团队掌握更丰富的1上云运维工具和运维技能,平台和和应用实现了更高效的协同,自研自维团队也在成长。2021年,我们的全面上云工作已经踏出了坚实的第一步。  
2021.4 上海云网运营部 周昱昕
文章转载自中国电信云荐社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论