暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

MongoDB “升级项目” 大型连续剧(1)-- 可“生”可不升

AustinDatabases 2025-04-15
25

开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共2790人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9)(1 2 3 4 5 6 7群均已爆满,开8群260+ 9群)

最近开始要迁移公司的大量的MONGODB到新版本,基于一个迁移并不是光会技术就可以了,我将开启一个MOGNODB 迁移连续剧,将整个的过程进行记录,让一个完整的迁移项目呈现给大家,还是那句话如果你光会技术,那只是你存活的必要条件,而不是充分条件。

第一集:非必要不升级与怎么干这个活

几十个MongoDB从我来的时候3.X已经升级到了4.X,当时我记得MOGNODB已经发布了6.0,当时没有升级到更高版本的主要原因,我回忆了一下。

1  当时大部分的MongoDB在3.2,3.6这个版本,升级的跨度不能太大,当时的应用程序在调试spring boot 的spring data mongodb 好像并不能良好的支持超过4.X以上的MongoDB

2 当时云厂商在云上支持的主流MongoDB为4.X ,5.0也支持,但用过云的都明白,暂不建议的意思。

所以基于稳定性和版本迁移的多方面原因,迁移是通过mongoshake 来进行的,整体迁移经历了半年,终于将所有的MONGODB 从3.X 变更到了 4.X。

时光如梭,岁月如何,我又老了几岁,MOGNODB已经发展到了8.0,基于某些原因我们提出过升级,但项目和业务并不CARE ,不牵扯利益的事情,有谁来想做。

最终非必要不升级是大多数甲方公司的使用数据库的日常场景,有PG用9.X的,有MYSQL用5.6的,还有REDIS 用2.8的,MONGODB 用3.2的,是的这就是现实。

但如果掌握的互相制衡和利益牵扯的,高阶DBA架构是不会放弃催动升级机会的能量,因为MONGODB4.2版本有一个问题compact无法在线回收删除数据的磁盘空间。

同时还有其他的问题如:在 MongoDB 4.2 及更低版本中,执行 compact 可能导致节点临时进入 RECOVERING 状态。若 hidden 节点被监控系统判定为不可用,可能触发自动重搭(replSet 重建节点)

compact 操作期间,hidden 节点可能因锁阻塞无法同步 oplog,导致与主节点的数据延迟增大,影响延迟节点的备份或分析功能。compact 通过重排数据文件回收空间,但在 4.2 版本中,若集合数据分布不均(如存在大量小碎片或 Jumbo Chunk),可能无法有效回收空间,甚至因无法满足压缩条件直接退出

而项目部门最近一直在优化成本,而他们一直以为删除了数据后,磁盘就会退回给系统,在MongoDB这里碰了一辈子灰后,且在云厂商给出了一个不顾公司死活的方案后,我给出了致命一击,把架构和某宇宙云的MOGNODB Service 大打一架,最终在我的努力下,重新开启的MONGODB的升级项目。

在升级中,很多人认为数据库升级就是数据库的问题,如果是初级的DBA就是那种干了1-2年的说出这话不怪他,没见过世面吗? 如果干了多年还说这话,你呀......!

一个数据库升级首先要带着架构和开发,因为数据库升级成功这事情是谁来判断,业务来判断成功,最终你的工作有没有成果是业务和开发说了算,你不带上他们你自己升级数据库产品,那是脑子让驴踢了。

迁移第一步:将困难说出来,将需要牵扯的人,牵扯进来,团结一切可以团结的力量,并且把能测试到的优点和缺点都测出来。

我是这样做的

1  将版本升级的功能特性列表,将可以升级的目标版本的优缺点进行了总结。当然如果你要把所有的优点都写出来是没有必要的,你列出一些开发关注的,对业务有帮助的优点,且同时你要发现版本中与业务和开发有抵触的严重的问题,放到你不推荐的版本中。

image

2  将升级可能带来的问题说清楚如:在升级中无法进行DDL操作,TTL索引会出现丢数据的可能,升级后语法变化特性,4.X升级后,5.0 6.0 7.0 等版本中的 writeConcern {w:1} 写法变为 {w:majority} 一些列的问题提出

3 学习目标新版本MONGODB 的特性,操作和语法的不同,以及一些原理的改变等等。

这些我后期再继续写。

下面主要的是要说说,如何进行测试,来证明升级后对原有系统的影响。

原有的系统是在阿里云上的4.2产品,需要迁移到MONGODB 6.0 根据业务的特性我们梳理出来需要对数据的插入和数据的更新两个部分进行操作。

这里我们可以选择成熟的测试工具,但部署和使用都比较麻烦,我这边采用通过NODE.JS来撰写相关的测试脚本,灌入数据,批量进行更新,因为测试只是找出不同而已,并没有特别严谨的测试要求,目的是找出性能的不同。

这里我把部分的测试脚本写到文章里面,在操作中将操作的时间打印出来,方便进行观察,同时匹配相关的数据库的监控图。(node.js简易测试程序)

var dbName = "test_pre";
var collectionName = "perf_test";
var dataSize = 100000; 插入数据量
var queryCount = 100000; 更新次数

// 连接到数据库
var conn = new Mongo("");
var db = conn.getDB(dbName);
var collection = db.getCollection(collectionName);

// 打印开始时间
print(`[${new Date().toISOString()}] Script started.`);

// 清空集合
print('[INFO] Clearing collection...');
collection.deleteMany({});
print('[INFO] Collection cleared');

// 创建索引
print('[INFO] Creating indexes...');
collection.createIndex({ _id: 1 });
print('[INFO] Indexes created');

// 插入数据
print('[INFO] Starting inserts...');
var insertStart = new Date();
for (var i = 0; i < dataSize; i++) {
  collection.insertOne({ _id: i, randomValue: "test", status: "active", createdAt: new Date() });
}
var insertEnd = new Date();
print('[INFO] Inserts completed in ' + (insertEnd - insertStart) + 'ms');

// 更新数据
print('[INFO] Starting updates...');
var updateStart = new Date();
for (var i = 0; i < queryCount; i++) {
  var randomId = Math.floor(Math.random() * dataSize); 随机选择一个 _id
  collection.updateOne({ _id: randomId }, { $set: { status: 'updated' } });
}
var updateEnd = new Date();
print('[INFO] Updates completed in ' + (updateEnd - updateStart) + 'ms');

// 打印结束时间
print(`[${new Date().toISOString()}] Script finished.`);

复制

这里引入一个问题,在测试中如果测试不及你的预期怎么办,比如你想的是 MONGODB 6.0应该比你MOGNODB 4.2的数据库在各项操作中都会快,在测试中无法达到这个水平,你怎么去发现没有达到这个水平的原因是什么,这个也是一个问题,我们后面MONGODB升级连续剧继续说。

这里通过测试脚本,UPDATE的速度明显MOGNODB 6.0是有优势的,快乐有30多秒的速度,看来升级的确有优势。

当然后面还有很多工作要做,要知道后续,尽请关注!!

MOGNODB 6.0测试 100万数据UPDATE
MongoDB 4.2测试100万数据UDPATE

置顶
美国知名大学开授China数据库理论,你没看错!
DBA 会架构,实际案例分析--“IT流氓”得下跪
数据库的 4月1日 愚人节,我没有被愚弄 !
搞 PostgreSQL多才多艺的人--赵渝强 《PG数据库实战派》
追逐太阳的男人--林春 《金融数据库转型实战》
数据库的 4月1日 愚人节,我没有被愚弄 !
数据库界的“申公豹”,带云DBA走出--救生筏困境!
阿里云DTS 产品,你真让我出离愤怒,3年了病还没治好???
让数据先“活”起来,如何实现数据在企业中的最大价值
专访唐建法-从MongoDB中国第一人到TapData掌门人的故事
ETL 行业也够卷,云化ETL,ETL 软件不过了
天上的“PostgreSQL”  说 地上的 PostgreSQL 都是“小垃圾”
宇宙的“PostgreSQL” 说 “地球上的PG” 都是“小垃圾”
云数据库核爆在内部,上云下云话题都是皮外伤!--2025云数据库专栏(二)
云原生 DB 技术将取代K8S为基础云数据库服务-- 2025年云数据库专栏(一)
临时工:数据库人生路,如何救赎自己  -- 答某个迷茫DBA的职业咨询
阿里云DTS 产品,你真让我出离愤怒,3年了病还没治好???


PostgreSQL 相关文章


PostgreSQL的"犄角旮旯"的参数捋一捋

PostgreSQL逻辑复制槽功能

PostgreSQL 扫盲贴 常用的监控分析脚本

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL  添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景
PostgreSQL 的搅局者问世了,杀过来了!
PostgreSQL SQL优化用兵法,优化后提高 140倍速度
PostgreSQL 运维的难与“难”  --上海PG大会主题记录
PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?
PostgreSQL 迁移用户很简单 ---  我看你的好戏

PostgreSQL 用户胡作非为只能受着 --- 警告他

全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始
PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁

PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!

病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)
PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜

PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆

PostgreSQL 如何通过工具来分析PG 内存泄露

PostgreSQL  分组查询可以不进行全表扫描吗?速度提高上千倍?

POSTGRESQL --Austindatabaes 历年文章整理

PostgreSQL  查询语句开发写不好是必然,不是PG的锅

PostgreSQL  字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"
PostgreSQL  Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)
PostgreSQL   玩PG我们是认真的,vacuum 稳定性平台我们有了
PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)

DBA 失职导致 PostgreSQL 日志疯涨



OceanBase 相关文章
OceanBase 6大学习法--OBCA视频学习总结第六章
OceanBase 6大学习法--OBCA视频学习总结第五章--索引与表设计
OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计
OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装
OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎
OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)
OceanBase 6大学习法--OB上手视频学习总结第一章
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
OceanBase  送祝福活动,礼物和幸运带给您

跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)

跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)

跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)

跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)

聚焦SaaS类企业数据库选型(技术、成本、合规、地缘政治)

OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB


PolarDB 相关文章

        PolarDB MySQL 加索引卡主的整体解决方案

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL 的搅局者问世了,杀过来了!

在被厂商围剿的DBA 求生之路 --我是老油条

POLARDB  添加字段 “卡” 住---这锅Polar不背

PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)

在被厂商围剿的DBA 求生之路 --我是老油条

PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)

PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火




MySQL相关文章
MySQL SQL优化快速定位案例 与 优化思维导图
"DBA 是个der" 吵出MySQL主键问题多种解决方案
MySQL 怎么让自己更高级---从内存表说到了开发方式
MySQL timeout 参数可以让事务不完全回滚
MySQL 让你还用5.7 出事了吧,用着用着5.7崩了
MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验
用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊
MYSQL  --Austindatabases 历年文章合集

MongoDB 相关文章

MongoDB  大俗大雅,上来问分片真三俗 -- 4 分什么分

MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法

MongoDB 学习建模与设计思路--统计数据更新案例

MongoDB  大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用

MongoDB  大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模

MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通

MongoDB 年底活动,免费考试名额 7个公众号获得

MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)

MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模

MongoDB  双机热备那篇文章是  “毒”
MongoDB   会丢数据吗?在次补刀MongoDB  双机热备
MONGODB  ---- Austindatabases  历年文章合集

临时工访谈系列

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

ETL 行业也够卷,云化ETL,ETL 软件不过了


SQL SERVER 系列
SQL SERVER维保AI化,从一段小故事开始
SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗
SQL SERVER 危险中,标题不让发,进入看详情(译)



文章转载自AustinDatabases,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论