嘿,朋友们,最近我已经开始第二轮实时数仓数据湖项目更新工作了,今天我要介绍的是最近刚开发完成的数据生成平台。
该数据生成平台是一款专为实时数仓和数据湖环境设计的模拟数据生成工具。该平台能够根据用户定义的模板,自动生成符合业务场景的模拟数据,并将其写入到各种数据存储系统中,如Kafka消息队列或关系型数据库。通过这种方式,开发人员和数据分析师可以在没有真实数据的情况下,进行系统测试、性能评估和数据分析模型验证。
一、功能点介绍
目前该平台支持MySQL、Oracle、Kafka三种数据源(其他数据源还在开发中)作为目标数据源来进行模拟数据的生成写入。
1.数据源管理
在数据源管理目前可以添加Mysql,Oracle,Kafka三种数据源,用来作为后续模拟数据写入的目标库。
2. 任务管理
在任务管理模块,可以进行数据库类型、数据表或者Kafka主题的选择,同时可以指定生成数据条数,以及生产频率等信息。
3. 执行记录
在执行记录模块,可以看到任务的运行情况
二、数据生成效果查看
MySQL数据库模拟数据生成效果
2. Kafka 模拟数据生成效果
欢迎添加作者交流 加入星球获取源码
推荐阅读系列文章
建议收藏 | Dinky系列总结篇 建议收藏 | Flink系列总结篇 建议收藏 | Flink CDC 系列总结篇 建议收藏 | Doris实战文章合集 建议收藏 | Paimon 实战文章总结 建议收藏 | Fluss 实战文章总结 建议收藏 | Seatunnel 实战文章系列合集 建议收藏 | 实时离线输数仓(数据湖)总结篇 建议收藏 | 实时离线数仓实战第一阶段总结 超700star!电商项目数据湖建设实战代码 ,拿来即用! 从0到1建设电商项目数据湖实战教程 推荐一套开源电商项目数据湖建设实战代码
文章转载自大数据技能圈,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
金仓数据库26套!宁波市司法局信息系统适配改造(一期)采购项目
天下观查
321次阅读
2025-03-21 10:33:59
达梦数据与法本信息签署战略合作协议
达梦数据
300次阅读
2025-03-06 09:26:57
国产化+性能王炸!这套国产方案让 3.5T 数据 5 小时“无感搬家”
YMatrix
284次阅读
2025-03-13 09:51:26
大连农商40万,采购Greenplum数据库原厂订阅服务
天下观查
279次阅读
2025-03-13 09:52:29
国产数据库高光时刻!天翼云TeleDB荣登TPC-DS全球测评总榜第二
天翼云开发者社区
186次阅读
2025-03-13 17:24:48
DBAIOPS社区将在知衍平台上推出数据库运维智能体
白鳝的洞穴
177次阅读
2025-03-07 10:29:18
OceanBase 单机版发布,针对中小规模业务场景
通讯员
173次阅读
2025-03-28 12:01:19
为什么总是很难客观评价某个国产数据库产品
白鳝的洞穴
161次阅读
2025-03-19 11:21:09
史诗级革新 | Apache Flink 2.0 正式发布
严少安
156次阅读
2025-03-25 00:55:05
晨章数据三款分布式数据库产品全面开源,以开放向AI时代进发
晨章数据
147次阅读
2025-03-10 17:10:07