ETL简介
- ETL是英文Extract-Transform-Load的缩写。
- 用来描述将数据从源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
- 它能够对各种分布的、异构的源数据(如关系数据)进行抽取。
- 按照预先设计的规则将不完整数据、重复数据以及错误数据等“脏"数据内容进行清洗。
- 得到符合要求的“干净”数据,并加载到数据仓库中进行存储。
这些“干净”数据就成为了数据分析、数据挖掘的基石。
ETL重要性
- ETL是实现商务智能(Business Intelligence,BI)的核心。
- 一般情况下,ETL会花费整个BI项目三分之一的时间,因此ETL设计得好坏直接影响BI项目的成败。
ETL工具有哪些
- datastage (收费)
最专业的ETL工具, 2005年被IBM收购,目前发展到11.7版本。 - informatica (收费)
informatica创立于1993年,专业程度与Datastage旗鼓相当。 - ODI (收费)
oracle数据库厂商提供的工具,有局限性,与oracle数据库耦合太深。 - kettle(免费)
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定,但学习及维护成本太高。 - etl-engine (免费)
用go语言实现的ETL工具,轻量级引擎、跨平台(windows,linux,unix,mac)、可嵌入go语言脚本并解析执行,方便集成到各种项目中.
参考资料
[免费下载](https://github.com/hw2499/etl-engine/releases) [etl-engine使用手册](https://github.com/hw2499/etl-engine) [etl-crontab使用手册](https://github.com/hw2499/etl-engine/wiki/etl-crontab%E8%B0%83%E5%BA%A6) [嵌入脚本开发](https://github.com/hw2499/etl-engine/wiki/%E5%B5%8C%E5%85%A5%E8%84%9A%E6%9C%AC%E5%BC%80%E5%8F%91)
复制
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
etl工具可以尝试下ETLCloud,提供很多数据集成和转换功能,支持多种数据源的连接和转换操作,包括数据格式转换、数据清洗、字段映射等操作,能够将转换后的数据加载到目标系统中,可视化操作界面,刚进门也能快速上手
1年前

评论
相关阅读
【MySQL 30周年庆】MySQL 8.0 OCP考试限时免费!教你免费领考券
墨天轮小教习
452次阅读
2025-04-25 18:53:11
墨天轮个人数说知识点合集
JiekeXu
444次阅读
2025-04-01 15:56:03
MySQL数据库当前和历史事务分析
听见风的声音
426次阅读
2025-04-01 08:47:17
MySQL 30 周年庆!MySQL 8.4 认证免费考!这次是认真的。。。
严少安
403次阅读
2025-04-25 15:30:58
外国CTO也感兴趣的开源数据库项目——openHalo
小满未满、
402次阅读
2025-04-21 16:58:09
MySQL 生产实践-Update 二级索引导致的性能问题排查
chengang
390次阅读
2025-03-28 16:28:31
【活动】分享你的压箱底干货文档,三篇解锁进阶奖励!
墨天轮编辑部
358次阅读
2025-04-17 17:02:24
MySQL 9.3 正式 GA,我却大失所望,新特性亮点与隐忧并存?
JiekeXu
355次阅读
2025-04-15 23:49:58
9.9 分高危漏洞,尽快升级到 pgAdmin 4 v9.2 进行修复
严少安
353次阅读
2025-04-11 10:43:23
3月“墨力原创作者计划”获奖名单公布
墨天轮编辑部
331次阅读
2025-04-15 14:48:05