
尚硅谷大数据技术之 Kettle
———————————————————————————
——
更多 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网
尚硅谷大数据技术之 Kettle
(作者:尚硅谷大数据研发部)
版本:V2.0
第 1 章 Kettle 概述
1.1 ETL 简介
ETL(Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于企业或
行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种 ETL
工具的使用,必不可少。
市面上常用的 ETL 工具有很多,比如 Sqoop,DataX,Kettle,Talend 等,作为一个大
数据工程师,我们最好要掌握其中的两到三种,这里我们要学习的 ETL 工具是 Kettle!
1.2 Kettle 简介
1.2.1 Kettle
是什么
Kettle 是一款国外开源的 ETL 工具,纯 java 编写,可以在 Window、Linux、Unix 上运
行,绿色无需安装,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员 MATT 希望把各种数据放到一个壶里,然
后以一种指定的格式流出。
Kettle 这个 ETL 工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化
的用户环境来描述你想做什么,而不是你想怎么做。
Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础
转换,job 则完成整个工作流的控制。
Kettle(现在已经更名为 PDI,Pentaho Data Integration-Pentaho 数据集成)。
文档被以下合辑收录
相关文档
评论