GBase 8a MPP Cluster 根据不同场景需求提供多种便于用户操作的数据迁移工具。
功能简介
GBase 8a MPP Cluster 提供了面向用户的 SQL 接口加载方式。
支持如下功能:
- 支持本地文件加载
- 支持从通用数据服务器拉取数据加载;
- 支持 FTP/HTTP/HDFS/SFTP 等多种协议;
- 支持多加载机对单表的并行加载,最大化加载性能;
- 支持普通文本、 gzip 压缩、 snappy 压缩、 lzo 压缩等多种格式数据文件加载;
- 支持普通文本与定长文本的加载,并与 V8.5.1.2 和 V86 版本格式兼容;
- 支持加载状态和信息的实时查询
- 支持错误数据溯源功能,可以准确定位错误数据在源文件中的位置;
- 加载性能可以随着集群规模的扩展而持续提升。
语法
LOAD DATA INFILE 'file_list' INTO TABLE[vcname.] [dbname.]tbl_name [options] |
file_list 说明
集群本地数据源加载:
1) 支持指定一个或多个数据节点上的本地文件进行加载。使用 file://host+abs_path,多个 file://host+abs_path 之间使用逗号分隔,支持采用直接读取模式加载指定集群数据节点的本地文件。
2) 支持指定所有数据节点并发加载各自节点上的文件。使用 file://+abs_path,多个file://+abs_path 之间使用逗号分隔,支持采用直接读取模式加载集群所有数据节点的本地文件。
集群以外的通用文件服务器上的数据源加载:
1) 通用文件服务器上需要搭建 ftp/http/hdfs/sftp 服务,并将数据文件拷贝到服务配置的路径下,保证集群节点能通过相应服务访问到数据。
2) 加载时使用 URL 的方式指定通用文件服务器上的数据文件路径,以逗号(',')作为多个文件/目录 的分隔符,格式为“ scheme://host:port/path, scheme://host:port/path”,同时文件名、目录部分均支持使用通配符,默认对路径及文件进行匹配, 如:
“ http://10.10.1.1/data/??????/*.tbl”。
复制
示例
LOAD DATA INFILE 'ftp://gbase:gbase@127.0.0.1/data/a.tbl' INTO TABLE test.t
DATA_FORMAT 3;
LOAD DATA INFILE 'http://127.0.0.1/data/b.tbl.gz' INTO TABLE test.t
DATA_FORMAT 3;
LOAD DATA INFILE 'hdp://gbase@127.0.0.1:50070/data/a.tbl.snappy' INTO
TABLE test.t DATA_FORMAT 3;
LOAD DATA INFILE 'ftp://192.168.0.1/pub/lineitem.tbl,
http://192.168.0.2/lineitem.tbl' INTO TABLE test.lineitem FIELDS
TERMINATED BY '|' ENCLOSED BY '"' LINES TERMINATED BY '\n';
复制
加载状态和结果查看示例:
-- 加载状态监控
gbase> use information_schema;
gbase> select * from load_status;
-- 显示 task_id 100 任务的从第 1 条开始的后面 5 条错误数据信息
gbase> show load logs 100 limit 1,5;
-- 显示所有 coordinator 节点上 task_id 101 任务的前 10 条错误数据信息
gbase> show gcluster load logs 101;
-- 查询所有 coordinator 节点, select 查询形式,查询加载信息,表名为:
CLUSTER_LOAD_RESULT
gbase> select * from information_schema.cluster_load_result;
复制
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
2025年5月中国数据库流行度排行榜:OB一枝独秀破 800,金仓奋起直追跻四强
墨天轮编辑部
917次阅读
2025-05-13 10:55:54
新疆维吾尔自治区行政事业单位数据库2025年框架协议采购(二次)入围结果公布
通讯员
364次阅读
2025-04-14 12:21:01
“G”术时刻:资深工程师揭秘GBase数据库Hint核心技巧 实现SQL性能跃升
GBASE数据库
123次阅读
2025-04-25 10:10:28
某头部信托公司携手GBase数据库书写普惠金融大文章
GBASE数据库
123次阅读
2025-04-24 09:53:11
“无感”通行 GBase数据库助力四川高速打造智慧交通新标杆
GBASE数据库
92次阅读
2025-04-18 10:01:17
GBase数据库备份恢复使用指南
GBASE数据库
55次阅读
2025-04-25 16:37:23
GBASE南大通用与海光信息达成战略合作
GBASE数据库
55次阅读
2025-04-23 11:19:32
GBase 8s数据库的create distinct type使用简介
GBASE数据库
52次阅读
2025-04-25 16:20:23
GBASE数据库2025年四月8a认证培训班圆满结营
GBASE数据库
37次阅读
2025-04-25 15:45:05
GBase 8a数据库to_number关联报错如何处理?
GBASE数据库
34次阅读
2025-04-25 16:43:01