3、Kettle导入工具:映射并执行数据处理流程的步骤,适用于非常大的数据集,特别是如果开发人员已经熟悉使用此工具(此章节不涉及)。
1、load CSV Cypher 命令
//查看前csv文件行数,但不入库
load csv from 'file:///companies.csv' as line
return count(*)
//查看csv文件前5行
load csv from 'file:///companies.csv' as line
return line
limit 5
//查看csv文件前5行,带表头
load csv with headers from 'file:///companies.csv' as line
return line
limit 5
//读取E:companies.csv
load csv from 'file:///E:/companies.csv' as line
return line
limit 5
//跳过空数据,入库
load csv from 'file:///E:/companies.csv' as line
WITH line WHERE line.Id IS NOT NULL
MERGE (c:Company {companyId: line.Id});
//加入case操作
LOAD CSV WITH HEADERS FROM 'file:///companies.csv' AS row
WITH row WHERE row.Id IS NOT NULL
WITH row,
(CASE row.BusinessType
WHEN 'P' THEN 'Public'
WHEN 'R' THEN 'Private'
WHEN 'G' THEN 'Government'
ELSE 'Other' END) AS type
MERGE (c:Company {companyId: row.Id, hqLocation: coalesce(row.Location, "Unknown")})
SET c.emailAddress = CASE trim(row.Email) WHEN "" THEN null ELSE row.Email END
SET c.businessType = type
RETURN count(c);
复制
上述操作都是在浏览器工具里可以直接操作,csv文件放置在相应位置。
如果要导入大量数据的CSV文件,则可以使用PERODIC COMMIT子句。使用PERODIC COMMIT指示Neo4j在执行完一定行数后提交数据在继续,这样减少了内存开销。默认是1000行提交一次。使用方法如下:
//每500行提交一次。
USING PERIODIC COMMIT 500
load csv from 'file:///E:/companies.csv' as line
WITH line WHERE line.Id IS NOT NULL
MERGE (c:Company {companyId: line.Id});
复制
从Neo4j2.2版本开始,系统就自带了一个大数据量的导入工具:neo4j-admin import,可支持并行,可扩展的大规模CSV数据导入。neo4j-admin import工具允许通过指定节点文件和关系文件将 CSV 数据导入空数据库。首先,在neo4j系统目录下的/bin/neo4j-import路径下找到这个工具的可执行文件。使用示例:
bin/neo4j-admin import --database orders 创建一个名为orders的新数据库
--nodes=Customer=customers.csv //--nodes 表示CSV文件是节点
--nodes=products.csv
--nodes=Order="orders_header.csv,orders1.csv,orders2.csv"
--relationships=CONTAINS=order_details.csv //--relationsship表示文件是关系
--relationships=ORDERED="customer_orders_header.csv,orders1.csv,orders2.csv"
--trim-strings=true
复制
- 本期完 -

为方便看最新内容,长按下图图片记得关注哦!
文章转载自Neo4j权威指南,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
数据库国产化替代深化:DBA的机遇与挑战
代晓磊
1200次阅读
2025-04-27 16:53:22
2025年3月国产数据库中标情况一览:TDSQL大单622万、GaussDB大单581万……
通讯员
881次阅读
2025-04-10 15:35:48
2025年4月国产数据库中标情况一览:4个千万元级项目,GaussDB与OceanBase大放异彩!
通讯员
683次阅读
2025-04-30 15:24:06
数据库,没有关税却有壁垒
多明戈教你玩狼人杀
584次阅读
2025-04-11 09:38:42
天津市政府数据库框采结果公布,7家数据库产品入选!
通讯员
574次阅读
2025-04-10 12:32:35
国产数据库需要扩大场景覆盖面才能在竞争中更有优势
白鳝的洞穴
560次阅读
2025-04-14 09:40:20
【活动】分享你的压箱底干货文档,三篇解锁进阶奖励!
墨天轮编辑部
491次阅读
2025-04-17 17:02:24
一页概览:Oracle GoldenGate
甲骨文云技术
467次阅读
2025-04-30 12:17:56
GoldenDB数据库v7.2焕新发布,助力全行业数据库平滑替代
GoldenDB分布式数据库
458次阅读
2025-04-30 12:17:50
优炫数据库成功入围新疆维吾尔自治区行政事业单位数据库2025年框架协议采购!
优炫软件
353次阅读
2025-04-18 10:01:22