PolarDB PostgreSQL版(以下简称 PolarDB-PG)是一款阿里云自主研发的企业级数据库产品,采用计算存储分离架构,兼容 PostgreSQL 与 Oracle。PolarDB-PG 的存储与计算能力均可横向扩展,具有高可靠、高可用、弹性扩展等企业级数据库特性。同时,PolarDB-PG 具有大规模并行计算能力,可以应对 OLTP 与 OLAP 混合负载;还具有时空、向量、搜索、图谱等多模创新特性,可以满足企业对数据处理日新月异的新需求。
本节介绍利用PolarDB PostgreSQL版的HTAP能力加速TPC-H的执行的最佳实践案例。本案例将基于单机本地存储来运行。
前期准备
部署PolarDB for PostgreSQL
在运行前,默认已经通过参考搭建基于单机本地存储的实例部署好本地多节点HTAP实例,总计1个主节点(运行于5432端口)和2个只读节点(运行于5433/5434端口)。可以通过下面的命令来验证:
ps xf
复制
会看到如下的三个进程,1个主节点(运行于5432端口),2个只读节点(运行于5433/5434端口):
生成TPC-H测试数据集
TPC-H是专门测试数据库分析型场景性能的数据集,一共有22条分析型场景下的SQL。用TPC-H可以有效测试PolarDB for PostgreSQL的HTAP的能力。我们将通过tpch-dbgen工具来生成任意大小的数据集。
# 下载tpch-dbgen
git clone https://github.com/qiuyuhang/tpch-dbgen.git
# 编译代码
cd tpch-dbgen
make
复制
执行如下命令,生成模拟数据:
建议先按照该命令,从10 GB大小的数据开始生成。体验完本案例后还可尝试100 GB的数据,即将该命令行中的10替换为100。注意不要超过本机外存容量。
# 生成10 GB数据
./dbgen -s 10
复制
tpch-dbgen中包含的文件的说明:
- 后缀为
.tbl
表示生成的表数据 queries/
中存放的是 TPC-H 的 22 条 SQL- 含有
explain
的.sql
文件只打印计划,并不实际执行 answers/
中存储了 TPC-H 中 22 条 SQL 的执行结果
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
2025年2月国产数据库大事记
墨天轮编辑部
959次阅读
2025-03-05 12:27:34
阿里云李飞飞:将大模型,装进数据库里
科技行者
392次阅读
2025-02-28 11:47:59
云和恩墨亮相PolarDB开发者大会,与阿里云深化数据库服务合作
云和恩墨
299次阅读
2025-02-28 09:31:16
神州数码携手云原生数据库 PolarDB,共筑国产数据库新生态
神州数码集团
167次阅读
2025-03-03 18:04:27
IDC:2024上半年中国分布式事务数据库软件市场规模为1.5亿美元,同比增长18.5%,阿里、腾讯与华为位列前三
通讯员
160次阅读
2025-03-03 10:01:48
阿里云Tair KVCache:打造以缓存为中心的大模型Token超级工厂
阿里云瑶池数据库
81次阅读
2025-03-25 10:37:41
阿里云PolarDB重磅发布云原生与Data+AI新特性,打造智能时代数据引擎
阿里云瑶池数据库
47次阅读
2025-02-28 14:54:31
正式公测|阿里云数据库Tair Serverless KV,轻松应对流量波动
阿里云瑶池数据库
46次阅读
2025-03-05 11:09:23
庖丁解InnoDB之B+Tree (三)
olep
42次阅读
2025-03-04 11:14:02
阿里云谈AI下半场 数据库已经开始比拼性价比
通讯员
41次阅读
2025-03-06 09:56:21