作者
digoal
日期
2022-06-10
标签
PostgreSQL , 点 , 行 , 时序
时序数据可以行存, 也可以点存, 到底怎么选择?
- 行存的优势, 查询行(或者行中的大量点)比较高效, 因为这些value密集存储在集中的block中.
- 当需要查询大量连续的单点时, 行存就比较吃亏, 因为在同一行中没有被查到的点也会被扫描到, 浪费IO和buffer. 这种情况使用点存(列存)就比较好.
- 当然在OLAP场景也比较适合列存, 因为OLAP场景通常也是少量列的大量数据扫描和计算, 列存省IO, 同时能使用到向量化技术加速计算.
列存如何拼出同一行记录?
- 可以使用PK(固定或可变长度列通用)或offset(仅适用于固定长度列)把同一行的各列串起来.
PostgreSQL默认是HEAP表, 怎么把宽表转成点表?
- 使用rule即可.
例子
创建宽表(表示传感器采集的所有维度(点), 例如这里有8个维度加时间字段).
create table t (ts timestamp primary key, c1 int, c2 int, c3 int, c4 text, c5 int, c6 int, c7 int, c8 int);
复制
创建点表
create table t1 (ts timestamp primary key, c1 int); create table t2 (ts timestamp primary key, c2 int); create table t3 (ts timestamp primary key, c3 int); create table t4 (ts timestamp primary key, c4 text); create table t5 (ts timestamp primary key, c5 int); create table t6 (ts timestamp primary key, c6 int); create table t7 (ts timestamp primary key, c7 int); create table t8 (ts timestamp primary key, c8 int);
复制
创建规则, 写入宽表时, 将数据分散到点表, 带上TS字段把同一行的各列串起来.
create rule r1 as on insert to t do instead ( insert into t1 values (NEW.ts, NEW.c1); insert into t2 values (NEW.ts, NEW.c2); insert into t3 values (NEW.ts, NEW.c3); insert into t4 values (NEW.ts, NEW.c4); insert into t5 values (NEW.ts, NEW.c5); insert into t6 values (NEW.ts, NEW.c6); insert into t7 values (NEW.ts, NEW.c7); insert into t8 values (NEW.ts, NEW.c8) );
复制
写入测试, 写入宽表, 数据会自动转换到点表里面:
postgres=# insert into t values (now(),1,1,1,'test',1,1,1,1); INSERT 0 1 postgres=# select * from t; ts | c1 | c2 | c3 | c4 | c5 | c6 | c7 | c8 ----+----+----+----+----+----+----+----+---- (0 rows) postgres=# select * from t1; ts | c1 ----------------------------+---- 2022-06-10 15:22:41.916042 | 1 (1 row) postgres=# select * from t2; ts | c2 ----------------------------+---- 2022-06-10 15:22:41.916042 | 1 (1 row) postgres=# select * from t3; ts | c3 ----------------------------+---- 2022-06-10 15:22:41.916042 | 1 (1 row) postgres=# select * from t4; ts | c4 ----------------------------+------ 2022-06-10 15:22:41.916042 | test (1 row) postgres=# select * from t5; ts | c5 ----------------------------+---- 2022-06-10 15:22:41.916042 | 1 (1 row) postgres=# select * from t6; ts | c6 ----------------------------+---- 2022-06-10 15:22:41.916042 | 1 (1 row) postgres=# select * from t7; ts | c7 ----------------------------+---- 2022-06-10 15:22:41.916042 | 1 (1 row) postgres=# select * from t8; ts | c8 ----------------------------+---- 2022-06-10 15:22:41.916042 | 1 (1 row)
复制
性能如何?
postgres=# \timing Timing is on. postgres=# insert into t select clock_timestamp(),1,1,1,'test',1,1,1,1 from generate_series(1,100000); INSERT 0 100000 Time: 791.200 ms postgres=# insert into t select clock_timestamp(),1,1,1,'test',1,1,1,1 from generate_series(1,300000); INSERT 0 300000 Time: 2233.316 ms (00:02.233) public | t | table | postgres | permanent | heap | 8192 bytes | public | t1 | table | postgres | permanent | heap | 17 MB | public | t2 | table | postgres | permanent | heap | 17 MB | public | t3 | table | postgres | permanent | heap | 17 MB | public | t4 | table | postgres | permanent | heap | 17 MB | public | t5 | table | postgres | permanent | heap | 17 MB | public | t6 | table | postgres | permanent | heap | 17 MB | public | t7 | table | postgres | permanent | heap | 17 MB | public | t8 | table | postgres | permanent | heap | 17 MB |
复制
按点来换算的话, 每秒101万个点.
硬件如下
苹果笔记本 MacBook Pro (13-inch, 2019, Four Thunderbolt 3 ports) 2.4 GHz 四核Intel Core i5 16 GB 2133 MHz LPDDR3 256G disk
复制
期望 PostgreSQL 增加什么功能?
PolarDB for PostgreSQL云原生分布式开源数据库
PostgreSQL 解决方案集合
德哥 / digoal's github - 公益是一辈子的事.
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
王炸!OGG 23ai 终于支持从PostgreSQL备库抽取数据了
曹海峰
408次阅读
2025-03-09 12:54:06
玩一玩系列——玩玩login_hook(一款即将停止维护的PostgreSQL登录插件)
小满未满、
376次阅读
2025-03-08 18:19:28
明明想执行的SQL是DELETE、UPDATE,但为什么看到的是SELECT(FDW的实现原理解析)
小满未满、
355次阅读
2025-03-19 23:11:26
PostgreSQL初/中/高级认证考试(3.15)通过考生公示
开源软件联盟PostgreSQL分会
310次阅读
2025-03-20 09:50:36
IvorySQL 4.4 发布 - 基于 PostgreSQL 17.4,增强平台支持
通讯员
199次阅读
2025-03-20 15:31:04
套壳论
梧桐
196次阅读
2025-03-09 10:58:17
命名不规范,事后泪两行
xiongcc
185次阅读
2025-03-13 14:26:08
PG vs MySQL 执行计划解读的异同点
进击的CJR
125次阅读
2025-03-21 10:50:08
版本发布| IvorySQL 4.4 发布
IvorySQL开源数据库社区
115次阅读
2025-03-13 09:52:33
宝藏PEV,助力你成为SQL优化高手
xiongcc
115次阅读
2025-03-09 23:34:23
热门文章
阿里巴巴的使命、愿景、核心价值观
2021-01-04 67573浏览
MacOS 关闭和开启虚拟内存(swap)
2022-01-20 17498浏览
[珍藏级] PostgreSQL ssl 证书配置 - 防止中间攻击者 - 以及如何使用证书无密码登录配置cert
2020-06-19 16450浏览
PostgreSQL md5hash插件 - 128bit 存储,压缩空间、提升效率
2019-11-08 14326浏览
产品与运营-OKR的设计、总结、复盘、规划、组织保障和考核例子
2022-01-20 13060浏览
最新文章
PostgreSQL 15 preview - PostgreSQL 15 pg_stat_statements 增加对temp file blocks io timing的统计, 增加JIT的统计.
2022-01-20 265浏览
德说-第92期, 怎么解决躺平|不想奋斗?
2022-01-20 297浏览
PostgreSQL 增量物化视图插件 - pg_ivm incremental materialized view maintenance
2022-01-20 1371浏览
PostgreSQL 15 preview - ARM多核适配 性能提升 - Use ISB as a spin-delay instruction on ARM64
2022-01-20 762浏览
PostgreSQL 15 preview - recovery(包括崩溃恢复、逻辑流复制、物理流复制、归档恢复) 加速, 支持异步prefetch 预读接下来要恢复的wal record相关的data block到shared buffer
2022-01-20 1196浏览