gbase慢sql优化案例

某省某市某县某镇第一DBA 2023-09-15

193

Sql: select

a.u_id,

b.b_id,

c.c_id,

from a.a a

left join b.b b on a.u id=b.u_id

left join c.c c on b.c_id=c.c_id

limit 100000;

首先把 sql 拿到生产测试发现确认要很长时间，跑了几分钟根本跑不出来。

尝试去除一个 left join 条件，等了一会跑出来了

耗时 1 分 50 秒

再看表数据量

a 表四万条记录

b 表将近八千万条记录

查询方式也符合查询逻辑大小表关联查询一般用小表驱动大表

尝试用 in 看能不能快点

有一定的提升但是根据业务逻辑需要用到 b 表中很多的字段而 in 后面的字段只能有一个。

改变思路看表的分布方式

复制表：isReplicate=YES

hash 分布表：hash_column= col_name，分布键是 col_name

随机分布表：isReplicate=NO，hash_column=null

可以看到小表 a 是随机分布表

大表 b 是哈希分布表

再看执行计划

显示界面主要组成部分：

ID：SQL 执行步骤，顺序从下向上

MOTION：某个步骤的结果处理方式

OPERATION：某个步骤内的具体执行操作

TABLE：某个 operation 涉及的表

CONDITION：某个 operation 操作涉及的条件

可以看到 Motion 列有个 BROADCAST 步骤

因为小表是随机分布即使大表是哈希分布也无法走分布键所以小表拉了复制表

这个笔者理解应该是类似重广播就是每一个节点都会有一份复制表

测试如果小表加上分布键会不会提升查询速度

因为 Gbase 无法在表建成后加分布键所以新建一张测试表

需要注意括号内的字段加单引号

再将数据导入

测试

结果是毫秒级如果不加分布键则需要 1 分 50 秒

再看执行计划

没有了 BROADCAST 这个步骤

将结果与建议反馈业务侧

gbase sql sql优化

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

【版权声明】本文为墨天轮用户原创内容，转载时必须标注文章的来源（墨天轮），文章链接，文章作者等基本信息，否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容，欢迎发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

评论

相关阅读

关注

获得了33次点赞

内容获得10次评论

获得了11次收藏

TA的专栏

收录1篇内容

热门文章

gbase 将数据导出到本机

2023-09-18 1184浏览

pg数据库索引坏块导致autovacuum失效,failed to re-find parent key in index

2023-10-10 753浏览

pg数据库安装及主从搭建

2023-09-12 689浏览

mysql临时表空间目录写满报错Incorrect key file for table '/tmp/#******.MYI';try to repair it.

2023-11-01 517浏览

gbase 创建用户和用户组

2023-09-11 454浏览

最新文章

《2405学习》postgresql数据txid 事务年龄回卷。

2024-05-08 395浏览

《2401学习》postgresql中多表的连接方式

2024-02-26 346浏览

《2401学习》postgresql的堆表结构

2024-01-10 323浏览

《2312学习》pg_profile部署pgawr报告

2023-12-06 315浏览

《2311学习》postgresql的物理结构

2023-11-27 223浏览