暂无图片
暂无图片
2
暂无图片
暂无图片
暂无图片

如何优化Vertica的group by操作

2276

image.png
vertica 如何group by语句?想要知道数据库语句的实际执行情况,都是需要先查看执行计划的,Vertica也不例外。先对语句进行explain 操作查看预执行计划,其中group by 分为 GROUPBY PIPELINED 和 GROUPBY HASH,通过执行计划可以清楚的看到vertica到底采用的那种执行方式,优化一般就是吧GROUPBY HASH优化为GROUPBY PIPELINED。

CREATE TABLE sortopt ( a INT NOT NULL, b INT NOT NULL, c INT, d INT ); CREATE PROJECTION sortopt_p ( a_proj, b_proj, c_proj, d_proj ) AS SELECT * FROM sortopt ORDER BY a,b,c UNSEGMENTED ALL NODES; INSERT INTO sortopt VALUES(5,2,13,84); INSERT INTO sortopt VALUES(14,22,8,115); INSERT INTO sortopt VALUES(79,9,401,33);

1. 第一种情况

GROUP BY a GROUP BY a,b GROUP BY b,a GROUP BY a,b,c GROUP BY c,a,b

image.png
image.png
如果是按照上面的这种group by 则使用的是GROUPBY PIPELINED,因为group by 后的字段全部在projection中预排序

GROUP BY a,b,c,d

image.png
image.png
这种情况则是采用的GROUPBY HASH ,不建议!

2.第二种情况

GROUP BY a,c

执行 按照GROUPBY HASH 因为a,c字段没有相邻,如果是GROUP BY a,c或者GROUP BY b,c则会按照GROUPBY PIPELINED 执行。

3.第三种情况
group by 之前有 where条件时:

SELECT a FROM tab WHERE a = 10 GROUP BY b 此时按照 GROUPBY PIPELINED;
SELECT a FROM tab WHERE a = 10 GROUP BY c 此时按照 GROUPBY HASH 以为按照c排序的处理的所有的 Projectionn 列的列未出现在 where 子句等值条件中,如果上如改为SELECT a FROM tab WHERE a = 10 and b=10 GROUP BY c 则会按照GROUPBY PIPELINED 执行

通过以上3中情况的介绍,希望大家对vertica的group by有一定的理解,能够在使用group 中更好的优化查询性能。

最后修改时间:2022-07-06 10:25:10
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论