暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

直播|PostgreSQL 技术内幕(六)Greenplum 排序算子

HashData 2023-02-23
363

本次直播将继续我们的 PostgreSQL 技术内幕系列,由 HashData 数据库内核研发工程师 Roseduan 跟朋友们讨论交流 Greenplum 排序算子的话题。

排序算法本身已经被广泛研究,并且排序在数据库执行器中扮演了重要的角色,除了显式的 order by  语句,数据库的聚集、窗口函数中都存在排序算法的身影,Greenplum  数据库中的排序主要有两个部分。‍

1.内排序算法:内排序算法指的是完全在内存中完成的排序算法,常见的有冒泡排序、插入排序、快速排序、堆排序、基数排序等。Greenplum 在快速排序之外还使用了堆排序,主要是面向需要使用 topK 查询的一些使用场景。例如  SQL 语句中使用  order by+limit 语句就可以切换到topK查询,提升查询性能。

2.外排序算法,主要是用来处理海量数据,对海量数据进行排序时,不可避免会出现内存无法容纳下的情况,此时我们就需要使用外排序算法,最常见的外排序算法是归并排序的各种变形。

Greenplum 的排序节点根据查询计划指定的排序键对输入元组进行排序。根据排序节点的数据量和内存容量等条件, Greenplum 会选择不同的排序算法:当排序节点的工作内存能够装下所有输入元组时,排序节点使用快速排序或者堆排序,否则使用基于归并的外排序算法。

本周四直播间,我们将邀请HashData内核工程师Roseduan为大家解读Greenplum排序算子,欢迎感兴趣的朋友们与我们相约直播间,一起学习成长!

主题:PostgreSQL 技术内幕(六)Greenplum 排序算子

时间:2月23号(本周四)19:30

公司简介:HashData是中国领先具备自主可控研发能力的数据仓库软件厂商,核心团队主要由来自Pivotal、Teradata、IBM、Yahoo!、Oracle和华为等公司资深的云计算、分布式数据库和大数据专家组成。凭借深厚的技术积累以及极具前瞻性的产品理念,HashData数据仓库已广泛应用于金融、电信运营商、交通物流和互联网等多个行业头部客户。

最后修改时间:2023-02-23 09:59:32
文章转载自HashData,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论