暂无图片
暂无图片
5
暂无图片
暂无图片
暂无图片

CloudberryDB 内核分享: Directory Table 底层逻辑与实现原理讲解

HashData 2024-06-26
270

Cloudberry Database(以下简称“CloudberryDB”)是专为分析和 AI 场景打造的开源数据库,兼容 PostgreSQL 和 Greenplum 生态,遵循 Apache License 2.0 许可协议,致力于构建开放、友好、中立的开源社区。


为了更好地推动开源生态、与大家分享行业前沿技术,我们推出了全新的直播系列——《CloudberryDB 内核分享》。在这个直播系列中,我们将邀请多位行业专家和资深开发者,共同探讨 CloudberryDB 的各项特性和功能,以及背后的技术实现,为大家带来实用的技术分享。首期直播,我们将聚焦 CloudberryDB 全新技术特性 Directory Table。



在这个数据爆炸的年代,非结构化数据充斥在我们日常生活中的方方面面,日常中我们听一首歌,看一篇文章,图片,电影,文档等等都是非结构化数据。 如何在数据库中将这些非结构化数据有序统一管理起来,并在此基础上对数据进行挖掘和分析是一个具有挑战和意义的工作。 


为此,CloudberryDB 引入了一种专门用来存储管理非结构化数据的新的表类型--目录表(Directory Table)。通过目录表我们可以将各式各样非结构化的数据统一纳管起来,并且可以结合酷克数据自主研发的下一代 In-Database 高级分析和数据科学工具 HashML,对存储在目录表中的数据进行挖掘学习,为用户提供更进一步的价值。同时,CloudberryDB 的目录表提供 local 和 remote 两种存储方式,一种基于本地存储,一种基于 oss (对象存储服务),满足用户需求的多样性。


本期直播,我们非常荣幸邀请到了酷克数据资深数据库内核研发工程师张老师,与我们一起深入探讨 Directory Table 的实现原理和技术细节,帮助大家更好地理解和应用这一功能。


文章转载自HashData,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论