暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

ClickHouse 欢迎 PeerDB:将最快的 Postgres CDC 加入最快的 OLAP 数据库

ClickHouseInc 2024-08-01
448

本文字数:2632;估计阅读时间:7 分钟
作者:Ryadh Dahimene, Aaron Katz


我们很高兴地宣布,ClickHouse 正在与专注于 Postgres 的变更数据捕获(CDC)提供商 PeerDB 合作,热烈欢迎 PeerDB 团队和社区加入 ClickHouse 家族。

我们相信,通过结合双方的努力,我们将能够在两大领先的开源数据库 Postgres 和 ClickHouse 之间实现无缝且高效的集成。这将弥合事务处理和分析工作负载之间的差距,为用户和开发人员带来更多价值。此外,当我们与 PeerDB 团队会面时,我们发现双方在文化上非常契合,尤其是在工程(注重性能!)文化方面,这让我们更加兴奋。


数据的两面

Postgres 和 ClickHouse 的组合有很多值得讨论的地方。一方面,Postgres 稳步上升,几乎成为网络事务处理的事实标准。它以可靠性、开源根源、全面的功能集和对事务工作负载的强大支持而闻名。在 2024 年的 StackOverflow 调查中,Postgres 连续第二年被评为第一数据库,这不足为奇。

另一方面,在分析领域,过去十年中 ClickHouse 也经历了类似的发展。作为一种开源的高性能列式数据库,ClickHouse 专为实时分析和处理大量数据而优化,不妥协于速度和效率。ClickHouse 的广泛采用证明了现代软件对实时分析的不断增长的需求。

通过高效的 CDC 集成,将 Postgres 的强大事务处理能力与 ClickHouse 的分析能力结合,组织可以创建一个混合环境,使操作数据无缝流入分析过程。这使得用户能够进行实时洞察和决策,同时不影响数据一致性和事务完整性。包括 GitLab、Instacart、LangChain 和 Cloudflare 在内的许多组织已经成功大规模采用了这种方法。


变更数据捕获,正确实现

在 ClickHouse 的规模上,提供快速且可靠的变更数据捕获体验并非易事。当我们开始为 ClickPipes 提供 Postgres CDC 连接器时,我们评估了从头开发解决方案、基于开源基础构建或许可特定技术等多个选项。第一次测试结果表明,PeerDB 提供了独特的价值主张,与 ClickHouse 的核心原则非常契合。

PeerDB 专注于 Postgres 作为数据源,其 CDC 解决方案在速度上毫不妥协,提供闪电般的快照,同时保持可靠性和准确性。PeerDB 还非常注重保持 CDC 过程对源 Postgres 系统的非侵入性,这通常是一个关键的操作系统。其他功能包括目标查询成本控制、重新同步能力、对复制槽增长的监控和警报、模式演变、丰富的数据类型映射以及使用 ClickHouse 的 ReplacingMergeTree。

Vueling Airlines 的云架构经理 Javier Erro Garcia 对即将到来的集成表示兴奋:

“作为 ClickHouse Cloud 和 PeerDB 的用户,我对这次收购感到非常兴奋。我们已经将 Postgres 到 ClickHouse 的快照时间从 10 多小时减少到 15 分钟。结合 ClickHouse 强大的分析能力和 PeerDB 的实时数据捕获能力,将大大简化我们的数据处理工作流。这种集成将使我们能够更快地构建分析应用程序,为我们在市场上提供竞争优势。”


这对 PeerDB 项目意味着什么?

PeerDB 项目将继续保持 ELv2 许可证,并开放贡献。此外,我们很高兴地宣布,将发布 PeerDB Enterprise,这是一款商业级产品,具有生产级的 Helm 图表,且同样在 ELv2 许可证下免费发布。这使得任何 PeerDB 用户都能轻松运行自管理的生产级 CDC 工作负载。


这对 PeerDB Cloud 意味着什么?

ClickHouse Cloud 已经有了自己的专用数据摄取平台,即 ClickPipes。ClickPipes 是一个集成引擎,简化了从各种来源(如 Apache Kafka、Amazon S3 和 Google Cloud Storage)摄取数据的过程。截至目前,ClickPipes 已经可靠且高效地将超过 1 万亿行数据迁移到 ClickHouse Cloud。

通过与 PeerDB 合作,我们将添加一个新的连接器,使得 ClickPipes 支持 Postgres CDC 用例,由 PeerDB 提供技术支持。这将完全融入 ClickHouse Cloud 的体验,并在可扩展性、监控和基础设施方面受益于同样的基础。

我们理解数据工程的变更需要时间。因此,我们决定将现有付费客户使用非 ClickHouse Cloud 连接器的 PeerDB Cloud 的生命周期终止日期设定为一年后的 2025 年 7 月 30 日。这样,早期采用 PeerDB 技术并帮助其成功的组织有足够的时间进行有序过渡。客户将继续获得合同中承诺的支持和 SLA,并在需要时提供个性化的过渡计划。

我想将 Postgres CDC 设置到 ClickHouse Cloud,是否需要等待 ClickPipes 的 Postgres CDC 功能上线?

不需要,您现在就可以注册 PeerDB Cloud,并将您的 Postgres 数据库连接到 ClickHouse Cloud。对于希望立即开始的用户,我们将继续按现有条款提供此服务,包括一个月的免费试用期。

一旦 ClickPipes 的 Postgres CDC 连接器正式上线,我们将为 PeerDB Cloud 用户留出时间,以便他们可以停止旧的管道,并在 ClickPipes 中重新配置 Postgres CDC,这样他们就可以享受完整的连接器生态系统和 ClickHouse Cloud 的功能。


下一步是什么?

虽然我们对将 Postgres CDC 功能引入 ClickHouse Cloud 感到非常兴奋,但这只是一个开始。PeerDB 的基础非常坚实且可扩展。在整合 Postgres CDC 功能后,我们计划扩展源 CDC 连接器目录,涵盖其他类型的数据库。我们的计划将主要由需求驱动,因此希望您能告诉我们您希望我们添加哪些 CDC 源连接器。


联系我们!

无论您是当前的 PeerDB 用户还是对高效的 Postgres CDC 功能感兴趣,ClickHouse 团队都非常愿意与您合作。请随时联系我们!


征稿启示

面向社区长期正文,文章内容包括但不限于关于 ClickHouse 的技术研究、项目实践和创新做法等。建议行文风格干货输出&图文并茂。质量合格的文章将会发布在本公众号,优秀者也有机会推荐到 ClickHouse 官网。请将文章稿件的 WORD 版本发邮件至:Tracy.Wang@clickhouse.com

最后修改时间:2024-08-01 10:54:05
文章转载自ClickHouseInc,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论