暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

PolarDB X 莲子数据——安全可信一体机(上)

PolarDB农夫山泉 2023-09-21
174

基于PolarDB开源生态的可信安全数据库一体机

本文整理自莲子数据硬件系统首席架构师许长魁,在 2022 阿里巴巴开源开放周上的分享。本篇内容主要分为三个部分:

  1. 项目背景 2. 研究进展 3. 未来规划。

img

一、项目背景:行业发展现状与项目研发驱动

​ 莲子数据建设开发的基于 PolarDB 的数据库一体机主要包含三个方面六大特点,分别是开放与异构、高效与节能、可信与安全。

​ 项目的立项得益于 PolarDB 开源计划的激励。PolarDB 的 PG 开源版本与莲子数据产品有着非常好的兼容性,保证了数据库的适配工作得以顺利开展。

​ 随着数据维度的扩张,业务对于算力也提出了更高要求。而随着摩尔定律的放缓,所有类别的处理器想要借助先进制程达到性能提升的技术路线难度也越来越大,但是 AI 自动驾驶和高性能计算对于计算性能的要求却越来越高。由此可见,单一的计算架构已经很难满足如今多元化的需求,而这一方面催生了存算分离的架构,另一方面也推动了异构计算的高速发展。

img

超阈异构计算此类新一代的计算体系在国内外均进行了布局。

img

​ 国外,英特尔和ARM均提出了 xpu 概念,但侧重点略有不同。 Intel 主要利用不同的架构处理不同类型的数据,根据处理速度或者带宽的要求进行优化。ARM则对于异构计算强调了全面计算的理念,对 xpu 的定义更多侧重于开放的数据融合计算平台,强调了对于数据流的处理、跨域计算以及多元的算力扩展。

​ NVIDIA 在超阈异构计算方面主推的是NVLink 以及基于 NVLink 的NVSwitch 芯片,用于 CPU、GPU 以及 GPU 集群之间的高速通信。

​ 阿里云作为国内超阈异构计算的代表,也建设了 CIPU 计算体系。与以上国外厂商不同的是, CIPU 是一种云原生的全新计算体系架构。 CIPU 向下云化管理数据中心的硬件,加速了计算、存储和网络资源的调度;向上能够接入飞天云操作系统。

​ 相比于其他芯片公司,阿里云在实现 CIPU 与云操作系统的深度融合上具备了先天优势。一方面,它具备对底层基础设施资源的虚拟化管理能力,另一方面能够承载飞天对此类资源的编排和调度需求,并且具备存储、网络、计算、安全等硬件的加速能力。

​ 从异构计算的国内外相关布局可以看出,异构计算的本质是将不同架构的处理芯片整合到一个系统上进行工作,具体实施上包含两个方面的含义。其一是板级的集成方式,将 CPU、GPU、FPGA 等置于一个板上进行组合;其二是芯片及封装级的集成方式。两个内含分别涉及到数据总线技术和电子封装技术。

img

​ 数据总线技术上,PCIE总线经过几十年的发展,已经进入5.0时代,拓展到计算存储加速的方方面面, 6.0 已处于推广阶段,7.0标准也正在制定中。

​ CXL 又是基于 PCIE5.0 发展而来的一套服务于高性能计算机和数据中心领域的超高速互联新标准,主要用于CPU 和加速芯片比如 GPU、 FPGA等之间的通信能力,能够显着改善多路 CPU和加速卡之间的通信能力,从而保证更低的延迟和内存一致性。

2022 年最新提出的UCIe 互联标准,其目的是解决 chiplet 之间互联的行业标准问题。UCIe、PCIE 与 CXL 进行协同,指明了 UCIe在封装内的chiplet方向和封装外的 off package 应用方向。

​ 从本质上来说, CXL 基于 PCIE发展而来,UCIe的提出也离不开 PCIE 和 CXL 总线的应用铺垫。但是 UCIe 的出现能够统一机柜内互联的物理标准,将 in package 和 off package 统一到整体的框架中,也即一体机硬件研发的架构演进方向。

​ 封装内互联也是 UCIe发挥的另一主场。Chiplet是未来混合异构芯片系统的重要单元,与之相似的另一概念为system in package (SIP封装)。 SIP 封装是将芯片的最小系统进行系统级的二次封装,除了异构的芯片之外,还包含了一些必要的外设和内存单元,以上均为封装内互联的范畴。

img

​ 我们的工作主要聚焦于板级和机柜空间数据互联的技术方案,期望打造开放的异构数据交换平台。

​ 网络安全的风险源于图灵机原理缺少攻防的理念,这是先天性的不足。并且在设计 it 系统时,也无法穷尽所有逻辑组合,必定会存在逻辑不全的缺陷。因此,需要通过安全可信的计算,在实时运算的同时进行免疫的安全防护,使得存在的缺陷不被攻击者所利用,从而达到预期的计算目标。

img

​ 可信计算是 1999 年由 IBM、Intel 和 Microsoft 等牵头成立的国际 TCPA组织,后改名称为 Trusted Computing Group (TCG) 组织。该组织于 12 年发布了 TPM 2.0 标准,能够兼容中国的加密算法。后续在Intel 的不断推动下,它也成为了欧盟电信运营商设备采购的必要条件。

img

​ 我国的可信计算从 1992 年开始立项, 06 年发布了可信计算平台的密码技术方案和可信计算密码智能平台功能与接口规范。先后经过了 1.0 阶段和 2.0 阶段,目前已经发展到 3.0 阶段。

img

​ 与此同时,近五年在立法和规章的角度也进一步增强了对于可信安全计算的强制性要求。因此,我们认为可信计算需要以双模、软硬一体的方式融入到数据服务中,以提高可信度、安全度和隐私度。

img

​ 对于数据中心而言,能源成本已经占据了数据中心总成本的一半。因此,减少碳排放既是企业的社会责任,也是提高经济效益的手段。数据中心的高质量发展首先要着眼于提升能效,同时还要兼顾可扩展性、可靠性、安全性等方面的问题。因此,它的建设是一个庞大的系统工程。

img

​ 节能方面,ARM处理器与X86 相比表现出了明显优势,在同等能耗水平下,ARM处理器仍能够提供相当的算力水平,这一点从此前蝉联四次全球冠军的富岳超算系统上也能够得以体现。亚马逊的 Graviton和阿里云的倚天710 中也能看到基于 ARM 架构实现节能降碳的设计思路。

​ 数据中心的节能解决方案可以分为建设模式节能、制冷系统节能、供配电系统节能、 ICT 的设备节能以及 AI 应用等技术创新。我们的设计主要为设备节能技术路线。

img

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

文章被以下合辑收录

评论