
通过结合使用 Oracle Distributed Cloud 平台与 NVIDIA GPU,企业可以在所需地方运行低延迟的生成式 AI 推理、大语言模型 (LLM) 微调、AI 视频分析和实时数字孪生模拟。通过在整个企业中部署由 GPU 加速的云技术功能,您可以按需获得性能、灵活性和可扩展性。同时,借助 Compute Cloud@Customer,您将能够保持对敏感数据的控制,有助于应对数据驻留和主权要求,并享受云自动化和经济优势。
Oracle Compute Cloud@Customer
在所需位置使用 AI
Oracle Compute Cloud@Customer 是一个全托管的混合云技术解决方案,支持您在数据中心内使用 Oracle Cloud Infrastructure (OCI) 服务,包括计算、存储、网络和 OCI Kubernetes Engine (OKE)。该解决方案提供与 OCI 相同的 API、软件开发人员工具包 (SDK) 和运营模型,让您可以选择要在什么地方使用云技术资源来运行应用。借助 Oracle Compute Cloud@Customer,您可以通过经济高效的按量计费定价模式,使用新的高性能基础设施和服务。
如果客户有特别的运营要求,需要在本地部署基于购买的财务模型并使用类似功能,我们的 Oracle Private Cloud Appliance 可以使用相同的硬件来提供相同的基础设施服务,并且是由客户而非 Oracle 拥有和管理的。
通过我们新推出的服务,您可以将 NVIDIA GPU 添加到 Compute Cloud@Customer 和 Private Cloud Appliance 中,从而获得以下主要特性:
●
独立扩展 GPU、计算和存储:高达 48 个 L40S NVIDIA GPU、6,624 个拥有 80.4 TB 内存的 OCPU ,以及混合配置高达 3.65 PB 的高容量存储和 1.2 PB 的高性能存储。
●
强大的 GPU VM:高达四个 NVIDIA L40S GPU、108 个 Intel Xeon 8480+ CPU 核心、800 GB DDR5 内存和 400 Gbps 网络带宽,适用于高要求的工作负载
●
超快的网络连接:可直接连接到 Exadata Cloud@Customer 或 Exadata Database Machine 的 800 Gbps 数据中心连接,将 GPU 的强大功能与 Oracle Database 23ai 的集成 AI Vector Search 相结合。
●
内置 OKE,简化容器管理
使用 NVIDIA L40S GPU
为新一代 AI 提供强大支持
NVIDIA L40S GPU 基于 NVIDIA Ada Lovelace 架构构建而成,是一种多用途 GPU,旨在为 AI 密集型工作负载、HPC 和图形丰富的应用提供出色的性能。每个 NVIDIA L40S GPU 包含了:
●
第四代 Tensor Core 和 Transformer Engine,可提供高达 1,466 TFLOP 的 FP8 Tensor Core 性能、733 TFLOPS 的 FP16 Tensor Core 性能和 366 TFLOPS 的 TF32 Tensor Core 性能,所有这些都具有稀疏功能
●
第三代 RT Core 和 NVIDIA DLSS 3,可实现 AI 增强的加速图形处理性能
L40S GPU 为 AI 用例提供的性能可高达 NVIDIA A100 GPU 的 1.7 倍,同时也提供出色的图形功能,非常适合希望扩展 AI 容量或运行混合工作负载的客户。L40S GPU 为 AI 推理、图形、数字孪生和实时 4K 流处理提供了量身定制的功能,为企业提供了创新和扩展的新机会。
OCI 边缘云技术产品管理副总裁 Matt Leonard 表示:
“
将 NVIDIA L40S GPU 添加到 Oracle Compute Cloud@Customer 为全球企业开拓了新的机遇。现在,企业可以享受到在自己的数据中心的便利,在生成式 AI、图形和高性能计算等领域应对客户高要求的企业级工作负载。企业可以实现低延迟的生成式 AI 推断、LLM 微调和实时数字孪生模拟,同时保持对敏感数据的控制,这有助于企业应对数据驻留和主权要求,并享受云技术自动化和经济效益。
NVIDIA 边缘解决方案销售全球主管 Irfan Ali 则表示:
“
借助 Oracle Compute Cloud@Customer 产品,客户可以利用多达 48 个 L40S GPU,大规模运行 AI 和图形工作负载,同时保持对数据的控制,并以低延迟的方式访问其他数据源和消费者。NVIDIA L40S GPU 增加了对 FP8 数据类型的支持,与 NVIDIA AI Enterprise 和 NVIDIA Omniverse 平台结合使用,使新的生成式 AI 能够部署在各行各业的企业边缘,包括金融服务、制造、医疗卫生等。
实际应用效益
利用 Oracle Database 23ai 加速洞察
Oracle Database 23ai 将 AI 向量数据类型和搜索功能直接集成到主流的关系型数据库中。因此,您无需多个孤立的数据库或移动数据,即可实现 AI 驱动的洞察,这将有助于提高性能和数据安全性。通过在 Exadata Cloud@Customer 上加速 AI Vector Search,再搭配使用搭载 NVIDIA L40S GPU 的 Oracle Compute Cloud@Customer,您可以在数据中心部署完整的分布式云技术解决方案,从而优化整个计算、存储、网络和数据栈。那些凭借 Exadata Cloud@Customer 来运行 Oracle Database 的企业,现在也可以使用 Compute Cloud@Customer 来运行应用层和支持工作负载。
银行和金融行业的欺诈检测
更快的数据刷新频率和多样化连接选项(如 ERP 与 EPM 数据整合),帮助领导者实时洞察业务动态。通过在 Oracle Compute Cloud@Customer 或 Oracle Private Cloud Appliance 上部署 AI 驱动的欺诈检测系统,银行每天都能够以超快的速度和精确度分析数百万笔交易。这些系统可实时识别异常交易模式,有助于缩短响应时间并减少误报。金融机构可以在本地 Exadata Cloud@Customer 上安全地存储和处理敏感财务数据,从而应对严格的监管要求,同时提高欺诈检测准确性。作为高级解决方案的一部分,这些机构还可以集成像 NVIDIA Morpheus 这种框架,在需要时进一步优化 AI 驱动的欺诈检测工作流。
通过数字孪生实现智能工厂优化
通过使用 Oracle Compute Cloud@Customer 或 Oracle Private Cloud Appliance,制造商可以为生产线开发高保真数字孪生模型。这些数字副本有助于实现实时监视、预测性维护和工作流测试,而不会中断实际操作。工程师可以模拟新流程、优化性能并减少停机时间,从而显著节省成本并加速创新。
Oracle Compute Cloud@Customer 和 Oracle Private Cloud Appliance 具备基于 NVIDIA L40S GPU 的 GPU 扩展选项,能够在 AI 驱动的转型时代中,在所需地方为企业赋能。无论是保护财务系统、优化工业运营,还是在边缘提供实时洞察,Oracle Distributed Cloud 解决方案都可以帮助企业更快地创新、更智能地运营并全面管控数据。

文章来源:https://www.oracle.com/asiasouth/news/announcement/blog/announcing-nvidia-gpu-on-oracle-compute-cloud-at-customer-2025-02-05/
*注:为免疑义,本文所用以下术语专指以下含义:
1. Oracle 专指 Oracle 境外公司而非甲骨文中国。
2. 相关 Cloud 或云术语均指代 Oracle 境外公司提供的云技术或其解决方案。

评论



