优化GPU-VM专为计算密集型、图形密集型和可视化工作负载而设计,可搭载单个、多个或部分GPU。Azure的GPU-VMs分为三大系列,NC、ND和NV系列。N系列VMs的区别在于它们各自存储盘上所支持的Azure存储方案不同。
更强大的NCsv3、Ncsv4、Nvv4、Nvv5与较早系列之间的主要区别是:
性能优化
支持高级存储
支持选择部分GPU到多GPU的配置
新系列的优化性能及高性价比方案使进行EUC(终端用户计算)的用户受益,其中不乏如VMware Horizon、Citrix CVAD的大企业。
01
NCsv3系列VMs
NCsv3(又名NCv3)系列VM搭载NVIDIA Tesla V100 GPU,可提供强于上一代v2系列1.5倍的计算性能,为储层建模、DNA测序、蛋白质分析、蒙特卡罗模拟等提供运算服务。NCsv3系列提供低延迟、高吞吐量的网络接口,针对紧密耦合的并行计算工作负载进行了优化,支持高级存储、Ultra磁盘、临时OS磁盘等功能。除GPU外,NCsv3系列VM还由英特尔至强E5-2690 v4(布罗德韦尔)CPU提供支持。具体型号参数如下:
注:1 GPU = 1个V100卡;1023 GiB = 1098.4 GB;磁盘吞吐量以每秒输入/输出操作数(IOPS)和MBps来衡量,其中MBps = 10^6字节/秒。
02
NCsv4系列VMs
NC A100 v4(NCsv4)系列VM是Azure GPU系列的新成员,可用于Azure应用、AI训练和批量推理工作负荷,可提升各种受限于GPU性能的AI训练和推理工作负载和成本效益,如根据Synopsys的反馈:将电路仿真速度提高10倍,签核准确率提高10倍。NC A100 v4系列由NVIDIA A100 PCIe GPU和第三代AMD EPYC™ 7V13(米兰)处理器提供支持。与上一代的NCv3相比,用户将体验到1.5到3.5倍的性能提升。虚拟机具有多达4个NVIDIA A100 PCIe GPU,每个80GB的内存、多达96个非多线程AMD EPYC米兰处理器内核和880 GiB的系统内存,非常适合AI工作负载,例如:
GPU加速分析和数据库
具有大量预处理和后处理的批量推理
自治模型训练
油气藏模拟
机器学习(ML)开发
视频处理
人工智能/机器学习网络服务
由于该系列的GPU、内存、I/O均有升级,占用空间增加,NC A100 v4需要使用第2代VM和市场映像。它比以往任何时候都更具成本效益,同时仍为客户提供工作负载所需的选项和灵活性。具体型号参数如下:
注:1 GPU = 1个A100卡
03
NVv4系列VMs
NVv4系列VM可作为用于生产力工具运行,如Microsoft Office 365,设计工具如Adobe、3D专业应用等的云工作站和云桌面。搭载AMD Radeon Instinct MI25 GPU和AMD EPYC 7V12(罗马)CPU,基本频率为2.45GHz,全核峰值频率为3.1GHz,单核峰值频率为3.3GHz。NVv4首次在Azure中启用免许可证GPU分区,实现提供从具有2 GiB帧缓冲区的1/8 GPU到具有16 GiB帧缓冲区的完整GPU的灵活方案,将GPU资源与各种企业工作负载需求相匹配,使虚拟桌面体验更加经济实惠。
该系列的ACU(Azure计算单元)高达230-260并支持高级存储、Ultra盘、临时OS磁盘等功能。通过创新的GPU分区技术和SR-IOV强制隔离PCIe®资源可大力提升数据安全。每个虚拟机只能访问自己的GPU资源,安全硬件分区可防止其他虚拟机进行未经授权的访问。NVv4 VM目前仅支持Windows操作系统下的用户使用。具体型号参数如下:
04
NVv5系列VMs
NVadsA10v5(又名NVv5)系列VM可用于3D渲染、流媒体、游戏等领域的云桌面和工作站搭建,配备NVIDIA A10 GPU和AMD EPYC 74F3V(米兰)CPU,基本频率为3.2GHz,全核峰值频率为4.0 GHz,支持高级存储、Ultra盘、临时OS磁盘等功能。本系列同NVv4一样,提供灵活的GPU分区方案,但性能只增不减:从具有4GiB帧缓冲区1/6 GPU到具有24 GiB帧缓冲区的完整A10 GPU,以满足用户个性化的需求。
NVadsA10v5系列中的每个虚拟机都附带一个网格许可证。此许可证使用户可以灵活地将NV虚拟机用作单个用户的虚拟工作站,或者供25个并发用户连接的虚拟应用程序方案的虚拟机。利用虚拟功能,将所需的硬件资源映射到每个子分区后,虚拟设备驱动程序能够直接访问硬件,无需与主机通信。单个NVIDIA A10核心GPU分区可包含多达6个虚拟机,每个虚拟机都具有单独的可预测性能,并且得益于SR-IOV技术,每个GPU分区都可以充当只能访问其自身资源的单个计算机。用户可根据自身的GPU加速图形应用程序和虚拟桌面需求来选择合适的虚拟机型号。具体型号参数如下:
注:NVadsA10v5系列虚拟机采用AMD同步多线程技术;由于有纠错码(ECC)的支持,OS中实际报告的GPU VRAM将略少。
更多详细信息请参阅 aka.ms/HPC-AI/Hub
「云」筹决算 ■
计算资源上云融合,性能不断攀高。微软 Azure 特推出「云」筹决算 专刊,详解 Azure HPC 高性能云计算产品服务矩阵,如何集成计算、网络和存储资源,为应用程序和并行工作负载释放超强算力。
更多不同领域的 Azure HPC
配置方案案例及详细信息
“码”上一览
「Azure HPC 技术文档」