暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

一文详解NC&NV多款GPU虚拟机

Azure云科技 2023-01-28
739


 NO.3 

云筹决算专刊Azure ☁️ 计算系列


游戏开发、工业图像渲染、数字孪生……伴随着云计算与物联网技术的不断发展,蓬勃增长的产业化上云需求对企业数字化基础设施的图像处理能力提出了更高的要求。


本期详解  NC、NV家族新成员 

更强大的  NCsv3、Ncsv4、Nvv4、Nvv5 

有哪些性能上的优化提升

从而释放超强图像处理能力



优化GPU-VM专为计算密集型、图形密集型和可视化工作负载而设计,可搭载单个、多个或部分GPU。Azure的GPU-VMs分为三大系列,NC、ND和NV系列。N系列VMs的区别在于它们各自存储盘上所支持的Azure存储方案不同。


更强大的NCsv3、Ncsv4、Nvv4、Nvv5与较早系列之间的主要区别是:


  • 性能优化

  • 支持高级存储

  • 支持选择部分GPU到多GPU的配置


新系列的优化性能及高性价比方案使进行EUC(终端用户计算)的用户受益,其中不乏如VMware Horizon、Citrix CVAD的大企业。



01

NCsv3系列VMs


NCsv3(又名NCv3)系列VM搭载NVIDIA Tesla V100 GPU,可提供强于上一代v2系列1.5倍的计算性能,为储层建模、DNA测序、蛋白质分析、蒙特卡罗模拟等提供运算服务。NCsv3系列提供低延迟、高吞吐量的网络接口,针对紧密耦合的并行计算工作负载进行了优化,支持高级存储、Ultra磁盘、临时OS磁盘等功能。除GPU外,NCsv3系列VM还由英特尔至强E5-2690 v4(布罗德韦尔)CPU提供支持。具体型号参数如下:

注:1 GPU = 1个V100卡;1023 GiB = 1098.4 GB;磁盘吞吐量以每秒输入/输出操作数(IOPS)和MBps来衡量,其中MBps = 10^6字节/秒。



02

NCsv4系列VMs


NC A100 v4(NCsv4)系列VM是Azure GPU系列的新成员,可用于Azure应用、AI训练和批量推理工作负荷,可提升各种受限于GPU性能的AI训练和推理工作负载和成本效益,如根据Synopsys的反馈:将电路仿真速度提高10倍,签核准确率提高10倍。NC A100 v4系列由NVIDIA A100 PCIe GPU和第三代AMD EPYC™ 7V13(米兰)处理器提供支持。与上一代的NCv3相比,用户将体验到1.5到3.5倍的性能提升。虚拟机具有多达4个NVIDIA A100 PCIe GPU,每个80GB的内存、多达96个非多线程AMD EPYC米兰处理器内核和880 GiB的系统内存,非常适合AI工作负载,例如:


  • GPU加速分析和数据库

  • 具有大量预处理和后处理的批量推理

  • 自治模型训练

  • 油气藏模拟 

  • 机器学习(ML)开发

  • 视频处理

  • 人工智能/机器学习网络服务


由于该系列的GPU、内存、I/O均有升级,占用空间增加,NC A100 v4需要使用第2代VM和市场映像。它比以往任何时候都更具成本效益,同时仍为客户提供工作负载所需的选项和灵活性。具体型号参数如下:

注:1 GPU = 1个A100卡



03

NVv4系列VMs


NVv4系列VM可作为用于生产力工具运行,如Microsoft Office 365,设计工具如Adobe、3D专业应用等的云工作站和云桌面。搭载AMD Radeon Instinct MI25 GPU和AMD EPYC 7V12(罗马)CPU,基本频率为2.45GHz,全核峰值频率为3.1GHz,单核峰值频率为3.3GHz。NVv4首次在Azure中启用免许可证GPU分区,实现提供从具有2 GiB帧缓冲区的1/8 GPU到具有16 GiB帧缓冲区的完整GPU的灵活方案,将GPU资源与各种企业工作负载需求相匹配,使虚拟桌面体验更加经济实惠。

该系列的ACU(Azure计算单元)高达230-260并支持高级存储、Ultra盘、临时OS磁盘等功能。通过创新的GPU分区技术和SR-IOV强制隔离PCIe®资源可大力提升数据安全。每个虚拟机只能访问自己的GPU资源,安全硬件分区可防止其他虚拟机进行未经授权的访问。NVv4 VM目前仅支持Windows操作系统下的用户使用。具体型号参数如下:



04

NVv5系列VMs


NVadsA10v5(又名NVv5)系列VM可用于3D渲染、流媒体、游戏等领域的云桌面和工作站搭建,配备NVIDIA A10 GPU和AMD EPYC 74F3V(米兰)CPU,基本频率为3.2GHz,全核峰值频率为4.0 GHz,支持高级存储、Ultra盘、临时OS磁盘等功能。本系列同NVv4一样,提供灵活的GPU分区方案,但性能只增不减:从具有4GiB帧缓冲区1/6 GPU到具有24 GiB帧缓冲区的完整A10 GPU,以满足用户个性化的需求。


NVadsA10v5系列中的每个虚拟机都附带一个网格许可证。此许可证使用户可以灵活地将NV虚拟机用作单个用户的虚拟工作站,或者供25个并发用户连接的虚拟应用程序方案的虚拟机。利用虚拟功能,将所需的硬件资源映射到每个子分区后,虚拟设备驱动程序能够直接访问硬件,无需与主机通信。单个NVIDIA A10核心GPU分区可包含多达6个虚拟机,每个虚拟机都具有单独的可预测性能,并且得益于SR-IOV技术,每个GPU分区都可以充当只能访问其自身资源的单个计算机。用户可根据自身的GPU加速图形应用程序和虚拟桌面需求来选择合适的虚拟机型号。具体型号参数如下:

注:NVadsA10v5系列虚拟机采用AMD同步多线程技术;由于有纠错码(ECC)的支持,OS中实际报告的GPU VRAM将略少。


更多详细信息请参阅 aka.ms/HPC-AI/Hub


「云」筹决算  




计算资源上云融合,性能不断攀高。微软 Azure 特推出「云」筹决算 专刊,详解 Azure HPC 高性能云计算产品服务矩阵,如何集成计算、网络和存储资源,为应用程序和并行工作负载释放超强算力。


更多不同领域的 Azure HPC 

配置方案案例及详细信息

“码”上一览

「Azure HPC 技术文档」


文章转载自Azure云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论