近日,NVIDIA和戴尔科技发布了一则重磅消息:由NVIDIA 提供加速的多款戴尔PowerEdge 系统,可助力企业通过AI高效地实现业务转型。
这是双方有史以来在AI领域最大规模的合作,NVIDIA的旗舰产品Hopper GPU和BlueField-2 DPU都在戴尔的PowerEdge服务器得以应用。这一合作传达出的讯息,不仅反映了IT变革当下的发展方向,同时也反映了两大巨头对于企业数字化转型过程如何导入AI、提升算力、提升效率的长远布局和思考。
15款戴尔PowerEdge系统可利用 NVIDIA全栈AI解决方案,包括GPU、DPU以及NVIDIA AI Enterprise 软件套件,为企业构建各类 AI 应用程序奠定基础,包括语音识别、网络安全、推荐系统、以及越来越多突破性的基于语言的服务。
NVIDIA GPU+DPU硬核“站台”戴尔服务器
最新公布的戴尔PowerEdge系统,硬件方面有两大亮点值得关注:
首先是采用了NVIDIA BlueField-2 DPU。
对于当前市场上每年交付的数据中心服务器,NVIDIA曾经算过一笔账:3000万台设备,有1/3用于运行软件定义的数据中心堆栈,而这种工作负载的增长速度远快于摩尔定律,除非卸载并加速这类工作负载,否则数据中心用来运行应用程序的CPU算力会越来越少。“新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具”,黄仁勋曾指出。
NVIDIA BlueField DPU (数据处理器 )可以卸载、加速和隔离数据中心的网络和操作系统堆栈,使用 NVIDIA DPU的企业可以将数据中心的能源使用减少近25%,从而有望节约数百万美元的能源费用。同时,配备 NVIDIA BlueField DPU的戴尔 PowerEdge 服务器优化了私有云、混合云和多云部署(包括运行 VMware vSphere 的部署)的性能和效率。
其次,戴尔PowerEdge系统采用了NVIDIA Hopper GPU,这使得系统在处理数据的效率方面提升了 25 倍,可将各类 AI 模型部署到生产环境中。与上一代非加速服务器相比,全新的PowerEdge 服务器在参数规模超5000亿的大型语言模型上的推理能效提高了300倍。
Hopper GPU作为NVIDIA的旗舰级产品,相比前代Ampere GPU,在某些方面实现了成倍的性能提升,例如:Hopper DPX指令集在Dynamic Programing方面带来了40X的速度提升;NVIDIA在Hopper架构中引入新一代流式多处理器的FP8张量核心(Tensor Core),用来加速AI训练和推理;Hopper Transformer引擎能更好实现动态混合精度的处理(Dynamic Mixed-Precision Processing);Hopper中引入了新的线程块集群机制,可实现跨单元进行协同计算……
通过硬件架构的升级迭代,NVIDIA大力推动了下一代GPU应对巨量化、多样化的数据需求,既能够帮助企业削减AI的部署成本,并且在提供相同AI性能的同时,实现更高的能效和更低的总体拥有成本,这应该也是促成与戴尔大规模合作的主要原因。
企业如何通过AI解决当前挑战?
NVIDIA与戴尔已经进行了长达25年的合作,面向新时代企业经营的IT新需求,AI成为帮助企业构筑IT优势、且进一步打造核心业务优势的关键之一。
在日前戴尔的PowerEdge.Next 活动上,NVIDIA创始人兼首席执行官黄仁勋、戴尔技术创始人兼首席执行官Michael Dell,都从AI视角分析了未来的发展。
黄仁勋表示:“AI 能够为所有行业加速自动化进程,进而为所有企业带来变革。通过与戴尔科技密切合作,我们能够触及全球范围内的机构,通过强大又节能的 AI 计算平台,提高现代企业的智能化程度。”
Michael Dell表示:“随着全球数据量的扩大,大部分信息技术将用于机器智能服务。如今需要为实现‘AI 优先’而构建系统,这恰为戴尔和NVIDIA的合作创造了巨大的机遇。”
软件许可助推AI落地“又快又好”
为助力客户快速启动和运行 AI 项目,使用 NVIDIA Hopper GPU加速的戴尔PowerEdge服务器附带了NVIDIA AI Enterprise 软件许可。这将为企业带来哪些实际的好处呢?
NVIDIA AI Enterprise作为一款端到端、安全、云原生的AI软件套件,简化了预测性AI的开发和部署,且针对广泛的领域和行业特定工作负载提供了全球性的企业级支持。如今,NVIDIA AI Enterprise包括50多个框架和预训练模型以及一套AI工作流,所有这些均可助力机构加快部署时间,同时降低生产就绪型AI的成本。
NVIDIA AI Enterprise 3.0 中包含的 NVIDIA AI 框架包括:用于基因组学的NVIDIA Clara Parabricks、用于医学成像的MONAI、用于网络安全的NVIDIA Morpheus、用于智能视频分析的NVIDIA Metropolis、用于视觉 AI 的NVIDIA DeepStream、用于推荐系统的NVIDIA Merlin等。
一直以来,企业在部署和管理AI应用时,面对不同工作负载或是大规模AI模型部署时,开发周期长、对开发人员/IT运维人员的技术能力要求高,是普遍的难题。而NVIDIA AI Enterprise 3.0覆盖了丰富的AI框架,对不同领域应用和部署AI方面进一步降低了门槛。
目前,有意向的企业可在NVIDIA LaunchPad 上的数十个实操实验室中免费体验 NVIDIA AI Enterprise,全新 AI 工作流实验室预计将于下周推出。
写在最后
算力是IT数据中心的动力。如今,IT应用对算力提出了更高的需求,只有进行持续的算力提升,才能更好地支撑新场景的发展,包括云、5G、人工智能、边缘计算等。
服务器的持续创新,对确保企业有能力应对以数据为中心的未来至关重要。此次在双方的合作中,NVIDIA通过完善的软硬件方案赋能了戴尔的下一代服务器系统,有助于企业用户在部署AI和其他现代工作负载时,能够从数据和IT投资中获取最大价值。