面向数字化的未来,IT基础设施软硬件供应商、设备商正在继续优化分布式基础设施的性能、效率和安全特性,以通过软硬件的协同创新,进一步为数据的处理和利用创造更大价值。
日前,NVIDIA与戴尔科技宣布推出一款专为AI时代设计的全新数据中心解决方案,可带来先进的AI训练、AI推理、数据处理、数据科学和零信任安全能力。该解决方案结合了戴尔PowerEdge服务器、NVIDIA BlueField DPU 、NVIDIA GPU和NVIDIA AI Enterprise 软件,并针对最新发布的VMware vSphere 8企业工作负载平台进行了优化。
AI与安全需求——数据中心基础设施演进的强大动力
数据中心基础设施一直在不断演进,且海量、多样的边缘工作负载正在加剧这一进程。带有AI/ML和分析功能的分布式现代化应用,正在利用加速器,并提供更高的安全性作为主流应用基础设施的一部分,从而推动数据中心架构的转型。
NVIDIA企业计算负责人Manuvir Das表示:“随着计算和网络工作负载的激增,AI与零信任安全已成为一股推动全球企业重构数据中心的强大力量。VMware vSphere 8将数据中心基础设施服务卸载到NVIDIA BlueField DPU上,并对这些服务进行加速、隔离、加强对它们的保护,同时为全球企业释放出用于处理智能工厂的计算资源。”
据了解,在BlueField DPU上运行vSphere 8可大幅提高工作负载性能。通过将工作负载卸载到DPU,用户可以加速网络和安全服务,并节省CPU周期,同时保持性能,满足现代分布式工作负载的吞吐量和延迟要求。这一组合提高了性能与效率、简化了运营并增强了数据中心、边缘、云和混合环境的基础设施安全。
在GPU加速数据中心领域,NVIDIA与戴尔一直保持合作,并推动了大规模的突破。如今,在戴尔的PowerEdge服务器平台中内置了NVIDIA BlueField DPU和NVIDIA GPU,以及最新的VMware vSphere 8,可为关键的企业云应用提供先进的性能和效率,同时更加有效地防止企业在多云环境中受到横向威胁。据了解,搭载NVIDIA BlueField-2 DPU+vSphere 8的戴尔服务器,将于今年晚些时候上市。
NVIDIA AI Enterprise即将支持VMware vSphere 8
企业在部署和管理AI应用时,面对不同工作负载或是大规模AI模型部署时,开发周期长、对开发人员/IT运维人员的技术能力要求高,是普遍的难题。运营成本、易用性、对不同场景的适配能力、安全要求——成为当前AI落地企业基础设施应用最主要的挑战。
应对上述难题,NVIDIA早先已经与VMware在AI企业级平台方面展开合作,联合发布了AI就绪型企业级平台。基于这一合作,NVIDIA的AI Enterprise软件套件可以在VMware的 vSphere 7环境中运行并进行AI应用优化。对于数十万家使用vSphere进行计算虚拟化的企业而言,这一合作为他们加速CUDA应用、AI框架、模型和SDK实现了扩展性、多节点性能和兼容性。
内置VMware vSphere的NVIDIA AI Enterprise现已上市,企业可以在NVIDIA LaunchPad上体验这些技术组合(NVIDIA LaunchPad是一项动手实验室计划,可以为AI、数据科学等领域的端到端工作流提供软硬件权限)。
并且,NVIDIA AI Enterprise即将支持VMware vSphere 8,包括对更大规模的多GPU工作负载、资源优化和GPU生命周期的轻松管理提供支持。
根据官方发布,在BlueField DPU上运行vSphere,能够将服务器效率提升22%,以1000台服务器的装机量来看,3年的效率提升将能够节省180万美元。
写在最后
NVIDIA AI Enterprise是一套全面的云原生AI和数据分析软件套件,为使企业能够在熟悉的基础设施上使用AI做了专门的优化。这套软件可以部署在从企业数据中心到公有云的任何地方,保证AI项目的正常运行。
VMware vSphere是VMware的虚拟化平台,可将数据中心转换为包括CPU、GPU、存储和网络资源的聚合计算基础架构,并对这一统一的运行环境进行管理。
据NVIDIA官方信息,在BlueField DPU上运行vSphere 8可以说是企业级计算的一个“huge moment”。VMware相当于为企业级计算提供操作系统,通过vSphere 8+BlueField DPU的软硬件协同合作,能够简化基础设施和工作负载管理,进一步提升效率和安全性,从而实现更好的用户体验,为更大规模应用打下坚实基础。