全新产品:英特尔®数据中心 GPU Flex 系列(曾用代号 Arctic Sound-M )能够帮助客户突破孤立且封闭的开发环境的限制,同时降低数据中心对于不得不使用多个分离、独立的解决方案的需求。英特尔为客户提供的单一 GPU 解决方案,能够在不牺牲性能或质量的情况下,灵活处理多种工作负载。这一优势可让它在支持多种云工作负载如媒体传输、云游戏、人工智能、元宇宙等新兴视觉云使用场景的同时,降低或优化相关的总体拥有成本。
英特尔副总裁兼超级计算事业部总经理 Jeff McVeigh 表示:“我们正处于一场由更多用户、更多应用和更高分辨率所共同驱动的‘像素爆炸’变革中。当今的数据中心基础设施承担着计算、编码、解码、传输、存储和显示视觉信息的巨大压力。英特尔 Flex 系列 GPU 采用突破性的设计,更有针对性地满足了现阶段的相关计算需求,同时也为未来的沉浸式体验提供了灵活性和可扩展性。”
强大性能:Flex 系列 GPU 可满足图像质量、部署密度和时延方面的要求。在集成了基于硬件的、业界领先的 AV1 编码器的基础上,Flex 系列数据中心 GPU 可以提供更出色的媒体转码吞吐性能和解码吞吐性能,且能耗低于同类型解决方案。它还实现了 30% 以上的带宽增幅1,显著降低了总体拥有成本。在软件层面,它可广泛支持主流媒体工具、API、框架和最新的编解码器。
基于英特尔的 Xe-HPG 微架构,并由生态系统中的广大硬件供应商和软件开发者提供支持,英特尔数据中心 GPU Flex 系列可以为诸如媒体分析、智慧城市、医疗影像等场景的 AI 推理工作负载提供在 CPU 和 GPU 之间灵活扩展的能力,而不会让开发者受限于封闭的专有软件中。
重要应用:媒体处理、媒体传输、视觉人工智能推理、云游戏和桌面虚拟化等应用场景在数据中心领域呈现快速成长趋势。受此驱动,面向视觉云的数据中心 GPU 芯片市场规模也有望在 2026 年增长至 150 亿美元2。如此快的增长势头,正发生在一个很大程度上受限于封闭的、需要授权许可的代码开发模式的行业中。
Flex 系列 GPU 解决方案堆栈的出现,不仅能突破上述限制,还具备相比于其他解决方案的显著优势,即更高的灵活性和可扩展性,并能降低能耗。它能帮助解决方案提供商们降低总体拥有成本,让他们能够以更少数量的服务器满足更大规模用户的应用需求。
Flex 系列 GPU 解决方案堆栈通过 oneAPI (使用加速计算技术的高效手段)实现,能让开发人员摆脱封闭编程模式带来的经济和技术负担。相较于使用专利语言有可能会令后续开发被锁定在该语言上的局限,oneAPI 是一种开放式的可选方案,它通过一套完整的、经过验证的工具为现有编程语言和并行化模型提供补充,从而充分释放硬件的性能潜力。它让用户得以开发开放的、易于移植的代码,更大限度地利用多种跨英特尔 CPU 和 GPU 的组合。
性能详述:英特尔数据中心 GPU Flex 系列将首先提供媒体处理和传输以及 Android 云游戏相关能力。
媒体处理和传输:视频会议、流媒体和社交媒体的视频处理需求已经改变了数据中心内的计算资源需求。Flex 系列 GPU 的媒体架构包含多达四个 Xe 媒体引擎,专注于满足现代数据中心对于高密度视频流的需求,同时无需妥协质量:
以低于同类型解决方案的能耗,提供更出色的媒体转码吞吐性能和解码吞吐性能。
单卡能够支持多达 36 路视频流的 1080p60 转码吞吐量3。
单卡能够支持 8 路视频流的 4K60 转码吞吐量4。
在 4U 服务器中扩展到 10 卡配置时,它可以支持多达 360 路视频流的 HEVC-HEVC 1080p60 转码吞吐量3。
- Flex 系列 GPU 基于硬件的开源 AV1 编码器可节省 30% 以上的带宽1。Flex 系列 GPU 的媒体引擎还支持包括 HEVC、AVC 和 VP9 在内的业界广泛使用的编解码器并可以提高其性能。
- 利用英特尔® Deep Link 超级编码功能,英特尔® 数据中心 GPU Flex 系列 140 可在单卡上配备两套编解码设备,可以满足业界的“一秒时延”要求,同时提供 8K60 实时转码5。此功能适用于 AV1 和 HEVC HDR 格式。
Android 云游戏:云游戏正呈现快速增长趋势,亟需更灵活的解决方案来为用户提供更多的实时游戏流。Flex 系列 GPU 为提供更优的游戏服务质量而打造,可在各种设备上带来畅爽的游戏体验,这一点已经在近 90 款时下热门的 Google Play* Android 游戏中得到验证6。
- 单个 Flex 系列 170 GPU 可以支持多达 68 路 720p30 数据流,而单个 Flex 系列 140 GPU 可以支持多达 46 路 720p30 数据流(基于特定游戏的测试结果)7。
- 当使用 6 个 Flex 系列 140 GPU 进行扩展使用时,它可以支持多达 216 路 720p30数据流。
开放式软件堆栈:开发人员可以访问整合了开源组件和工具的综合软件堆栈,以有效地实现 Flex系列 GPU 面向视觉云工作负载的功能,包括对 oneAPI 和 OpenVINO™ 的支持。英特尔的 oneAPI 工具套件(包括英特尔® oneAPI 视频处理库 oneVPL、英特尔® VTune™ Profiler 等)帮助开发人员能够更快地交付应用程序和服务。
面市计划:包括戴尔科技集团、HPE、新华三、浪潮、联想和超微在内的全球系统提供商将推出搭载 Flex 系列 GPU 的系统。在未来几个月里,从媒体传输和 Android 云游戏工作负载开始,搭载 Flex 系列 GPU 的解决方案将陆续面市。随后将是面向 Windows 云游戏、人工智能和虚拟桌面基础架构工作负载的系统和解决方案8。
所有产品计划和路线图可能变更,恕不另行通知。
实际性能受使用情况、配置和其它因素影响而异。更多信息参见性能索引网站。结果可能有所不同。
1) 与 AVC 相比,AV1 节约超过 30% 的带宽,测试中使用的是英特尔®数据中心 GPU Flex 系列 140 和 170。
2) 数据来源:结合来自 IDC、ABI Research、Global Market Insights、Strategy Analytics、Hyperion Research 的数据,由英特尔估算得出。
3) 测试中使用的是英特尔 Flex 系列 140 GPU 在高性能模式下的 HEVC-HEVC 1080p60 转码吞吐量。
4) 测试中使用的是英特尔 Flex 系列 140 GPU 在性能模式下的 HEVC-HEVC 4Kp60 转码吞吐量。
5) 利用英特尔® Deep Link 超级编码实现 8K60 实时转码,测试中使用的是英特尔 Flex 系列 140。
6) 测试时使用了 2022 年 1 月和 2022 年 5 月 Google Play 中热门的 Android 游戏。
7) 选择的安卓游戏包括:
Flex 系列 170 GPU:《王者荣耀》 720p30,68 路数据流。
Flex 系列 140 GPU:《荒野行动》 720p30,46 路数据流。
8) 反映英特尔数据中心 GPU Flex 系列在产品全面成熟之后的性能。