AI正在颠覆传统算力市场。面向高性能、低能耗、多样负载的数据中心新需求,如何打造一个高度通用的平台,同时最大限度提高计算性能、降低功耗,成为英特尔巩固数据中心CPU王者地位的关键。
一年一度的芯片顶会Hot Chips期间,英特尔揭秘了下一代数据中心CPU,可以看到,英特尔至强可扩展至强处理器正通过逐代升级,坚守AI时代的最佳CPU宝座。从英特尔官方释出的信息来看,下一代至强引入了新的体系结构,在内存和I/O方面都进行了设计改进。
如何应对数据中心用户新需求?
AI时代的数据中心用户需求主要体现在以下四方面:对高性能单核CPU的需求持续增加;对提供更高密度和每瓦性能的CPU核需求不断增长;新的工作负载,要求CPU核在性能、效率和密度之间进行权衡;扩展的模型部署需求,带来功耗、I/O、带宽和内存的增长。
这给数据中心CPU带来哪些挑战?最突出的问题就是,数据中心工作负载用例类型被极大地拓展了,既有计算密集型&AI工作负载,也有高密度和横向扩展的工作负载,以及一般用途的工作负载。针对这些需求,英特尔在通用的平台基础和共享的软件堆栈基础之上,通过性能核(P-core)针对计算密集型和AI工作负载的性能进行了优化,能效核(E-core)针对高密度和横向扩展工作负载的能效进行了优化。也就是说,将于2024年推出的下一代服务器平台引入了全新的E-core,与已有P-core架构并存,共同为关键工作负载提供更好的性能和能效。
可扩展性、灵活性是下一代CPU关键
在新的架构体系下,“灵活性”被贯彻得很彻底,chiplet技术和EmiB封装在其中发挥了重大作用。从下面框图可以看出,多个独立的计算chiplet和I/O chiplet,通过EmiB封装(英特尔的2.5D先进封装技术)在单一芯片中进行了集成,这种方式使得芯片结构更为灵活,实现了通用IP、固件、操作系统、平台的有机整体,也再一次显现了英特尔在计算架构和封装技术上的累积效应。
未来的至强处理器(代号为Granite Rapids)引入了一种新的体系结构,包括在内存子系统、I/O等方面的创新。与之前的产品相比,该体系结构的逻辑单片计算集群提供了更好的每瓦性能和每线程性能,提供了必要的可扩展性、能效、性能和多功能性。
Granite Rapids专为多核性能敏感型工作负载和通用计算工作负载提供更好的TCO而优化。并且在AI性能方面,Granite Rapids通过内置的加速器能够为目标工作负载提供显著的性能和效率提升。具体表现如下:
混合AI工作负载性能提高2-3倍(基于截至2023年8月21日的架构预测,与第四代英特尔至强可扩展处理器相比);
增强的英特尔AMX支持新的FP16指令;
针对计算密集型工作负载提供更高的内存带宽、核心数和缓存;
插槽可扩展性,支持从一个插槽扩展至八个插槽。
代号为Sierra Forest的E-core至强处理器,是英特尔的首款E-core处理器,也将是首款采用Intel 3制程工艺的CPU。它在新的架构下,能够提供密度优化的计算性能达到节能目的,这对云原生和超大规模工作负载尤为关键。具体表现如下:
机架密度提升2.5倍,每瓦特性能提高2.4倍;
支持1路和2路服务器,每个CPU最多可达144核,TDP低至200瓦;
领先的指令集,具备强大的安全性、虚拟化和AI扩展的AVX;
每个至强可扩展处理器均标配的基本内存RAS功能,如机器检查、数据缓存ECC。
据介绍,Sierra Forest计划于2024年上半年交付,Granite Rapids也将紧随其后。
此外,根据官方消息,代号为Emerald Rapids的第五代英特尔至强可扩展处理器已向客户提供样品,并计划于2023年第四季度发布。从披露的信息来看,这一系统级芯片具备增强的可扩展性和灵活性。其创新架构提供两种不同的插槽兼容处理器,使客户能够便捷处理大多数工作负载,且可互换使用,从而实现更高性价比。主要的技术特点包括:
性能核和能效核基于共享IP、固件和操作系统软件堆栈;
高速DDR和全新高带宽MCR DIMMs;
全新英特尔Flat Memory技术支持在DDR5和CXL内存之间进行硬件管理的数据传输,使总内存容量对软件可见;
CXL 2.0支持所有设备类型,并兼容CXL 1.1;
领先的I/O,最多可达136条PCIe 5.0/CXL 2.0通道和最多六个UPI链路。
未来CPU需要多维创新
作为英特尔的王牌产品,英特尔至强可扩展处理器实现了一个又一个里程碑。据英特尔公司副总裁兼至强产品和解决方案事业部总经理Lisa Spelman介绍,英特尔近期出货了第一百万片第四代英特尔至强可扩展处理器,数据中心产品路线图和产品也都在按计划如期推进。
在今年3月的一场投资者会议上,英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示,五年后,数据中心芯片市场的规模将达到1100亿美元,是去年英特尔投资者大会上所预期市场规模的两倍左右。
究其原因,实际上是不断变化的数据中心市场格局扩大了针对CPU的需求,或者说,数据中心对计算的需求正在刷新。以往,业界常常通过CPU的出货量来衡量市场规模。而现在,插槽数量并不能完全反映芯片创新为市场带来的价值。如今,创新涉及多个维度,包括提高CPU内核的密度、使用芯片中的内置加速器,以及使用独立加速器等,这些都一一在英特尔的至强处理器中得到了体现,也成为未来创新的关键驱动力。