在游戏玩家眼里,“云玩家”往往用来形容对某一款游戏有间接了解,却没有上手实操过的玩家。不过,在2B市场,被游戏玩家亲切称为红、绿、蓝厂的芯片企业AMD、英伟达、英特尔,却是字面意义上的“云玩家”——因为他们都在扎扎实实地布局云业务。近日,英特尔、AMD纷纷出手收购云服务提供商,围绕硬件、软件平台、系统协调性等维度,进一步完善对云业务的支持。作为数据中心的核心业务,云已经成为芯片巨头看重的增长极。
通过收购调优计算架构
近期,英特尔、AMD分别宣布了对于云解决方案公司Granulate、云服务厂商Pensando的收购,开启了对于计算架构的又一轮调优。
传统应用程序往往与底层基础设施紧密相连,云计算的出现,为分布式应用软件的出现和部署提供了架构和算力基础。但是,云计算和微服务等现代架构,带来了传统操作系统和程序代码无法与高计算硬件性能匹配的问题。较旧的Linux发行版和应用软件库,无法释放和使用高性能CPU的最大潜力。
英特尔对Granulate的收购,是对云计算系统综合协调性的提升。Granulate提供面向云计算的实时优化方案,通过对操作系统资源管理的自动优化,降低CPU使用率和应用延迟,在无需用户修改代码的情况下降低计算开销并提升计算性能,让针对最新CPU的优化亦可在旧版Linux得到应用。Granulate联合创始人兼首席执行官Asaf Ezra相信,未来能够与英特尔一同帮助客户在有效降低成本的同时将工作负载的吞吐量提高5倍。
而AMD对Pensando的收购,是对其异构计算版图和分布式服务平台的补充和强化。Pensando 的分布式服务平台包括可编程的数据包处理器和全面的软件堆栈,能够从网络、安全、存储等维度加速云服务。
Pensando代号为P4的可编程数据包处理器,可以对标英特尔的IPU(基础设施处理器)、英伟达的DPU(数据处理器),是专为降低数据中心CPU负载而设计的专用芯片。Pensando董事会主席John Chambers表示,Pensando 在软件定义云、计算、网络、安全和存储服务等方面的技术,将丰富AMD的产品组合,帮助AMD打造适合未来10年数据中心发展的计算格局。
“红绿蓝”厂云端布局忙
云服务是一个比拼综合实力的战场。芯片企业要将架构、处理、加速、负载、软件等方方面面做优做细,才能让云计算这种涉及分布式计算、并行计算、存储、虚拟化、负载均衡等多个维度的复杂算力系统,变成用户眼里像用水用电一样简单的黑盒。
对云的支持,贯穿了英特尔的DCG(数据中心解决方案事业部)、PSG(可编程解决方案事业部)、NSG(非易失性存储器解决方案事业部)等部门。DCG提供面向云服务提供商等细分市场的工作负载优化平台,以及CPU、IPU、AI加速器等硬件产品。PSG面向云等市场,提供FPGA和结构化ASIC等可编程半导体产品。NSG提供基于英特尔 3D NAND 技术的下一代内存和存储产品,客户包括企业和基于云的数据中心等。
后摩尔时代的新宠异构计算,在云服务市场有着充足的施展空间,而英特尔也为此更新、出新了一揽子芯片产品。首先是作为主心骨的数据中心CPU,2021年,英特尔推出代号“Ice Lake”的第三代至强可扩展处理器,面向云端工作负载的要求进行了设计和优化,谷歌云、亚马逊等云服务提供商已经推出了基于Ice Lake的服务器、云主机、虚拟机等服务。为了减轻CPU负载,英特尔公布了两种专门处理基础设施任务的IPU,分别基于FPGA和ASIC架构。为进一步提升计算效率,英特尔还推出了面向数据中心AI解决方案的Habana Gaudi加速器,亚马逊云计算服务在EC2(弹性计算云服务)中推出了采用 HabanaGaudi 的实例,用于训练深度学习模型。
在收购赛灵思、Pensando之后,AMD也将形成较为全面的异构计算版图,包括霄龙系列作为数据处理处理器、AMD Instinct MI200 系列GPU加速器、赛灵思提供的FPGA以及Pensando的数据专用处理器。至2021年第四季度,亚马逊EC2、IBM云、微软Azure 云服务提供商已经推出130 多个由AMD驱动的公共实例。
其中,霄龙处理器的最新版本将强化对云的支持。2021年,AMD得益于云和企业客户越来越多地采用霄龙处理器,数据中心收入同比增长一倍。在第四代霄龙处理器中,预计2023年推出的“Bergamo”将采用新的“Zen 4c”处理器内核,该内核专为云原生工作负载而设计。
同时,作为主力GPU厂商之一,AMD还面向云游戏提供视觉处理能力。其Radeon PRO V620 GPU将为云游戏提供数据中心视觉性能。英伟达正在采用 Ryzen Threadripper PRO 推动下一代云游戏体验。
云计算的计算挑战,甚至让以GPU加速器在数据中心市场站稳脚跟的英伟达,推出了用于HPC 和云计算的高性能 CPU,代号“Grace”。加上英伟达力推的BlueField DPU系列,包含CPU、GPU、DPU的异构计算格局正在显现。
作为可交付的异构计算产品,蓝、绿、红厂也在尝试CPU+GPU的计算架构。英特尔通过Falcon Shores架构,将x86与Xe显卡集成在服务器的同一插槽,将在每瓦性能、计算密度、内存容量与带宽方面实现超过5倍的性能提升。英伟达推出了CPU+GPU的超级芯片Grace Hopper,通过互连技术实现CPU 和 GPU 之间的 900 GB/s 双向带宽。另据媒体报道,AMD在论文中探讨了一种高性能芯片,包含CPU芯片、GPU芯片和HBM内存堆栈。
新格局下计算挑战日趋严峻
随着企业和个人用户对于计算和存储的需求越来越大,以及新冠肺炎疫情防控期间数字经济加速发展,云计算市场正在加速扩充,为芯片企业带来了更多的机遇。艾媒咨询数据显示,2021年全球云计算(IAAS+PAAS+SAAS)市场规模为2654亿美元,预计2022年达3105亿美元。
芯谋研究高级分析师张彬磊向《中国电子报》记者表示,云计算对CPU、GPU、BMC(基板管理控制器)、存储芯片、交换机芯片和光芯片都有需求,其中存储芯片和光芯片的需求量体量将大增。而CPU、GPU、BMC、交换机芯片需要主要体现在技术发展上,当下业内提出来的DPU、TPU都是在CPU等基础上加速数据处理的芯片,未来需求也会增加。
但也需注意的是,云计算市场的竞争格局也处于变化中,对于芯片企业提出了新的要求。
从竞合关系来看,芯片企业和云厂商已不再是单纯的卖方和卖方关系。云厂商也在进行芯片开发,以提升硬件基础与业务本身的契合性。亚马逊、谷歌、阿里等云厂商都发布了自研的数据中心芯片。
“过去云计算服务厂商是数据中心芯片的主要买家,如今云厂商纷纷自研芯片,一方面可以减少对第三方芯片厂商的依赖;另一方面在特定需求领域,云计算厂商自研芯片可以达到价格、能效的最佳平衡,在软硬一体化上进行更快的创新并提高安全性和灵活性。” 赛迪顾问集成电路产业研究中心总经理滕冉向《中国电子报》表示。
尤其与主力芯片企业不同的是,许多头部云厂商选择用Arm架构自研芯片,亚马逊研发的Graviton 处理器、阿里巴巴旗下半导体公司平头哥自研的倚天710等芯片,都采用了ARM架构。
“可以看到,多种架构正在争相进入数据中心芯片领域。ARM处理器的ISA复杂度更低,开发成本更低。很多的云计算厂商都在大力投入ARM架构产品,未来更多的数据和应用将在边缘产生和处理。终端与云同构、低功耗、高效能的ARM芯片或将成为更多服务器厂商的选择。”滕冉说。
不过,云厂商往往会将研发资源投入到核心处理器上,而非像芯片企业一样开发多种类型的芯片,并通过封装、互连技术和软件栈形成平台化的计算资源池。如何提升架构兼容性,并通过接口和软件平台,使云厂商的自研芯片便捷接入异构计算平台,获取定制化的计算服务,将成为芯片企业在云市场的重要课题。
“芯片企业在云市场的竞争主要聚焦在应用端和技术端两个方向。在应用端以客户粘性为基础与更多的应用场景结合,从而获得更多企业客户认可,逐渐建立起B2C和B2B2C的商业应用模式。在技术端,更低的延时更高的数据处理能力是云计算业务能否快速占领市场的关键。” 张彬磊说。
作者丨张心怡
编辑丨连晓东
美编丨马利亚