作者:九林
在数据中心需求增长的趋势下,核心芯片的角逐越演越烈。各方力量不留余力的推动自身数据中心的发展时,服务器作为数据中心最核心的硬件,其芯片也备受关注。
早期的服务器芯片,由RISC架构一统天下。后来随着,英特尔推出X86架构,逐渐挤压RISC处理器市场,在很长的一段时间内,AMD和英特尔都占据着服务器市场的主流,其中英特尔市场份额超过90%,AMD则吃掉剩下的部分。
多年来,业界一直在问:“ARM架构能够在数据中心觅得一席之地吗?”
早年的折戟
ARM架构进攻服务器市场并非易事。ARM阵营进入服务器芯片市场的谋划已有多年,早在2008年,ARM就开始酝酿服务器芯片计划,惠普、AMD、博通、高通等美国企业都曾发布过ARM架构的服务器芯片,但全都折戟。
Calxeda早已倒闭,Applied Micro后来将ARM架构服务器芯片业务卖掉,甚至连三星都在产品开发完成之前就终止了业务,从服务器领域溜之大吉。
当时,很多人将这些公司失败的原因归结于性能。认为ARM服务器芯片完全无法媲美x86竞品的性能。但是在2018年,高通推出了首款ARM的高效服务器芯片Centriq 2400,最低40核,最高48核,基于三星10nm工艺打造。使用的是自研FalkorCPU核心,三缓为60MB,旗舰级价格为1995刀。
当时高通号称,当运行SPECint_2006时,Centriq 2460性能比英特尔 Purley铂金8160高出7%,芯片性能数据非常出色。
尽管高通还请来了阿里、铿腾、安迈等巨头撑腰,但一阵吵吵嚷嚷之后,最后也只有一家表示DDOS防御平台从X86更换成了ARM。后来,高通宣布削减在“非核心”产品领域的支出,计划关闭服务器芯片部门,而高通一手操办服务器芯片的Anand Chandrasekher也离职了。
高通轰轰烈烈的ARM服务器芯片最终也以失败结尾。
从性能角度来看,高通当年推出的CPU不输当时的主流服务器芯片,但高通仍然失败了。
这其中,一部分原因在于高通想要削减在“非核心”产品领域的支出,从而减少了在新领域探索的力度,但更大一部分原因在于当时ARM服务器市场的生态尚未搭建成功。
直到2019年,ARM的Neoverse平台路线图的推出,其对服务器市场的渗透率开始有了实质提升。2020年苹果、微软相继宣布将发布基于ARM 的 PC 产品,华为鲲鹏、亚马逊、Facebook等纷纷布局基于 ARM 的自研服务器芯片,完善ARM架构生态。
随着全球最大云计算亚马逊在自己云计算的ARM架构CPU Graviton真正部署起来,并且占到自己数据中心绝对量的20%时,这才标志着ARM架构CPU在服务器行业上量的转折。
崛起的背后
根据TrendForce数据预测,随着云数据中心的采用逐渐增长,预计到2025年,ARM架构在数据中心服务器市场渗透率将达到22%。这个数据意味着基于ARM架构的服务器,将在未来3年实现翻倍增长,这也意味着ARM将带来不可逆的行业变化。
为什么曾经使得众多企业“折戟”的ARM服务器芯片,现在却开始崭露头角?
这需要从三个方面来看:
第一个方面,是服务器芯片的巨大市场。服务器的市场就非常庞大,知名研究公司IDC的数据显示,去年云计算基础设施的总支出为739亿美元,同比增长8.8%。彭博行业研究分析师曼迪普·辛格(Mandeep Singh)指出,仅数据中心处理器每年就能创造280亿美元的收入。
巨大的服务器市场,需要的是巨额的服务器芯片。而在这个高端计算市场,单颗芯片的售价高达数千美元。以高通为例,目前,高通提供的手机芯片通常定价在几十美元。相比之下,最高端的服务器处理器每颗芯片的价格超过1万美元。这就是服务器芯片能够带来的巨额利润,在这种情况下,类似高通的芯片厂商也希望能够在服务器市场中分上一杯羹。
第二个方面,是ARM产品的最强优势——低功耗。在数据中心领域,功耗早就成为了一个重要的问题,随着服务器群的扩展,每个大服务器群都将消耗惊人的电量。众所周知,ARM架构正是凭借其低功耗的优势,占领了手机领域的市场。
现在,凭借这一优势,ARM同样打入了云服务器厂商中。许多AWS的客户表示,与现有英特尔、AMD的服务器CPU相比,他们租用基于ARM架构的Graviton芯片节省了10%~40%的计算成本。
正因如此,ARM服务器芯片最先落地的领域就在云服务器厂商。对这些云计算厂商来说,能够节省巨额的功耗,就能带来不少的收益。
第三方面,是曾经被诟病的性能。虽然,在过去的一段时间内,ARM架构处理器性能没有x86架构处理器性能强,甚至业内一度认为X86架构芯片能够轻而易举的阻挡ARM架构芯片。但是,现在ARM架构处理器的性能已经赶上甚至超越X86架构处理器。
ARM单核的面积仅为 X86 核的 1/7,同样芯片尺寸下可以继承更多核心数。通过“堆核”的方式,使得ARM架构处理器在性能快速提升下,也能保持较低的功耗。根据Ampere给出的数据,其CPU的性能超越传统x86处理器3倍,性能功耗比领先近4倍。与 x86 服务器CPU相比,Ampere Altra 系列可用50%的能耗,提供200%的性能。
ARM奔向战场
近年来,ARM架构的的兴起下,许多巨头纷纷开始自研ARM架构的服务器芯片,包括国外的亚马逊、谷歌甚至微软,国内的腾讯、阿里巴巴、华为等等都积极参与其中。
曾经失败的高通似乎也在尝试再次进军服务器芯片市场,去年收购了芯片创业公司Nuvia,而Nuvia创立的目标是打造高性能的ARM服务器芯片。
ARM的服务器芯片有三大目标市场即云计算、HPC和边缘计算。
云计算阵营
在云计算领域上,ARM可以说已经取得了相对领先的成功。亚马逊云、甲骨文云、Azure和阿里云等巨头纷纷入局ARM云主机市场。
腾讯云在2021年底发布了CVM 标准型SR1服务器,可用于各种类型和规模的企业级应用等。这款服务器吸引人的地方不在于其他配置,而是内置的ARM处理器——2.8GHz的Ampere Altra处理器。根据相关评测,SR1服务器的算力性价比超过了同等配置的S5(配置Intel至强Platinum 8255C CPU)服务器,最高有83%的性能提升。
去年,阿里旗下的平头哥发布自研云芯片倚天 710,它基于 ARM 架构,官方称之为 “全球性能领先的云原生处理芯片”,性能超过业界标杆 20%,能效比提升 50% 以上。
作为少数IT服务商转型而来的云厂商,华为云可以利用华为在服务器等硬件方面的优势,可以提供基于华为鲲鹏芯片的ARM实例,作为自研的ARM主机提供商,华为与亚马逊云和阿里云属于一类,一方面可以靠鲲鹏生态,一方面要靠华为服务行业的经验。
2021年,UCloud也推出了基于Ampere Altra处理器的主机,UCloud官方列出了与同等配置x86主机的价格差异,大致相差35%,应用场景方面,包括各类数据库系统、Redis集群、分布式开源存储方案,安卓相关的仿真测试和开发测试,云手机以及嵌入式开发等。
此前一直没有采用ARM芯片的谷歌云,在今年也宣布将开始采用基于ARM技术的芯片,使用将基于Ampere Computing的Altra芯片。
在较大的云厂商中,似乎只有IBM云,目前还没有使用ARM架构芯片。
当然,也有的规模较小的云厂商觉得,现阶段推出ARM主机的做法不划算,并没有推出ARM服务器的的打算,对于采用AMD的x86服务器倒是更热衷一些,目前,还是x86的实用性更强一些。
自研也好,用第三方的ARM平台也好,整体而言,ARM服务器的云浪潮开始涌起。
HPC阵营和边缘计算阵营
在HPC方面,日本RIKEN实验室的“Fugaku”超级计算机凭借152064个48核富士通A64FX处理器位列世界第二。Fugaku使用的ARM架构CPU,采用定制的ARM V8架构,依托7纳米FinFET制程技术生产。浮点运算部分是与ARM合作开发的SVE指令扩展,使用512 bit浮点运算单元,大幅强化运算能力。
美国能源部下属的桑迪亚国家实验室宣布建造ARM处理器的超算Astra,浮点性能达到2.3PFLOPS。
英伟达也推出主要面向大型数据密集型 HPC的Grace ,内置下一代 ARM Neoverse 内核,每个CPU能在 SPECrate2017_int_base 基准测试中单位时间运行超过 300 个实例。
边缘计算方面,英伟达正扩大与 Marvell 的合作,将基于 ARM 的 OCTEON DPU 与 GPU 相结合,加速 AI 工作负载,实现网络优化和安全。
实际上,ARM自身也在不断推出助力芯片企业进入高性能计算场景的平台,先后相继推出了Neoverse V系列、Neoverse N系列和Neoverse E系列。
目前有三家国内的初创公司正进行基于Neoverse N2的相关产品开发。其中,遇贤微电子和鸿钧微电子是致力于云原生服务器 CPU 的开发,云豹智能则是针对 DPU 领域。
总结
我国厂商在 ARM 生态中布局甚广,华为鲲鹏和天津飞腾芯片均有 ARM 架构台式机和服务器芯片,ARM 生态整机厂商包括长城、浪潮、同方、曙光等,国产操作系统亦广泛支持。
从服务器芯片的发展历程来看,在2010年,很多企业只能采用X86芯片,经过2010年到2020年的十年攻关,完成了X86向ARM架构的软件移植。现在,ARM凭借着自身优势,开始在服务器领域冲锋陷阵。