当前,支持数据存储、人工智能和多元化内容的工作负载正以前所未有的速度迁移到云,数据中心服务器市场高速增长。不过,目前大多数云基础设施仍在使用30年前的x86架构处理器技术,而对高性能、高能效和更低的总拥有成本的需要,加快了非x86架构处理器的发展,Arm处理器正在成为这一进程的主力,一些相关公司正在引人注目。
创立于2018年的Ampere Computing是其中颇具代表性的一家服务器芯片公司,该公司目前主推产品是号称全球首款云原生处理器的Ampere Altra,该处理器内核基于64位Arm处理器,专为云定制,Ampere Computing强调其具备可预测性、可扩展性和高性能。
据Ampere Computing首席产品官Jeff Wittich介绍,作为云原生通用处理器,Ampere Altra可在云环境下运行所有应用。从Web服务器到数据库到缓存解决方案,再到视频编码,甚至AI推理,Ampere Altra在性能上超越传统x86处理器3倍之多,在性能功耗比上领先近4倍。
Ampere Altra针对云工作负载特性而进行了一些设计,例如该处理器每个内核仅运行一个单线程,并保持一致的高频率,因此避免了因服务器上多个用户而导致的性能不佳的问题。
在利用率方面,Ampere Altra可以将内核数扩展至128核,并为每个核提供大容量低延迟的专用缓存。借助智能高带宽mesh互联结构,所有高性能核都连接在一起,打破了传统的CPU在需求增加时会产生递减回报的使用瓶颈。Ampere Altra采用先进的DDR和PCIe技术设计,可实现最大容量,扩展内存和IO的带宽。此外,所有必要的服务器级RAS、可管理性和平台安全功能均可实现横向扩展部署,并为客户提供“开箱即用”的体验。
Ampere Altra系列有两个产品,其中Ampere Altra内置80个Armv8.2核,频率为3.3 GHz;Ampere Altra Max则内置128个Armv8.2核,频率为3.0 GHz,两款产品都支持128通道高速PCIe Gen4和8×72 ECC保护的DDR4 3200内存。
在AI推理上,Ampere Computing也正在推进部署。基于Ampere Altra的AI方案支持TensorFlow、PyTorch和ONNX框架。其硬件支持原生FP16数据格式,与FP32相比,速度提高了近2倍,且大多数AI模型几乎没有精度损失。该公司提供了一个易于使用的Docker容器,其中包括计算机视觉和自然语言处理模型示例和基准,以使开发人员能够快速入门。
一项MLPerf的测试显示,Ampere AI优化框架+Ampere Altra Max的组合,使用FP16时,吞吐量比AWS Graviton高出5倍,比x86竞争产品高出2倍以上。
在另一项面积功耗比的测试中,Ampere Altra的单核功耗比传统CPU低67%以上,其32核处理器的功耗比同等的x86 CPU低 4.6倍,性能高出2倍。得益于此,Ampere Computing开辟了其他竞争对手无法涉足的新领地——汽车自动驾驶,他们正在和通用汽车旗下自动驾驶子公司Cruise进行相关合作。
Ampere Altra得到了市场积极的反馈:虚拟主机平台Plesk通过甲骨文云搭载Ampere Altra,仅第一个月就推出了1000多个实例,实现了有史以来最快的产品推广速度。
微软最新的Azure虚拟机也采用了Ampere Altra,该虚拟机系列包括通用Dpsv5和内存优化的Epsv5虚拟机,微软声称这些虚拟机的性价比比基于IBM x86的虚拟机高出50%。
其他终端用户,如红牛车队、GenyMobile、墨尔本大学、布里斯托尔大学和耶拿大学,也都在相关云环境应用中采用了Ampere Computing的处理器。
目前,包括微软、甲骨文、腾讯、阿里、Equinix Metals、CloudFlare、京东、优刻得、Hetzner等众多公司在他们的服务器中使用Ampere Computing的方案和产品,全球已有40多个服务器平台支持Ampere Altra,7家全球最大的超大规模数据中心正在部署该公司产品。
其中,腾讯云推出了基于Ampere Altra处理器SR1的实例。阿里云不仅推出了基于Ampere Altra处理器的c6r和g6r实例,还推出了基于Ampere Computing处理器的手机云游戏服务。京东也推出了两款基于Ampere Altra处理器的实例,一款用于计算、一款用于存储。
除了云服务提供商,Ampere Computing同ODM和OEM服务器业务的合作也在不断扩大,包括富士康、技嘉、浪潮、超微和纬颖等。最新的消息是,Ampere Computing已经开始为特定客户的服务器提供下一代处理器Ampere One的样品。新CPU采用公司自研核(也是以ARM ISA为基础,并且能够与Altra和Altra Max兼容),5nm工艺,支持DDR5和PCIe 5.0接口。至此,Ampere Computing拥有并行的两大产品家族——基于Arm的Ampere Altra系列和基于自研核的Ampere One。它们分别适用于不同工作负载、细分市场和应用程序。例如为边缘场景设计的32核40W产品,以及为超大规模数据中心负载设计的128核125W产品。
不久前,来自路透社的消息称,Ampere Computing在4月份已秘密申请在美国IPO。