纵观服务器的发展,在大型机、小型机/x86时代之后,已经步入了多样化计算的新时代。这主要来自于丰富的智能应用和大量数据对计算能力提出的更高要求。一方面,受摩尔定律制约,CPU性能提升有限;另一方面,5G、AI加速了移动的进程和数据量的爆发。
随着计算负荷呈指数趋势增长,单机或小型服务器已经无法满足算力需求,未来将有大量的人工智能应用和服务被放在云端。提升单个数据中心的计算能力、增加数据中心的工作负荷,成为未来的发展趋势,这也是为什么,“加速计算”大行其道。
根据IDC最近发布的《中国半年度加速计算市场(2021上半年)跟踪》报告,2021年上半年加速服务器市场规模达到23.8亿美元,同比增长85.1%。
这一增幅足以说明了加速计算的发展势头,笔者在去年年末的《2021年或将成为加速计算分水岭》一文中,就曾提出:随着人工智能应用的落地深入,加之疫情影响,很多传统行业更加深刻地意识到 AI、大数据、5G 等技术的重要性,将会进一步加大对 IT 基础架构的投资。此外,在国家产业政策层面,新基建拉开序幕,人工智能、5G、大数据等业务迎来新风口,都给加速计算市场带来助力。
在近来与IDC中国分析师杜昀龙的交流中,他分析了今年上半年整体加速服务器市场增长的主要因素,主要有两大驱动力:一是新基建政策的带动以及智算中心、超算中心等算力平台的建设。二是持续增大的行业需求,互联网依然是最大的采购行业,占整体加速服务器市场60%以上的份额,同比2020年有90%以上的增长;此外,金融、服务、电信、制造和能源行业均有超过50%的上涨。
此外,在所有的拉动因素中,疫情是一大动因,使得“线上化”快速成为新常态,一些传统行业更加深刻地意识到AI、5G、大数据等技术的重要性,促使各企业加大对IT基础架构的投资,一部分建设需求快速落地。
GPU服务器仍是主导,但非GPU增速达127.1%
整体加速服务器市场中,GPU服务器依然以91.9%的市场份额占据主导地位,达到21.9亿美元规模,同比增长82.2%。但值得注意的是,NPU、ASIC 和 FPGA等非GPU加速服务器以127.1%的增速占有了8.1%的市场份额,达到1.9亿美元。
对比IDC去年上半年的数据来看,GPU服务器市场份额为93.4%,今年的91.9%实则是出现了微幅滑落;而非GPU加速服务器方面,去年的增长势头就非常强劲,同比2019年上半年增长高达600%,占整体加速服务器市场7%。今年更是进一步扩大份额,达到了8.1%。
在微妙的份额变化中,其实体现了AI落地过程中所带来的变化。去年在与浪潮AI&HPC相关业务负责人的交流中,该负责人就指出,未来三年AI产业化将走向产业AI化,传统行业市场智能化升级将迎来爆发期。现在看来,非GPU服务器的微幅增长,正在逐步验证这一发展逻辑。
AI已经成为企业寻求业务增长、改善用户体验、保持竞争力的主要方式之一。随着应用场景逐渐成熟,AI在各行各业的渗透逐渐深入,NPU 、ASIC及FPGA等芯片,无论部署在云端还是边缘端,各种专用功能将越来越清晰。
而这类非GPU芯片在推理服务器、推理平台的发展,正是产业AI化加速发展的信号。随着AI算法和应用走向实际场景,更多的AI推理平台将得以落地应用。
杜昀龙认为,近几年内处于主导位置的仍将是GPU,因为不论是算力、生态或整体技术领先性,GPU已经通过十几年的发展构筑了核心优势,特别是在云端训练场景。2020年加速卡的采购主要集中在搭载英伟达V100、V100S、A100和T4的加速服务器上,同时英伟达发布的A10、A30、A40等新型号加速卡部分领域也已经开始使用。
相较于GPU,NPU、ASIC等芯片在边缘推理应用中,具有易于开发、高性能、低成本和低功耗等优势,随着应用场景越来越丰富且细化,需要专用芯片来支撑,这些都给非GPU类型提供了增长机会。根据IDC调研,2021上半年,用于推理工作负载的加速服务器已经达到53.5%,预计到2025年将超过60%。
“当一个新场景出现时,首先需要针对场景进行特定模型训练。而一旦训练成熟后,就要落地到实际应用中,也就是针对最终用户进行推理应用,这其实就是一个成本回收的过程”, 杜昀龙解释了推理应用爆发的商业逻辑,“训练就相当于是先期搭建基础设施,而推理是真正产生收益的过程”。
根据IDC预测,到2025年中国加速服务器市场规模将达到108.6亿美元。其中GPU和非GPU服务器市场规模分别为82.9亿美元和25.6亿美元。对比当前数据可以测算出,届时整体加速服务器市场规模约是现在的4.56倍,其中,GPU服务器增长约3.78倍,非GPU增长约达13倍,二者市场份额悬殊逐渐缩小,非GPU呈现出更为强劲的增长势头。
华为服务器颓势明显,黑马杀出
2021年上半年,从厂商销售额角度看,也出现了显著变化。过去连续三年以来,基本都是浪潮、华为、曙光位居前三。今年,宁畅以黑马之姿跃居第二,市场份额达到13.8%,新华三、安擎也增速显著,而华为则下滑明显,份额由去年上半年的22.9%下滑至今年上半年的8.1%。
销售额方面,浪潮、宁畅、华为位居前三,占据70%的市场份额;从服务器出货量角度看,浪潮、宁畅、安擎位居前三名,占有60%以上的市场份额。
华为受断供等因素影响,供货已经出现明显缺口。根据一些公开信息,甚至出现弃标等情况,这也释放出来一部分市场容量,供其他从业者量力进行卡位。此外,智能应用对多样化计算、定制化算力的需求,也给类似宁畅这样的新创民营企业,提供了千载难逢的发展机遇。
宁畅CEO秦晓宁告诉<与非网>,伴随各行业场景融入AI技术,其面临的场景痛点和对服务器的性能需求也有差异。随着新基建政策落地、5G应用等业务场景的拓展,不同行业、规模的用户对AI服务器以及定制AI服务器的需求将会继续增加,这些因素都直接推动了宁畅出货量的高增长。
服务器市场存在了很多年,这期间各大厂商百家争鸣,但许多用户的需求其实未充分满足。在秦晓宁看来,尤其是针对中小型互联网以及云计算企业,是十分值得关注的方向。如何在性能、密度、可扩展能力以及运维成本之间达成平衡?如何充分利用计算资源、存储资源以及网络资源,根据业务需求对资源进行弹性配置,达到优异的性价比和能耗比?各行各业对数据中心服务器产品的定制化需求日趋高涨。
秦晓宁表示,以上这些恰是宁畅的核心优势。当前,中国加速计算服务器市场发展向好,AI产业迎来迅猛发展,国家政策利好下,AI商业化发展的经济环境近年趋于稳定。根据IDC的《2020-2021中国人工智能计算力发展评估报告》显示,AI服务器市场规模占AI基础设施市场的87%以上,由此可见,AI服务器对AI行业发展的重要性。
她透露,其实宁畅团队专注服务器研发、生产已有15年之久,早在宁畅创立前,便拥有近百万台服务器生产部署经验,可提供全栈服务器定制化服务。除成熟的产品平台外,宁畅还可就用户需求对产品进行包括外观、功能、BIOS、BMC等软件及硬件定制开发,旨在降低整体拥有成本的同时创造业务价值最大化。
写在最后
加速计算服务器市场已经开始出现震荡,留给未来的悬念有:GPU与非GPU服务器,在智能边缘应用等推动下,份额变化是否会进一步加剧?非GPU服务器中,NPU、ASIC、FPGA等,谁将成为主导?英伟达已经开始从云端训练向推理市场进行拓展,这对广大有志于撼动GPU地位的初创企业来说,又将带来哪些阻力?此外,华为断供变数有无回旋余地?是否有新的黑马进一步领先竞争?……这都是未来的加速服务器市场值得继续追踪的关键。
不管怎样,AI的发展、日益复杂的工作负载以及非结构化数据的爆炸式增长,正迫使数据中心快速进行变革。正如杜昀龙所言,各行业与AI的深度结合及应用场景的不断成熟与落地,使AI芯片朝着多元化的方向发展,服务器的类型也将越来越丰富,并适用越来越多的行业应用场景。
杜昀龙认为,AI服务器厂商应该提升硬件服务、优化服务器设计,给客户提供低延迟、低功耗的算力的同时,还能满足用户对不同芯片和服务器的选择,只有这样,才能支持多样化、细分化的场景应用需求,支持训练模型和行业开发套件在企业中的实际落地。