人工智能应用落地正在逐步深入。受疫情影响,很多传统行业更加深刻地意识到 AI、大数据、5G 等技术的重要性,开始加大对 IT 基础架构的投资。此外,在国家产业政策层面,新基建拉开序幕,人工智能、5G、大数据等业务板块又迎来新风口,智算中心的产业投资,都给加速计算市场带来助力。
根据 IDC 发布的《中国半年度加速计算市场(2020 上半年)跟踪》报告显示,2020 年上半年加速服务器市场规模达到 12.9 亿美元,同比 2019 年上半年增长 53.7%。
在整体加速服务器市场中,GPU 服务器目前占据 93.4%的市场份额。但值得注意的是,非 GPU 加速服务器成长势头不可小觑,同比 2019 年上半年增长高达 600%,占整体加速服务器市场 7%,包括:FPGA、ASIC、NPU 等。
IDC 中国分析师杜昀龙告诉<与非网>,非 GPU 加速技术出现如此大的增幅,主要受互联网、政府、服务、电信等行业应用驱动。其中,互联网占大部分市场份额,主要用户为大型互联网公司,因为有些定制化产品需要用到非 GPU 技术,同时也能突显自身在 AI 技术上的差异化优势。
浪潮 AI&HPC 相关业务负责人曾对笔者表示,随着数据中心用户对 AI 算力需求的不断攀升,全球已有上百家公司投入新型 AI 芯片的研发与设计,AI 计算芯片多元化趋势愈发明显。为了应对计算多元化的需求,越来越多的场景开始引入 GPU、FPGA、ASIC 等硬件进行加速。
从 IDC 近年的研究主体也能看出加速计算的格局变迁。对比 IDC 2018、2019 年两份研究报告,会发现 2018 年的研究主体是 GPU 服务器,2019 年的研究主体是加速服务器,调研范围有所扩大。杜昀龙表示,IDC 确实扩大了对 AI 基础架构市场的调研,加入了不同加速技术的研究。
此外,AI 服务器主要是训练和推理两大工作负载,其中,推理在逐年增长。据杜昀龙分析,今年上半年,用于推理的加速服务器占 48%的市场份额。随着大部分 AI 模型训练逐步成熟,用户将会逐渐增大推理方面的投资。同时,边缘计算的发展,也将成为驱动推理服务器发展的重要因素。
根据 IDC 今年 5 月发布的《人工智能基础架构市场(2019 下半年)跟踪》报告,预测到 2021 年,用于推理的服务器将超过用于训练的服务器,达到 51.3%的市场占比。
这也意味着,2021 年或将成为加速服务器竞争格局的分水岭,GPU 服务器增长趋于稳定,非 GPU 服务器包括搭载 FPGA、ASIC、NPU 的服务器增长将比较显著。
不过,不同 AI 加速芯片在构建 AI 计算时有其鲜明特点,也各有其优势所在:
GPU 领域存在大量的开源软件和应用软件,大部分新的 AI 技术会采用 GPU 实现算法加速,GPU 编程的开发资源也更加容易获得,开发部署的难度相对较低。
FPGA 需要开发者对 FPGA 的芯片特性有较为深入的了解,但其高并行性的特性往往可以使业务性能得到量级的提升,同时 FPGA 是动态可编程的,当在数据中心部署之后,可以根据业务形态来配置不同的逻辑实现不同的硬件加速功能。
ASIC 芯片在某些特定场景应用能获得较好的性能加速比,但是 ASIC 开发风险大,需要有足够大的市场来保证成本价格,而且从研发到市场的时间周期很长,在深度学习算法快速迭代的领域应用尚需实际业务场景考验。
由于各芯片厂商在 AI 开发中采用了不同的技术路线,导致芯片的接口、互联、协议上互不兼容,这是目前数据中心用户在 AI 计算基础设施建设中不得不面临的硬件分裂化和生态割裂化的重大挑战。
浪潮方面在与笔者的交流中曾表示,推理服务器、推理平台的发展,是产业 AI 化加速发展的信号,AI 的算法和应用将走向更多的实际应用场景,更多的 AI 推理平台将得以落地应用。
杜昀龙也认为,AI 基础设施正朝着开放式架构发展,为更灵活、更高效的基础设施部署做铺垫。AI 在各行业的渗透不断提高,应用场景也将更加广泛。
对今年全年加速服务器市场的预测,杜昀龙表示,预计市场规模将达到 30 亿美元,其中 GPU 依然占绝大部分市场份额。2021 年,预计 GPU 和非 GPU 加速服务器市场将分别呈现不到 40%和 65%左右的增长,互联网依然是主要的采购行业。