长远来看,英特尔豪赌 167 亿美元收购 FPGA 制造商 Altera 的举动是一笔好买卖。现在,FPGA 已经成为深层神经网络中 GPU 的强力竞争对手;
英伟达应该也已经发现了,微软新的实时云 AI/ 深度学习平台“BrainWave”项目正在采用英特尔的 Stratix 10 FPGA;
在微软早期进行的测试中,其基于 Stratix 10 的“BrainWave”项目中的 FPGA 系统在 FP8 持续计算上达到 39.5 万亿次每秒的运算速度;
微软计划向需要实时人工智能服务的 Azure 客户推介搭载英特尔计算平台的“Brain Brain”项目。
预计英特尔的 FPGA 将减缓英伟达数据中心 / 汽车业务板块的增长速度。
英特尔收购 Altera 时豪掷的 167 亿美金终于见到回报了。现在,Altera 的 FPGA(现场可编程门阵列)产品成为英特尔对抗英伟达基于 GPU 的深度学习神经网络平台的利器。与 CPU(中央处理单元)相比,GPU(图形处理单元)在并行计算方面存在优势,GPU 专家英伟达借此跻身为深度学习计算领域的公认领导者。
然而,英伟达的投资者们应该注意到,微软新的实时人工智能云平台“BrainWave 项目”搭载了英特尔的 Stratix 10 FPGA。微软在选择深度神经网络[DNN]处理单元或 DPU 时,没有选择英伟达的 Tesla 或者 Volta GPU,反而选择了 Stratix 10。 英特尔将从微软在全球各个数据中心大规模部署“BrainWave”项目中获得显著的经济效益。英特尔没有任何独立的 GPU 产品,但它拥有的 FPGA 足以加强其未来在超大型深度神经网络中的作用。
为什么这很重要
现在,以人工智能为中心的数据中心和汽车业务板块为英伟达贡献的季度收入已经超过 5 亿美金。微软在向 Azure 客户提供的 Brainwave 项目中使用 FPGA 后,也可以为英特尔贡献同等规模的季度收入。我估计,除了微软之外,其它涉足人工智能的公司也会在其 GPU 加速的深度学习平台中使用英特尔的 FPGA。
英伟达股价上升到目前的高度,部分原因来自于它在深度学习计算方面的先发优势。微软采用英特尔的 FPGA 加速其深度神经网络也可以帮助提升其股价表现。专注 AI 的投资者们现在应该正视英特尔,它的 Stratix 10 产品让英特尔一跃成为深层神经网络的硬件供应商巨头。
过去三年中,英伟达的股票大幅跑赢了英特尔。未来,应用在微软 Azure 服务业务中的 Stratix FPGA 将成为英特尔进入企业 AI 市场的迟到的船票。
通过 GPU 加速的 Azure 产品,微软与英伟达公司建立了合作伙伴关系。另一方面,BrainWave 项目是微软使用 FPGA 加速器推进其实时人工智能商业服务的举措。
训练深度学习计算机是一个需要高吞吐量的计算密集型过程,GPU 优异的并行计算性能使其成为理想选择。然而,GPU 能够并行处理复杂的训练输入,FPGA 则对加速推理很有效。
加速推理的主要目的是改善服务器与最终用户之间的延迟。 微软对“BrainWave”项目的推广定位是实时(零延迟)AI 平台。因此,英特尔的 FPGA 比英伟达的 GPU 更加适合做微软 BrainWave 项目的 DPU。
BrainWave 项目最终可能用在微软为百度自主驾驶汽车定制的云框架 / 解决方案上。微软是百度自主驾驶汽车业务上的合作伙伴。和微软一样,百度也在其数据中心上使用 FPGA。基于 FPGA 的 BrainWave 项目被标榜为针对计算机视觉、机器学习和深度学习,它可以满足未来自动驾驶汽车的云基础设施需求。
GPU 和 FPGA 是目前虽小但正在快速增长的人工智能服务行业的关键元件。 根据 Tractica 的报告,到 2025 年,与 AI 相关的产品和服务市场规模将增长到 368 亿美元。FPGA 可以帮助英特尔在这个利基市场上更好地竞争。
未来,英特尔真的需要更多 FPGA 产品客户。它需要这块收入来帮助支付它在以 167 亿美元收购 Altera 时发行的 70 亿美元债券。每个新收入来源都可以帮助英特尔恢复因大举投资 Altera 而拉下的饥荒。
为什么英特尔的 FPGA 对微软至关重要
Stratix 10 的 F32 峰值性能仍然明显低于英伟达的 Pascal GPU。 然而,市场正日趋采用紧凑型低精度数据类型(低于 32 位或 FP32)。 TensorFlow 和 Caffe 等 DNN 软件框架支持低精度 FP16(16 位)和 FP8(8 位)数据类型。在这些不需要 FP32 级性能的深入学习 / 机器学习任务中,FPGA 可以大行其道。
对于非常低精度的 2 位和 1 位 DNN 的持续改进和 FPGA 在 FP8 和 FP9 DNN 框架上的出色表现相辅相成。人工智能 / 深度学习并不完全依赖于英伟达 GPU 所擅长的传统密集 FP32 和 FP64 运算。微软的 Brainwave 项目并没有使用 GPU,是因为它还希望能够通过低精度 FPGA 实现更节能的 DNN。不像可以深度定制的 FPGA,当涉及到低精度、稀疏、不规则的 DNN 时,GPU 的表现很差。
在早期测试中,基于 Stratix 10 的 Brainwave 项目中的 FPGA 硬件持续计算性能达到 39.5 万亿次每秒,这个测试是微软在定制的低精度 8 位浮点格式下完成的。随着继续优化完善 Brainwave 项目,预计性能还可以进一步提高。
结论
微软长期以来对 FPGA 的兴趣是英特尔大举押注 Altera 的原因之一。BrainWave 项目是微软 2011 年推出的 Catapult 项目的延续。六年前,微软就已经在其数据中心中配备了 Altera FPGA 加速板。现在,微软正在使用英特尔最新的 Stratix 10 FPGA 来加速基于云的深度学习任务,而不仅仅是传统的企业计算工作负载。
微软早在 2011 年就知道,传统的 Xeon CPU 无法胜任 AI 计算任务。英特尔迅速收购 Altera 的举措表明,它已准备好适应微软转向 FPGA 加速超大型数据中心的巨大转变。我认为,英特尔从来都没有考虑过购买英伟达这样的 GPU 厂商,它看中的是微软大力推动 FPGA 加速云计算背后的趋势,投资的是 Altera 的潜力和 FPGA 的未来。
在数据中心硬件产品上,英特尔不需要拿出自己的 GPU 来与英伟达竞争,它手中的利器是基于 14nm 工艺、面向数据中心加速应用的 Stratix 10。英特尔将继续向数据中心运营商兜售 Xeon 处理器,同时也会努力争取为其 FPGA 获得新的订单。
更多有关 FPGA 的资讯,欢迎访问 与非网 FPGA 专区
与非网编译内容,未经许可,不得转载!