在收购 Nervana 系统公司仅仅几周之后,英特尔再度出手了,该芯片巨头此次下手的对象是 Movidius,这是一家低功耗计算机视觉硬件制造商。这是英特尔向深度学习硬件战略转向的一系列举措之一,这种类型的硬件和英特尔传统的摇钱树 - 典型 CPU- 有着很大的不同。按照我对机器学习领域内的收购合并活动的研究套路,我们首先快速地调查一下英特尔的收购对象,然后讨论一下此举对英特尔和广大的机器学习市场的潜在影响。
许多从事机器学习的公司在产品声明上都有意无意地模糊不清(正如上图中英特尔的声明那样),而 Movidius 公司则非常清楚鲜明地专注于低功耗系统级芯片深度学习硬件上。此前我曾指出,通用 GPU(大部分来自于英伟达公司)是大规模机器学习的主要运算部件,但是,这种类型的器件在某些方面却不够灵活,无法支持最近使得神经网络的训练更有效率的研究进展(主要是使用低精度 /8 位整数型权重因子)。
这种发展趋势必然使得专门用于深度学习的硬件需要针对矩阵运算型神经网络训练的具体需求进行全面的优化。没有任何一款通用 GPU 能够满足这种任务的所有需求。今年早些时候,谷歌曾经披露称,它使用一款定制芯片驱动其机器学习云计算平台(Tensor 处理单元)已经有一年时间了。Movidius,这家成立刚刚八年的公司,已经以实力证明了它充分地理解机器学习的需求,并且可以因应其对专用硬件的需求。该公司的旗舰级产品采用的是 Myriad 2 芯片架构。
这项技术看起来相当惊艳。值得注意的是,它并不是像谷歌的 Tensor 处理单元那样的专用集成电路(ASIC),只支持一种类型的运算。它是一款可编程的处理器,能够支持各种精度模式,并在不同的框架下实施神经网络训练。开发者可以使用相关的软件开发工具包定义他们自己的处理流水线,然后使用 Myriad 的手动优化库将自定义的流水线运行在芯片上。Myriad 2 处理器已经被联想用于其 VR 产品计划中。
使用 Myriad 2 芯片架构的最有趣的产品似乎是 Fathom,它被称为神经计算棒:
从样子上看,它确实是一根集成了 Myriad 技术的 USB 棒。任何支持 USB 的设备,比如树莓派或者安装在无人机上的摄像头,都可以插在 Fathom 上面,并通过它运行程序映像,而消耗的功率仅为 1 瓦。
就像在非服务器级设备上运行的大多数深度学习用例,神经网络(比如用于图像识别)在类似于谷歌的 TensorFlow(它集成了 Fathom 框架)框架上对庞大的离散数据进行训练(大问题需要数周的训练时间)。经过充分训练的神经网络的压缩版随后被部署在移动设备上,在移动动设备上就不再进行更多的训练,只是进行分类。
低功耗深度学习现在成了热门研究课题。首先,研究者试图找出如何更方便地在智能手机上实施深度学习的方法。智能手机的架构比较复杂 - 除了 CPU 之外,它还有专用的 GPU 和信号处理单元,这些都可以用于运行搜索、虚拟助理或其他应用程序中的神经网络。而 Movidius 似乎对智能手机不大感兴趣,而对物联网等其他设备比较感兴趣,这也正好符合英特尔的战略规划,这就是它为什么会被英特尔收入囊中的原因。
要点
我们可以进一步挖掘 Movidius 公司的更多技术细节。英特尔为什么需要这些技术,原因也很明显,事实上,英特尔告诉我们,它想将 Movidius 的芯片整合到其 RealSense 平台中。
总体来说,这次收购的战略重要性要高于之前对 Nervana 系统公司的收购。考虑到 Movidius 产品的成熟程度(Nervana 今年晚些时候才会发布其第一款 ASIC)以及它对英特尔的战略重要性,如果收购价格低于几亿美金,那将是令我感觉非常惊讶的一件事情。
这桩收购的大背景是,英特尔进入深度学习的阵营有点晚了。该公司目前正在部署大量资源,以改变落后态势。然而,我倒希望英特尔未来几年仍然坚守在服务器级深度学习上。目前,开发人员和深度学习框架都依赖于英伟达的 GPU 进行重度计算。
英伟达公司目前也正在涉足自动驾驶平台。这并不是说英特尔没有机会赶上来了。问题的关键是,这次收购使得英特尔能够更快地进入新的市场(物联网感知),而在这个市场上英伟达及其重度计算平台并不具备竞争力,所以,这是一个英特尔无需面临艰苦战斗的市场,这步棋走得好。
更多有关深度学习的资讯,欢迎访问 与非网深度学习专区
与非网编译,未经许可,不得转载!