目前,高端智能手机 CPU 都有一个叫做“神经处理单元”的处理架构,但这真的会影响你吗?
科技巨头们已经完全接受了人工智能革命。苹果(Apple)、高通(Qualcomm)和华为(Huawei)生产的移动芯片,旨在更好地解决机器学习任务,每种芯片都采用了略有不同的方法。华为今年在 IFA 上推出了麒麟 970,其被称为第一个有专门的神经处理单元(NPU)的芯片。接着,苹果推出了 A11 仿生芯片,iPhone 8、8 Plus 和 X 搭载的都是这款芯片。A11 仿生特性就是苹果所说的“专为机器学习而设计”的神经引擎。
上周,高通宣布推出 Snapdragon 845,它将 AI 任务发送到最合适的内核。这三家公司的做法并没有太大的差别,最终归结为每个公司向开发者提供的接入水平,以及每个设备的耗电量。
在讨论之前,让我们来看看 AI 芯片是否与现有的 CPU 完全不同。最近,在行业中,经常可以听到的关于人工智能的术语是“异构计算”。它指的是使用多种类型的处理器的系统,每个处理器都有专门的功能,以获得高性能或降低功耗。这个想法并不新颖,现在许多芯片组都使用异构计算,苹果、高通、华为这三家新推出的芯片只是在不同程度上使用了这个概念。
过去三年,智能手机 CPU 一般都采用了 Arm 的 big.LITTLE 架构,该架构将速度相对较慢、节能的核心与更快、耗电更快的内核进行配对。主要的目标是尽可能少的使用电源,以获得更好的电池寿命。第一批使用这种架构的手机包括拥有自主研发手机处理器 Exynos5 芯片的三星 Galaxy S4,以及华为的 Mate8 和 Honor6。
今年的“人工智能芯片”将这一概念向前推进了一步:要么增加了一个专门的组件来执行机器学习任务;要么,在 Snapdragon 845 的情况下,使用其他低功耗内核来执行。例如,Snaplong 845 可以利用它的数字信号处理器(DSP)来处理需要大量重复计算的长时间运行的任务,比如侦听热词。高通公司产品管理总监 Gary Brotman 表示,像图像识别这样的活动,是由 GPU 更好的管理的。Brotman 负责 Snapdragon 平台的 AI 和机器学习。
与此同时,苹果的 A11 仿生应用在其 GPU 中使用了一个神经引擎,以加快人脸识别,Animoji 和一些第三方应用的速度。这意味着,当启动 iPhone X 上这些过程时,A11 就会打开神经引擎,进行必要的计算,要么验证你是谁,要么把你的面部表情映射到对话框。
在麒麟 970 上,NPU 接管了一些任务,比如扫描和翻译用微软翻译器拍摄的图片中的单词。微软翻译器是目前为止唯一针对该芯片组进行了优化的第三方应用程序。华为表示,“HiAI”异构计算结构最大限度地提高了其芯片组中大多数组件的性能,因此,它可能会将人工智能任务不仅仅分配给 NPU。
A11 仿生的两个“性能”核心和四个“效率”核心
除了差异之外,这个新的架构意味着,以前在云端处理的机器学习,现在可以在设备上更高效地执行了。通过使用 CPU 以外的部分来运行 AI 任务,手机可以同时做更多的事情,因此在等待翻译或找到要找的图片时,不太可能会遇到延迟。
另外,在手机上运行这些过程,而不是把它们发送到云端,对保护用户隐私也有好处,因为这减少了黑客获取用户数据的潜在机会。
这些 AI 芯片的另一大优势是节省能源。电力是一种宝贵的资源,需要审慎分配。GPU 倾向于吸收更多功率,所以如果 DSP 的能效更高,效果相似,那么最好是利用后者。
需要说明的是,在执行某些任务时,并不是芯片组本身决定要使用哪个内核。Brotman 说:“今天,这取决于开发者或 OEMs 的运行方式。”程序员可以使用支持的库,比如谷歌的 TensorFlow(或者更确切地说,它的 Lite 移动版本)支持的库来指定在哪些内核上运行他们的模型。
高通、华为和苹果都在使用 TensorFlow Lite 和 Facebook 的 Caffe2 这样最受欢迎的神经网络库。高通还支持较新的开放神经网络交换(ONNX),而苹果通过其核心的 ML 框架为更多机器学习模型增加兼容性。
到目前为止,这些芯片都没有带来很明显的好处。不管芯片制造商吹嘘他们自己的测试结果和基准,这些最终都是毫无意义的,直到人工智能成为我们日常生活中更重要的一部分。我们正处于设备上机器学习的早期阶段,而且使用新硬件的开发人员寥寥无几。
不过,显而易见的是,这场使在设备上执行机器学习相关的任务更快,更省电的竞赛正在进行。我们只需要再等一段时间,就能看到这个架构对 AI 的真正好处。
更多相关内容,欢迎点击人工智能继续阅读!
与非网编译内容,未经许可,不得转载!