昨天,Arm 宣布了其最新的 Cortex-M 系列产品,即新的 Cortex M55。除了新的 CPU 微体系结构带来了一些新的改进之外,我们还看到了新的 Ethos-U55 NPU IP 的引入,该 IP 旨在与新的 M55 内核集成在一起。Arm 的新 IP 旨在在未来几年内提高数十亿低功率嵌入式设备的机器学习和推理能力,并扩展其产品组合以适应新的用例。
Edge AI 是芯片技术的最大趋势之一。也就是说有很多 AI 的功能,可以在没有云端服务器连接的情况下本地运行,最直接的就是提高了运行速度与隐私性。恩智浦边缘处理器高级副总裁 Geoff Lees 表示,“在新的 AI 要求以及成本,延迟,可靠性和隐私性等基于云的处理挑战的推动下,'Empowered Edge'成为一种新的大趋势。Arm 的新型端点 ML 技术将帮助 NXP 众多的微控制器基础开发人员可以加速受尺寸和功率限制的设备的边缘处理。”
先举几个例子:
物联网 AI 的其中一个应用是已经存在的东西,但是使用 Cortex-M55 和 Ethos-U55 可以将其提高到一个新水平。该设备并不是每个人都必须拥有的,但是对于那些需要它的人来说,它可能会改变生活。以下是一些统计数据:在美国,有 1000 万人注册为盲人或部分盲人。在全球范围内,这一数字接近 3 亿。这里我想说的设备是连接的手杖。早期版本已经存在,我们发现是以下版本:WeWalk,这些设备使用感应和导航功能来智能地指导人们避开室内和室外的危险。新 AI 包括新的人工辅助,语音和手势引导的机器交互以及预测性故障传感器系统,将极大的改变生活。
与 Arm 医疗保健创新团队谈到了我们新的 Cortex 和 Eth 操作系统处理器可能会进行重大升级。他们告诉我,如今的连接开发人员面临的最大挑战是对超声定位的依赖。但是超声波的射程和保真度有限,并且所需的传感,处理和电源组件往往会使设计膨胀。
新处理器可以使开发人员使用 360 度摄像头将超声换成支持 AI 的视觉传感。除了无线通信和导航外,还将由能够持续一整天的超薄电池供电。该设备看起来像传统的设备,但却是最终的视觉辅助工具。而且,由于 AI 计算是在本地执行的,因此失去单元连接也没关系。
接下来我们一起看看,新发布的 Cortex-M55 与 Ethos-U55 有哪些新的特性。
新型 Cortex-M55 是与 M33 更紧密相关的新一代 IP,但是它带来了一些新的体系结构改进,在机器学习以及矢量指令方面有望实现较大的性能和灵活性改进。
Ethos-U55 是专用的“ microNPU”专用推理加速器,可与 Cortex-M 类 CPU 结合使用,并提供专用 NPU 的性能和能效,或者通常由 MAC 引擎带到桌面上–类似的 M 级 IP 占用空间小。
Cortex-M55:第一个具有 Helium 和自定义指令能力的 CPU 内核
新的 Cortex-M55 非常重要,因为它是第一个同时具有 Helium(原谅我中文名还不知道怎么叫好)和自定义指令功能的 Arm CPU 内核。Helium 的技术名称实际上是 MVE(用于 M-Profile Vector Extension),是 M 级处理器产品系列中的新矢量扩展和专用矢量执行单元,使其成为该范围内首款具有 SIMD 功能的 CPU 说明。新增功能使新内核的 DSP 性能提高了 5 倍,与 ML 相比,针对 ML 工作负载的优化指令与 MVE 相结合,性能提高了 15 倍。
在整体微架构方面,它是 M33 和µarch 组合的继任者,而且频率的提高将使标量工作负载的性能提高大约 20%,具体取决于供应商的配置。该内核的设计重点是带宽,并启用了需要带宽的新 MVE 和新 ML 工作负载,因此对内存子系统进行了改进,例如具有到 TCM(紧密耦合内存)的 4 个 32 位接口。
Ethos-U55:Arm 的首款 microNPU
Arm 在 NPU 领域相对较晚一点,因为大多数供应商已在产品中采用了自己的第一方 IP 体系结构,而如今大多数供应商都在使用此类实现。但是,嵌入式市场有些不同,因此需要一种面积和功耗比通常在“更大”的实现中(例如,在 Arm 的 Ethos-N 涵盖的移动 SoC 中)所用的产品要小得多的产品, NPU IP。这是该公司用于微控制器的新型“ microNPU”神经网络加速器协处理器中的首个产品。Arm 声称,结合新发布的 Cortex-M55,Ethos-U55 可以在公司现有的 Cortex-M 系列产品上将机器学习性能提高 480 倍。
新的 U55 是一种小型 NPU,可从 32 个 MAC 扩展到 256 个 MAC,并且需要与 Cortex-M 类 NPU 耦合。Arm 并未涉及微体系结构的主要细节,但它是一种非常精简的设计,着重于面积和功率效率,并且具有较小的内存占用量,其中包括我们在 N 系列产品中看到的一些功能,例如重量减压。我们说的是 U55 需要与 M 级 CPU 耦合才能用作控制器,但是实际上,这与 N 系列的功能并没有太大区别,因为该 IP 已经包含 M 级 CPU,专门为低功耗用例设计的。
与上一代解决方案相比,使用 M55 和 U55 的此类系统的性能改进代表了非常重要的步进功能提升。与基于 Cortex-M7 的系统相比,Arm 提供的数据最多可将性能提升 50 倍,同时可将能源效率提高 25 倍。
至于将在何处使用新 IP,则有各种各样的嵌入式系统。在这里我们要明白,这类系统的主要部分实际上将是当前现有芯片的子系统。如果以移动设备为例,您会看到子系统在电话的指纹传感器中使用 IP,在语音助手功能中始终监听音频芯片,甚至在 RF 系统中使用子系统来优化工作负载,例如天线调谐。当今的移动设备中有数百种 M 级处理器将从 ML 功能中受益,其中大多数功能对用户完全透明。
Arm 目前已将 M55 和 U55 许可给其主要合作伙伴,并将在未来几个月内向其他客户开放更广泛的许可。与 IP 一样,如果供应商曾经公开确认他们是否在其产品中使用了这些设计,预计最早的芯片最早要到 2021 年初才能问世。