• 正文
  • 相关推荐
申请入驻 产业图谱

AlphaGo又给人工智能添了把柴,Vision C5 DSP想要这样烧

原创
2017/05/26
9
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

AlphaGo 对战柯洁胜了两局,人工智能继去年大败李世石又火了一把,虽然人们针对未来机器人是否会杀死人类的话题争论不休,但是我们也不得不被人工智能的强大所折服,未来它或许会在各个领域超越并替代人类。随着人工智能的发展,无人机、安防监控、手机 / 可穿戴将会更智能化自动驾驶离上路也更近一步。

但是人工智能背后的强力支撑是大数据分析,对智能要求越高,计算任务越繁重复杂,实时系统面临着一个前所未有的挑战:不仅要快速处理所有数据还要针对下一步工作作出智能的决策,卷积神经网络(CNN)是快速处理海量数据的关键。CNN 的应用领域非常广泛,主要包括图像和模式识别、语音识别、自然语言处理,以及视频分析。随着半导体技术的发展,芯片尺寸更小,高度并行处理器的功耗更低,基于卷积神经网络的计算机视觉解决方案将会发挥巨大作用。

Tensilica Vision C5 DSP:灵活编程,适应未来变化

从 2012 年到 2015 年,3 年间神经网络对计算量的要求增长 16 倍,市面上很多芯片厂家都针对神经网络开发了 SoC,但是 SoC 从开始设计到制造,再到真正使用该 SoC 的产品上市需要经过 2 到 3 年的时间。在这个期间,神经网络的算法和厂商需求一直在变化,SoC 厂商要设计怎样的芯片来适应这期间的变化?产品设计厂商也不愿意采用 3 年前的芯片设计当前的产品,因此芯片需要更高的灵活性。相对于市场上固化的硬件加速器,DSP 更加灵活,更能适应未来的变化,降低设计风险。

近日,Cadence 公司针对车载、监控安防、无人机和移动 / 可穿戴设备应用,推出业界首款独立完整的神经网络处理器—Vision C5 DSP。Cadence 公司 Tensilica 事业部资深市场群总监 Steve Roddy 介绍,“它在不到 1mm2 的芯片面积可以实现 1TMAC/秒的计算能力(吞吐量较目前 Tensilica Vision P6 DSP 提高 4 倍),为深度学习内核提供极高的计算吞吐量;1024 8-bit MAC 或 512 16-bit MAC 确保 8-bit 和 16-bit 精度的出色性能;128 路 8-bit SIMD 或 64 路 16-bit SIMD 的 VLIW SIMD 架构。不同的应用对神经网络的计算量要求不同,这款 DSP 可以支持无人驾驶智能手机、智能安防等应用。”

图像处理和神经网络加速二者合一


数据中心工程师可以用成千上万的 CPU 或 GPU 一起做计算,但是嵌入式设备对功耗和体积有很高的要求,这样做显然不适用。通过上图综合对比,DSP 相对于 CPU、GPU 和硬件加速器在开发易用性、功耗效率、可编程性和计算速度方面都具有诸多优势。
 


 

如上图,通过“DSP/CPU/GPU +卷积加速硬件”的模式来进行数据处理时,数据通过 AXI 总线在 CPU/GPU 和硬件加速器之间传输,不仅占用更多资源,而且增加整体功耗。

拿实际应用来解释,基于摄像头的视觉系统在汽车、无人机和安防领域最为常见,这种架构需要两种最基础的视觉优化计算模式。首先,利用传统视觉算法对摄像头捕捉到的照片或图像进行增强;其次,使用基于神经网络的认知算法对物体进行检测和识别。现有的神经网络加速器解决方案皆依赖与图像 DSP 连接的硬件加速器;神经网络代码被分为两部分,一部分网络层运行在 DSP 上,卷积层则运行在硬件加速器上。这种架构不但效率低下,且耗能较高。

Vision C5 DSP 是专门针对神经网络进行了特定优化的 DSP,可以实现全神经网络层的计算(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。因此,主视觉/图像 DSP 能力得以释放,独立运行图像增强应用,Vision C5 DSP 则负责执行神经网络任务。通过移除神经网络 DSP 和主视觉/图像 DSP 之间的冗余数据传输,Vision C5 DSP 的功耗远低于现有的神经网络加速器。同时,Vision C5 DSP 还提供针对神经网络的单核编程模型。

Steve Roddy 表示,“由此可见,Vision C5 DSP 是一款灵活前瞻的永不过时解决方案,支持各类内核尺寸、深度和输入规格。Vision C5 DSP 采用多项系数压缩/解压技术,支持未来添加的新计算层。同时,Vision C5 DSP 搭载 Cadence 神经网络 Mapping 工具链,可将 Caffe 和 TensorFlow 等映射为在 Vision C5 DSP 上高度优化过的可执行代码,充分发挥手动优化神经网络库的丰富功能。”

通过 AlphaGo 和柯洁的本场人机大赛,人工智能会更加强大,DSP 的作用也不言而喻,相信基于 Cadence Tensilica Vision C5 DSP 的芯片也会很快面世。

与非网原创报道,不经允许,不得转载!

相关推荐