Channel: 曹顺程
Description: JF3010 AI芯片+自研AI算法，边缘计算，如虎添翼

在消费电子市场上，智能手机，智能家居、可穿戴设备以及智能音箱等各类智能硬件产品中，AI 已被广泛应用。智慧城市、智慧交通、智慧物流等行业市场 AI 应用正加速落地；AI 也将成为自动驾驶的重要核心技术之一。可以说 AI 技术正不断的渗透到各行各业，并且发挥越来越重要的作用。与此同时，对于 AI 应用的性能要求也将越来越苛刻。低延迟、低成本、超节能逐渐成为 AI 技术在端侧应用的必要条件。

捷飞科芯的 AI 芯片及解决方案正是为应对这一挑战运用而生。

低时延、低成本、超节能

JF3010，这是一款革命性的 AI 芯片，低时延、低成本、超节能，是目前业界性能功耗比最强的 CNN 加速器。JF3010 由捷飞科芯（上海）计算技术有限公司团队研发，这是一家重点以人工智能技术的深度研究以及 AI 计算加速芯片的设计为发展方向的企业。

JF3010 产品特性：

计算峰值速度：2.8Tops/ 秒
单芯片峰值功耗：223 毫瓦
封装后面积：6mm x 6mm
时钟范围：50-200 MHz
片上储存器类型：SRAM
片上存储能力：8 MB
图片输入尺寸：448 x 448
外部接口：USB 3.0
网络拓展：支持多芯片级联
适配神经网络：VGG16，ResNet 18， MobileNet-V1, 其他类似网络
生产工艺：28nm

JF3010 相较于传统 CPU 和 GPU 的架构，去除了外部 I/O，去除了数据总线，采用分布式矩阵架构，分布式储存单元，具备超高速通信，可以在低时钟周期内实现海量并行运算，与市面上的 AI 芯片性能指标对比，JF3010 性能功耗比一骑绝尘，将近是同类产品的 4 倍。

JF3010 有如此强的性能主要依赖其分布式矩阵架构——基于 MPE 与 APiM 架构，免外部 DDR、存内计算，可以提供分类、检测、分割场景的软硬件一体化解决方案。

MPE 与 APiM 架构解析：

APiM 消除了由于 AI 海量数据重复计算带来的数据移动瓶颈:

显著提升 AI 计算速度
大规模降低芯片能耗

芯片能耗分配:

I/O=70%; Bus=20%; Calculating=10%

APiM CNN 加速芯片新特性：

一次性神经网络预装
无需数据总线
无需外挂存储器
外部数据直接流过芯片完成 CNN 计算

APiM 架构无缝支持多芯片级联，方便完成各种规模的 AI 计算硬件组合。

JF3010 AI 芯片能通过 MDK 适配通用 AI 算法，同时捷飞也自研调试了专用 AI 算法。

GNET 方案目前包含三大类自研算法

结合捷飞科芯特有的 AI 芯片架构，捷飞科芯同时推出了一套 GNET 自研算法，将完美的实现算法与芯片的融合，充分发挥硬件本身的计算能力，大幅提升 AI 芯片计算单元的执行效率，“最大算力”将不再是个空洞的指标，而是给用户实实在在的体验。捷飞科芯 GNet 方案目前已正式发布了分类(Classification)、检测(Detection)、分割(Segmentation)三大算法。

通过 TensFlow、Caffe、PyTorch 等平台，进行通用模型的量化，结合捷飞芯片进行加速运算。