加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

寒武纪研发国际首个深度学习NPU,光靠指令集就能吃饱?

2017/04/28
88
阅读需 15 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

 

芯片是战略要地。目前 GPU 芯片在深度神经网络训练领域获得大范围的应用,但受制于功耗、应用优化性等方面的限制,仍有众多的巨头和初创公司在该领域积极探索,英特尔 2016 年发布 Nervana AI 处理器,可加速各类神经网络。谷歌 2016 年也发布了自己的 ASIC 芯片 TPU,用于加速深度神经网络,微软AMD百度等也相继加入战局。

寒武纪研发了国际首个深度学习专用处理器芯片(NPU),目前其 IP 指令集,已扩大范围授权集成到手机、安防、可穿戴设备等终端芯片中,2016 年就已拿到 1 个亿元订单。

执行董事罗韬 26 日表示,目前寒武纪深度学习处理器,若以阶段性论,还处于相当于“ARM”的授权阶段,未来一年内,将推出芯片问世,并拟与台积电先进工艺制程展开合作。

寒武纪之所以想要开发一款专用的深度学习处理器,因为有必要有专门的深度学习处理处,来提升效能与克服降低功耗。通用芯片与专用芯片相比,就像是一把万能的瑞士军刀与菜刀之比,想要切菜得好,必须有专用的菜刀堪用。而深度学习是处理智能应用迄今最好的方法。

罗韬表示,AI 已经在很多领域超越了人脑。但是传统的 CPU/GPU 处理深度学习效率低下,他举例,AlphaGo 使用上千个 CPU 和数百个 GPU,下一盘棋的电费就高达 3000 美元,相当耗能。

而寒武纪的目标,据称,是要让 1 瓦以内功耗的摄像头、手机、甚至手表都能和 AlphaGo 一样“聪明”。

光靠 NPU 指令集就已赚钱
他也分享目前寒武纪的近況。就在 2016 年国际计算机体系结构年会中,约有 1/6 的论文都引用寒武纪开展神经网络处理器研究。

目前寒武纪设立了三条产品线:首先是智能终端处理器 IP 授权,智能 IP 指令集可授权集成到手机、安防、可穿戴设备等终端芯片中,客户包括国内顶尖 SoC 厂商,目前已经开始投入市场。而 2016 年全年就已拿到 1 个亿元订单。这也使得寒武纪研发了国际首个深度学习专用处理器芯片,于 2016 年第一年成立,就实现盈利。

其次,在智能云服务器芯片领域:作为 PCIE 加速卡插在云服务器上,客户主要是国内的知名服务器厂商。

另外,家用智能服务机器人芯片:从智能玩具、智能助手入手,使服务机器人独立具备看听说的能力。客户是各类下游机器人厂商,产品的推出将比智能云服务器芯片更晚一些。

日前中科院还注资 1000 万元,这 1000 万元专项资金一方面用于人工智能芯片的基础性研究,探索下一代人工智能芯片的架构、算法以及在一些新型场景(如 AR/VR)中的应用开发方法。

下一阶段重点 流片商用问世
据指出,DianNao 是寒武纪系列的第一个原型处理器结构,平均性能超过主流 CPU 核的 100 倍,但面积和功耗仅为 1/10,效能提升可达三个数量级。

寒武纪处理器能直接面对大规模神经元和突触处理,一条指令完成一组神经元处理,相比传统执行 x86 指令集的芯片,有数量级的性能提升,未来在云服务器和智能终端上的图像识别语音识别人脸识别等方面有着较广应用前景。

而迈入下一个阶段,寒武纪从 IP 指令集授权,到推出商用芯片问世,预料是目前紧锣密鼓筹备的重点。

相关人士也指出,寒武纪目前锁定与台积电最先进的工艺制程合作,其中对其量产成熟的 14 纳米工艺很有兴趣。预期最快一年后流片。

行业人士还指出,国内现在高端芯片设计领域的实力已经提升,但是国内晶圆代工厂的工艺制程还没跟上节奏,包括展讯 14 纳米找英特尔代工、兆芯 14 纳米 CPU 也都选择与台积电合作。

相关人士表示,目前看国内芯片厂的技术节点仍落于国外两到三个世代,在 28 纳米工艺制程还未站稳脚跟的当下,在国内选择综合考量上,高端芯片会多倾向以选择台积电、GLOBALFOUNDRIES 为主,而台积电则又较具两岸优势。

更多最新行业资讯,欢迎点击与非网《今日大事要闻》

英特尔

英特尔

英特尔在云计算、数据中心、物联网和电脑解决方案方面的创新,为我们所生活的智能互连的数字世界提供支持。

英特尔在云计算、数据中心、物联网和电脑解决方案方面的创新,为我们所生活的智能互连的数字世界提供支持。收起

查看更多

相关推荐

电子产业图谱