加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

云服务商纷纷部署FPGA,让计算密集型应用大幅度提速

2017/10/30
13
阅读需 25 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

机器学习大数据分析、实时视频流处理等计算密集型应用不断涌现,云计算的应用范围也不断扩展,通过增加 CPU 数量提升计算能力的方式已经失去优势,云服务提供商把目光转向“异构计算”。FPGA 在加速方面的优势有目共睹,云服务商纷纷部署专为加速各种高性能工作负载而优化的计算引擎。首届赛灵思开发者大会在北京举行,作为会议主办方,赛灵思及来自云计算产业链硬件工程师软件工程师和嵌入式工程师齐聚一堂,进行了技术交流和产品分享。

众所周知,软件工程师的数量远远大于硬件工程师的数量,而随着 FPGA 的应用领域不断扩大,只靠硬件难以服务于广大的软件工程师和嵌入式工程师,因此赛灵思进行了重要转型。赛灵思 IP 产品开发高级副总裁 Salil Raje 介绍,“从 C++到 RTL 的转换是赛灵思转型的核心,包括高层次综合工具和软件应用工具。这一转型体现在两个方面:一是在芯片方面;二是在软件工具上面。如今赛灵思引入了面向大规模数据中心和加速器领域的 SDAccel 可重配置加速堆栈,以及面向嵌入式系统的 SDSoC 堆栈,把足迹扩展到从数据中心到嵌入式系统的广阔领域。以嵌入式系统市场为例,SoC 和 FPGA 的工程师规模大概有 10 万名,预计在五年的时间里,我们的潜在用户会增加五倍,数量从 5 万增加到 25 万。”

在解决方案设置上,赛灵思为更多用户的差异化创新提供支持。Salil Raje 解释,“在端上,有 SDSoC 开发软件加上 reVISION 堆栈,开发者可以形成新的使用 MPSoC 的开发方式;在云上,有 SDAccel 加可重配置加速堆栈帮助客户在云端开发应用。由此可见,在端上,用 SDSoC 和 reVISION 堆栈可以写出嵌入式的应用,在云上,SDAccel 和可重配置加速堆栈使得 IP 可以作为处理器在云端运用。reVISION 堆栈的目标应用是自动驾驶汽车无人机、监控,可重配置加速堆栈的目标应用是超大型数据中心和 FPGA 加速应用。”


左:赛灵思战略市场发展高级总监 Andy Walsh
中:赛灵思 IP 产品开发高级副总裁 Salil Raje
右:赛灵思全球销售和市场部亚太及日本地区总监 Stephen Chow

FPGA 加速帮助多种应用实现提速


FPGA 云加速有多厉害?这需要应用案例来证明。赛灵思战略市场发展高级总监 Andy Walsh 介绍了来自深鉴科技、NGCODEC、Ryft 和 Edico 基因组的应用。其中,深鉴科技通过 FPGA 进行机器学习推断、语音识别,速度可以提高 40 倍;NGCODEC 利用 FPGA 做视频解码,HEVC 编码的帧速率达到 10 倍加速;弹性搜索是现在企业最广泛使用的搜索工具,这可以帮他们找到需要的数据,同时把噪音或者干扰的数据分离出去,Ryft 专门做大数据搜索,核心竞争力在算法,他们使用 FPGA 开发了一款应用,可以使弹性搜索加速 90 倍;在医学领域,重危新生儿的基因组测序和基因学分析需要快速出结果,现在通过 Edico 基因组对医学的贡献,可以把基因组分析和测序的时间压缩从 24 小时压缩到 20 分钟,这一研究结果已经进入到吉尼斯世界纪录里面。

Andy Walsh 强调,“Edico 除了在亚马逊云上直接向医院销售以外,还可以向软件提供商销售服务,可以在云上面把服务销售给医院和科研机构。 Edico 的例子对于赛灵思意味着,规模化会带来巨大的影响。我们只需要很少数量的云生态系统,就可以联系到几千家企业和几百万个用户。”

FPGA 和 CPU 的集成对两者都造成损害
“CPU+FPGA”的异构架构已经得到大量应用,但是业界一直在寻求更低功耗、更快速度的解决方案,英特尔自从收购 Altera 以后,一直致力于把 CPU 和 FPGA 进行单芯片集成,从而缩小芯片面积、提高 CPU 和 FPGA 的通信速度,但是这种做法是否切实有效?Andy Walsh 表示,“过去一年半的时间里,FPGA 和 CPU 的集成方式在云计算领域并不是特别受欢迎,它对两者的性能造成很大的损伤,甚至更加严重的损坏,在加速应用中,超大规模的数据中心需要非常高端的加速器,串联进行联合。而且 FPGA 和 CPU 集成在功耗上的改善非常有限,一般都是一个中档 CPU 和低端的 FPGA 以 1:1 的方式组合,这并不是一个非常好的解决方案,不能满足以上的使用案例,而以上的这些案例才是驱动 FPGA 应用的最大动力和发展趋势。”

“现在我们有一个名叫 CCIX 的倡议,赛灵思是发起者之一,FPGA 和 CPU 之间的一个 C16 高速接口,所有 FPGA 的销售商都一起合作,促成 FPGA 和 CPU 的结合,包括华为也在做有利于 FPGA 和 FPGA 之间结合的协同工作。”Salil Raje 补充。

未来 FPGA 是否会取代 CPU?
FPGA 的性能越来越强大,应用范围也在不断扩展,可能会有人问,在未来 FPGA 能否取代通用 CPU 或者脱离 CPU 独立运行? Salil Raje 指出,“在云以外的一些应用 FPGA 可以取代 CPU,但是如果在云上,FPGA 更多被视为一种协处理器,可以减少 CPU 的数量。在配置方面,一个 CPU 加八个、十个 FPGA,它们相互可以交流,从而减少 CPU 的数量,但是主机还是 CPU。FPGA 在其它应用当中完全独立于 CPU 运行,比如很多最终使用场景,如监测摄象头就不需要额外的 CPU,因为在 Xilinx 的方案中既有 FPGA 又集成了 ARM 架构的 CPU,。还有一些无线通信无线通信只需要 FPGA,不需要 CPU。”

在大会现场,我们还看到了赛灵思的合作伙伴展出的产品及演示。


深鉴科技:基于赛灵思深度学习和语音加速方案

随着微信、微博的发展,视频内容大量产生,而大部分是无效信息,而且视频内容处理起来非常复杂,深鉴科技选择在模型上删除不重要的部分,使模型更小但效果更高,模型变小之后再进行压缩提高效率;随后使用一个训练模型,这个模型采用低精度的数据,在计算的时候速度更快。在研发过程中,深鉴科技发现 FPGA 比 GPU 快 10 倍,比 CPU 快 30 到 40 倍。而且 FPGA 延时非常低,这对于以推测为基础的机器学习来说非常重要,而且 FPGA 非常灵活,可以适用不同的机器学习的应用模型。


华为云 FP1 高性能实例演示

华为的这一实例展现了 Gzip 压缩算法,左边是经过 FPGA 加速的压缩处理过程,右边是通过 CPU 视频处理的过程,可以看出左侧的压缩速度远远快于右侧,可见 FPGA 加速方案性能相对于 CPU 有近 4 倍的提升,动态逻辑加载和切换实现秒级完成。

与非网原创报道,未经允许,不得转载!

更多相关内容,请参照:与非网 FPGA 专区

亚马逊

亚马逊

亚马逊公司(Amazon,简称亚马逊;NASDAQ:AMZN),是美国最大的一家网络电子商务公司,位于华盛顿州的西雅图。是网络上最早开始经营电子商务的公司之一,亚马逊成立于1994年,一开始只经营网络的书籍销售业务,现在则扩及了范围相当广的其他产品,已成为全球商品品种最多的网上零售商和全球第二大互联网企业,在公司名下,也包括了AlexaInternet、a9、lab126、和互联网电影数据库(Internet Movie Database,IMDB)等子公司。

亚马逊公司(Amazon,简称亚马逊;NASDAQ:AMZN),是美国最大的一家网络电子商务公司,位于华盛顿州的西雅图。是网络上最早开始经营电子商务的公司之一,亚马逊成立于1994年,一开始只经营网络的书籍销售业务,现在则扩及了范围相当广的其他产品,已成为全球商品品种最多的网上零售商和全球第二大互联网企业,在公司名下,也包括了AlexaInternet、a9、lab126、和互联网电影数据库(Internet Movie Database,IMDB)等子公司。收起

查看更多

相关推荐

电子产业图谱