加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

CPU、GPU、FPGA、ASSP、ASIC几种芯片产品越来越接近?该选哪一个

2016/06/21
6
阅读需 32 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

英伟达新推出的 GeForce GTX 1080 游戏显卡采用了该公司最新的帕斯卡架构,并且使用了采用 16nm FinFET 工艺制造的芯片。GTX 1080 上的 GP104 图形处理单元包含 72 亿颗晶体管,运行速度可达 1.6GHz,可以超频至 1.733 GHz。这颗芯片的硅片尺寸为 314 平方毫米,比前一代 GeForce GTX 980 上采用 28nm 工艺生产制造的图形处理器小了 21%。据称,开发这项技术花了英伟达 20 多亿美金。

GeForce GTX 1080 使用了图形处理单元(GPU)架构,说是可以突破功耗 / 性能的平衡。但是,当把 GPU 和标准的中央处理单元(CPU)放在一起比较时,哪个表现更胜一筹呢?再或者与更类似 GPU 且成功进入高性能计算系统的现场可编程门阵列FPGA)相比呢?

AMD 公司的技术和工程高级副总裁 Mark Papermaster 在 DAC 的一次主题演讲中吹捧“摩尔定律+”时代的到来。他说,CPU、GPU 和加速器可以带来沉浸式的计算体验。业界已经认识到,这种计算能力“需要采取系统设计方法才能达到”。

每种类型的计算引擎都有各自的优点。CPU 能够在低延迟下实现高负载的运算,GPU 能实现最高的单管脚带宽,而 FPGA 则可以用于多种通用设计。

但是同样,每种引擎也都有各自的局限性。CPU 需要在先进的工艺节点下实现更高的整合,GPU 则受限于能放在其上的内存大小的限制。

“FPGA 能够连接到和 CPU 一样类型的存储器,”Rambus 公司企业级解决方案技术副总裁兼杰出发明家 Steven Woo 称。“FPGA 这种芯片的灵活性特别高,对于特定的应用或加速应用,他们能够改进性能,并实现更佳的能源效率。”

英特尔公司去年年底完成了以 167 亿美金收购 Altera 公司的交易,看中的就是 FPGA 能够提供的灵活计算加速能力。微软在其 Bing 搜索引擎中采用 FPGA 来提升性能,因为 FPGA 能够帮助其实现成本和功耗的平衡。不过,采用 FPGA 来设计低功率、高性能的设备却不是一件容易的事情。

“现在提供一个通用的解决方案越来越难了,”Woo 表示。“一些设计团队开始设计时采用 FPGA,然后把在 FPGA 中开发的逻辑固化成一颗 ASIC,他们起步时采用 FPGA,然后观察一下市场的增长情况,这可以帮助他们合理地评估开发 ASIC 的成本。”

除了在许多微处理器中使用的行业标准 x86 架构,ARM 的架构主宰着移动器件市场,并正在针对数据中心服务器进行细化调整。市场上有来自开源 RISC-V 的 ARM 架构开源内核、出自 OpenPower 的 POWER CPU 架构,在 x86 领域也有来自 AMD 的竞争。不过,最终选择哪种芯片取决于使用情况和具体应用。

“这种决策需要平衡考虑成本,性能和功耗,”Woo 表示。“CPU 仍然是非常好的中流砥柱,也很灵活。”当谈到 CPU 上运行的软件程序时,Woo 表示,“不一定非要写成向量化代码。”

GPU 能够实现更好的图形接口,他们比通用 CPU 更具有针对性。FPGA 则能覆盖多个市场,最近它们甚至开始进入数据中心和超级计算机领域。

“人们编写的代码所涉及的领域每个月都会发生变化,而且这种变化以各自的方式在加速,”Woo 表示。可重复编程和可重新配置的 FPGA 可以适配用于各种算法,“不用经历设计 ASIC 带来的痛苦。”

ARM 公司 CPU 事业部技术总监 Peter Greenhalgh 表示,CPU 代表着“芯片世界强大有力的一面。”在另一方面,他指出,对于高带宽的计算,“GPU 的表现非常好。”


可编程能力虽好,但并非处处通吃
FPGA 介于入 CPU 和 GPU 之间,这使得它们很适合用于工业、医疗和军事设备,在这些领域中 FPGA 发展势头良好,但即使在那里,FPGA 也并非通吃。

莱迪思半导体公司的工业和汽车事业部产品营销总监 Deepak Boppana 指出,莱迪思历史上是一个 FPGA 公司。“今天,我们拥有更广泛的产品组合,”他说,并特别指出增加了专用标准器件(ASSP)这一产品品类。

“我们和其它 FPGA 公司不同,”Boppana 继续说道。莱迪思的 FPGA 可以提供“更低的功耗、更低的成本,以及不同形式的外形。”

根据 Boppana 的说辞,莱迪思特别重视将可连接性加入到其产品线中。通过收购 Silicon Image 公司,莱迪思现在拥有针对 HDMI 应用和其他用途的 ASSP。该公司目前提供用于摄像头显示器的 CrossLink 桥接芯片,该芯片是一颗可编程 ASSP,可在低于 10 毫瓦的功耗下运行,同时以每秒 12Gbits 的速度支持 4K 超高清视频。

Boppana 表示,该芯片集成了很多硬 IP,并拥有 FPGA 的灵活性。CPU 和 GPU 通常不具备正确类型的接口。“CPU 能很好地实现多路控制,但一般都不具备多路数据接口。”

英特尔收购 Altera 的行为表明了“采用 FPGA 对 CPU 进行加速的趋势”,他说。目前的趋势是将 CPU 和 FPGA 搭配或集成在一起用于高性能计算应用。

Lattice 则另辟蹊径,“不针对高负荷计算加速,”Boppana 说。“我们做的是用于低端市场的更小的东西。”该公司的 FPGA 主要针对消费电子物联网,正好是云计算等大型重度计算的反方向。对客户来说,选择芯片类型时会“归结到他们的具体要求”,Boppana 总结道。因此,他们可以选择 CPU 以获得最佳性能。“当需要满足多种性能水平,并具备广泛的接口时,FPGA 开始变得更具吸引力。很多客户都会同时使用 FPGA 和 CPU。”

Cadence 公司 IP 事业部首席技术官 Chris Rowen 说道,许多现成的硅解决方案,如 ASSP 和 SoC,被应用到了很多硬件平台上。“一般是用在低市场容量和高附加值这些情形中,”他指出。“现成的硅方案比你能想到或负担得起的更通用。”

Rowen 补充说。“对很多这些应用,有多种针对特定应用的产品,这样的手机应用处理器或那样的手机应用处理器。”

所以,设计者应该选择 CPU、GPU 还是 FPGA 呢?“正确的答案是,在很多情况下,一样也不选,要选 ASSP。”Rowen 说道。“你需要一种混合芯片或聚合器件。”

业界已经习惯于在板级进行集成,Rowen 说。“板级集成在一些情形下是必须的,”他说。这种选择的缺点是“成本相对高价、功耗也较高。”

FPGA 可以填补对小批量 ASSP 的需求,CPU 架构则可以与 FPGA 互补。对于 GPU,“则取决于你想要进入哪个细分市场。”这方面主要包括两大类显卡:用于游戏和其它应用的高性能显卡,以及更多更倾向于嵌入式类型的产品,比如汽车和消费级产品,功率预算介于 5 瓦和 10 瓦时间。“10 到 20 年前存在 CPU 市场,然后它也发生了变化,现在主要针对服务器或 Windows PC。已经不是很久之前我可以使用通用芯片的时代了,现在已经不存在通用 CPU 芯片了。”

简单来说,处理器市场都已经被定向了,这反映在不同的应用上。在高性能计算或超级计算应用中,GPU 通常被用在基础设施的配置上,IO 则用于系统的扩展,他说。

Rowen 提到了英特尔和 Altera 的合并。“加速器绑定到基础设施上,这是 FPGA 可以发挥作用的地方,”他说,“英特尔和 Altera 的团队正在通力协作,我肯定能够看到英特尔服务器处理器芯片的优化越来越好,并且和 FPGA 一起在服务器中服役。”

在英特尔的高性能计算战略中,Knights Landing 处理器是非常关键的一个因素。

“在大批量的应用中,使用 ASIC 是个非常常见的选择,而在一些产量要求并不高但需要一些特定功能的应用中,ASIC 也有用武之地。”他说。在这种应用中选用 ASIC 的缺点是,为了满足特定需求而不得不承受 ASIC 的高成本。公司始终都需要计算盈亏平衡点。Rowen 指出,有一些可以替代 FPGA 的方案,比如由 eASIC 公司提供的金属可编程芯片。“也许,你可以转用一次性工程费用低且出货量大的 ASIC。”

从 Rowen 的角度来看,设计路线为从 FPGA 到中低批量 ASIC,再到大批量 ASIC,最后到客户自有工具(COT)。

那么,到底该选择什么呢:CPU,GPU,FPGA,ASSP,ASIC?最好的答案依然是:这要看情况。

更多有关 CPU 的资讯, 欢迎访问 与非网 CPU 专区

与非网编译,未经许可,不得转载!

 


 

相关推荐

电子产业图谱