加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • eFPGA IP业务的发明者
    • eFPGA IP的优势?
    • 最适合eFPGA的应用市场有哪些?
    • AI典型案例介绍:数据中心
    • AI典型案例介绍:ADAS
    • eFPGA潜力巨大,但需要市场培育
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

为何说eFPGA是最适应AI时代的计算芯片方案?

02/06 16:36
6490
阅读需 20 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

eFPGA IP业务的发明者

自1984年以来,FPGA市场一直在增长,但未经历爆发性增长。FPGA以其硬件可编程性和高性能而被广泛应用于技术前沿,尤其在新技术和标准的早期实现和中小规模部署中发挥作用。随着数据量的爆炸性增长使得传统的处理模式受到挑战,这为FPGA行业带来了新机会,越来越多的应用将任务从CPU转移到FPGA处理,以发挥FPGA在能效和处理延迟方面的优势。

我们都知道FPGA的发明者是赛灵思,但今天要介绍的则是eFPGA(嵌入式FPGA)业务的发明者——Achronix。

2016年,源于客户的强烈需求,Achronix开创了eFPGA IP市场。

自成立以来,Achronix一直致力于高端FPGA市场和eFPGA技术的发展,也是目前唯一同时提供高性能高密度独立FPGA芯片和eFPGA IP解决方案的供应商。

Achronix的核心特点包括高端、高带宽FPGA,如采用7纳米工艺的Speedster7t系列,配备高速接口、二维片上网络(2D NoC)和机器学习处理器(MLP)等先进技术。

另一个显著特点是Speedcore eFPGA硅知识产权(IP),即提供FPGA技术授权给客户,使客户能够为其ASIC/SoC添加可编程逻辑阵列。

可以说,高端FPGA芯片、eFPGA IP和基于高端FPGA芯片的先进加速卡这样的产品组合目前在全球范围内是独一无二的。得益于其Speedcore eFPGA IP等旗舰产品,该公司已在多个行业领域授权了超过1500万个eFPGA。

近年来新兴市场的快速成长要求企业在投入巨大成本和时间进行开发时,要更多地考虑利用FPGA技术。企业数据中心边缘计算解决方案在不同发展阶段对硬件的要求各异,他们需要灵活适应应用规模和使用量。为此,Achronix提出了一种新的可编程硬件应用模式,能够适应不同阶段的需求。例如,研发初期和早期部署可以使用符合PCIe等标准接口的加速卡,而全面量产时则可选择独立FPGA芯片,应用规模进一步上升时,可选择eFPGA IP产品来定制SoC或ASIC。

Achronix Semiconductor中国区总经理郭道正

近日,接受了与非网记者的采访。郭总毕业于上海交大,拥有二十余年FPGA行业经验。他介绍了Achronix在高端FPGA和eFPGA IP领域的创新与市场领导地位,同时也强调了Achronix在FPGA领域的专注和特殊定位。“虽然eFPGA IP授权是需要市场接受的一个新概念,需要时间来培育和教育市场,但这种技术在新市场和新技术应用中的价值非常显著。尤其在网络连接、新一代通信自动驾驶ADAS等领域,其中eFPGA因其低成本和高效率而成为理想解决方案。” 郭道正表示。

eFPGA IP的优势?

郭道正指出,Achronix提供的Speedcore eFPGA IP目前已非常成熟,在不同工艺节点上已得到充分的生产制造验证。相比之下,FPGA可以采用较老的工艺来生产,例如55/60nm、40nm或28nm,而eFPGA通常需要更先进的工艺,比如16nm、12nm、7nm、5nm和3nm。这主要是因为eFPGA的客户群体通常是高性能应用,需要先进的工艺来满足他们的需求。

除了工艺先进、可编程、高性能之外,eFPGA IP在成本上可以低至相当于独立FPGA芯片的10%。对于芯片设计企业来说,购买Achronix的eFPGA IP授权合作模式,类似于购买Arm内核授权,这可以大大缩短为SoC或ASIC设计开发可编程逻辑阵列的时间,并提高芯片的性能和延长其生命周期。相对于独立FPGA芯片,eFPGA的成本大幅降低,功耗也显著减少,还可以利用优化的内部连接和布局来提高性能。

此外,这种模式更适合客户在新兴市场上逐渐扩大自己的规模,可以在保持高性能和高性价比的同时,维持创新性。郭道正还表示,所有在Achronix FPGA上开发的IP都可以复用,从而最大化利用现有开发成果,提高经济效益和灵活性,避免标准演进、算法更新和市场变化导致重新研发的困境。

eFPGA IP另一个优点是支持chiplet。以Fraunhofer研究所为例,目前就在新项目中充分利用Achronix的Speedcore™ eFPGA IP。这个项目主要是高速ADC与Achronix的eFPGA IP连接,用于雷达以及无线和光通信中的预处理。相关多芯片系统解决方案将由多个chiplet组成,用于探索芯片间的事务层互连技术,如束线(BoW)模式和通用chiplet高速互连协议UCIe。这些chiplet相比传统通过印刷电路板连接的分立器件,具有更低的延迟、更高的带宽和更低的成本。

最适合eFPGA的应用市场有哪些?

据了解,eFPGA IP的竞争对手并非传统的FPGA芯片制造商,也不直接与CPU或其他处理器IP形成竞争关系。相反,eFPGA在芯片设计中充当可编程和可升级的硬件加速器,其优势在于能够提供高效的并行处理和低延迟,这些特性是CPU无法或者难以实现的。因此,eFPGA的引入更多地是取决于向客户展示其在整体芯片设计中的价值。此外,随着技术发展,特别是chiplet技术的广泛应用,Achronix也在支持客户基于eFPGA做chiplet组件的模式,以实现创新。

据介绍,目前Achronix针对中国市场的eFPGA业务也在积极展开,尽管市场每年都在增长,但仍处于早期阶段。郭道正表示,Achronix全球所有客户嵌入eFPGA的芯片产品的出货量在前年超过了1500万个,虽然与通用处理器IP的出货量相比不算多,但对于行业来说已是不小的数据。

郭道正对与非网记者表示,FPGA在处理大模型方面的灵活性和高效能使其成为硬件加速的理想选择。同时,随着AI技术的进一步发展和应用的扩展,eFPGA的可编程性和灵活性使其在快速变化的市场环境中具有独特优势。是采用FPGA还是eFPGA IP,最终还是取决于应用的规模。如果应用场景需要的芯片数量大到一定程度,更适合采用集成eFPGA的ASIC形态,因为SoC或ASIC可以大幅降低成本和功耗,同时提高性能。他指出,在快速演进的领域内做ASIC应保留一定的灵活性。芯片设计公司在规划新应用时,需要考虑市场规模和应用的核心功能。eFPGA可帮助他们适应标准、功能和算法的演进,特别是在快速发展的AI领域中。例如,在针对单一应用的手机上使用eFPGA可能较困难,因为这类场景对性能和可编程性的要求不高。然而,对于更多样化和变化的边缘应用,如工业和智能汽车应用,eFPGA可能更加适用。

AI典型案例介绍:数据中心

随着AI大模型的爆发与普及,ASIC的开发可能因芯片架构的迅速变化而面临研发成果过时的风险,这要求设计者考虑更灵活、能适应未来变化的解决方案。随着模型的不断增长,仅靠CPU运行不再具备成本、功耗或延迟的优势。因此,使用如GPU或FPGA这类加速器成为了一种趋势,它们可以显著提高计算能效,大幅降低系统延迟,并在更小的规模上实现更高水平的计算。当系统规模扩展到需要超过8个处理器时(例如GPT-3的训练需要使用10,000个GPU),使用FPGA执行大型语言模型在吞吐量和延迟方面胜过GPU。如果模型可以使用INT8精度,则Achronix FPGA在性能上具有更大的优势,尤其是在GPT-20B等大型模型上。使用FPGA的优势还包括较短的交付时间、更多的用户支持,并且成本通常低于GPU。

事实上,目前FPGA在计算成本上已经低于Nvidia的A100 GPU芯片,并且除了计算能力,FPGA还支持高速互联,为不同厂商的计算提供互联优势。这使得FPGA在人工智能推理应用中表现出巨大优势。

近年来,FPGA芯片的主要市场从通信基础设备逐渐转移到数据中心,并增加了人工智能应用。AI大模型的演进也对硬件设计提出挑战。例如,GPT 4.5 turbo展示了模型的快速发展,颠覆现有技术。这要求芯片设计者考虑未来的可能变化,不仅仅是当前需求。例如,目前大多数AI框架基于Transformer模型,但未来可能出现新的模型和架构,要求芯片设计具有前瞻性和灵活性。Achronix的高性能FPGA产品正是满足上述性能高、数据带宽稿和算法变化快的市场需求,如Speedster7t系列,在大模型推理方面的性能甚至超过了一些知名的GPU芯片。

Achronix的Speedster7t FPGA具有一个独特的架构,使其非常适合于大型语言模型。它拥有硬二维片上网络(2D NoC),解决了器件内的数据传输和输入输出问题。此外,它使用了带有紧耦合RAM的机器学习处理器(MLP),在计算过程中实现了高效的结果重用。与其他FPGA不同,Achronix的Speedster7t FPGA还配备了八组高效的GDDR6存储器IP,支持更高的存储带宽,并且能够以4 Tbps的速度加载参数。由于这些系统的可扩展性需求,FPGA可以利用各种标准接口,以将加速卡互连并实现卡之间的无缝数据传输。例如,Achronix的Speedster7t AC7t1500器件具有32个100 Gbps的SerDes通道,不需要依赖于专有且成本高昂的解决方案,如NVLink。

以与Myrtle.ai在自动语音识别(ASR)加速解决方案上的的合作为例。该方案采用搭载Speedster7t FPGA器件的VectorPath加速卡,运行Myrtle.ai提供的基于Achronix FPGA优化的ASR IP,实现实时、超低延迟的语音转文本功能。该方案支持1000个并发语音流的识别,实现极低单词错误率和54毫秒的端到端99%延迟。相比于传统的CPU或GPU加速卡,单张VectorPath加速卡可替代多达20台CPU服务器或15张GPU加速卡。该解决方案还可在标准的机器学习框架中使用特定或自定义数据集进行定制或重新训练,提供灵活性以权衡准确性与性能。该方案的性能是基于A100的ASR解决方案的8倍,延迟仅为GPU方案的1/8;与CPU方案相比,低延迟性能提升了约200倍。

这一案例充分展示了Achronix的FPGA在大规模推理应用中的强大能力,特别是在适应新一代大模型输入输出方面的高效率。例如,这种应用非常适合像微信这样的大型平台,它们拥有几亿甚至几十亿用户,支持语音输入或转换,可以大大提高后台的转换能力并减少用户的等待时间。

AI典型案例介绍:ADAS

另一个重要的应用案例是ADAS。目前汽车中已经安装了超过2.5亿颗FPGA芯片,其中超过7500万颗用于ADAS应用。随着硬件加速功能的不断增强,像FPGA和ASIC这样的器件通常还需要相伴而行。因此,今天的ADAS解决方案需要将硬件加速器与CPU集成在一起,以便在系统级别处理许多通用型和组织型任务。正是因为这个原因,异构计算平台(如异构SoC)已经成为加速和ADAS平台中最常见的平台之一。

为什么eFPGA IP是ADAS的理想选择?随着ADAS系统的复杂化,硬件设计面临的挑战也日益增加。ADAS硬件需要确保车辆乘员的安全,这要求系统能够准确、可靠地实时工作,同时在尽可能低的功耗下运行。这些要求对ADAS构成了巨大的挑战,因为系统通常依赖于大量的数据和计算密集型任务,如机器学习算法。因此,ADAS硬件必须同时高效地获取和处理数据,并以最低的功耗预算运行。

由于FPGA的可编程特性,它在可扩展性方面比ASIC更具优势。这种适应性在像ADAS这样底层算法不断变化的机器学习系统中尤为重要。此外,ASIC的规格必须提前几年定义,而FPGA可以在一分钟内更新和重新编程。这一功能使基于FPGA的ADAS系统能够提供ASIC无法实现的可扩展性和多功能性。

为了解决ADAS硬件面临的挑战,设计人员正在采用专用硬件加速器来提高性能,而不是依赖于传统的基于CPU的架构。专用硬件加速器比常规的计算资源(如CPU或GPU)提供了更好的性能和能效。在此背景下,FPGA提供了最大的灵活性,而ASIC则提供了最高的性能。FPGA的关键特性之一是能够提供高级别的并行性,同时仍然可以针对特定的工作负载进行编程。这表明,FPGA在工作负载加速方面提供了显著的价值,尤其是在性能和延迟成为关键因素的情况下。此外,与常规的CPU和基于GPU的系统相比,FPGA可以为需要加速的工作负载提供每瓦特最佳的性能,从而帮助系统平衡性能和功率效率之间的权衡。

Achronix的Speedcore IP这样的eFPGA技术可以与CPU资源紧密耦合

郭道正对与非网记者表示,虽然采用FPGA或eFPGA的异构计算架构并非ADAS或自动驾驶芯片的唯一技术路径,但它是一条非常有效的路线。因为FPGA和eFPGA不仅提供可编程计算,还能提供数据处理加速。借助eFPGA IP,设计人员能够利用FPGA技术的优势,同时将其硬件加速与其他ASIC子系统(如CPU和I/O接口)紧密耦合。通过将FPGA与CPU一起嵌入到定制SoC中,与分立式FPGA解决方案相比,eFPGA IP可显著节省成本、功耗和空间。具体来说,与基于FPGA的独立系统相比,eFPGA IP集成可以帮助设计人员节省90%的成本、降低75%的功耗、延迟改善100倍、接口带宽增加10倍。因此,预计ADAS将逐步采用基于eFPGA技术的异构解决方案。

ADAS给计算硬件造成了巨大压力

 

eFPGA潜力巨大,但需要市场培育

最后,郭道正也表示,目前Achronix的主要营业收入还是来自FPGA芯片的销售,eFPGA IP销售只占很小一部分。这也很好理解,做IP的Arm的营收大概一年有30亿美元,而英特尔的营收可以达到700亿美元。

但是展望未来,与传统FPGA市场相比,郭道正认为eFPGA市场拥有更大的发展空间。但这也同样需要大量的市场教育。郭道正认为,对于面向未来的高性能芯片,开发团队成员包括核心架构师,甚至公司决策者,通常没有充分的经验来参考,倾向于依赖于已有的成功技术路线。eFPGA和CPU虽然都是可编程的,但许多人习惯于采用Arm或RISC-V等CPU。尽管Achronix在eFPGA领域内领先,但仍需投入大量时间和精力去教育市场,说明为什么eFPGA是一个有价值的选择。这是一个需要耐心和细致工作的过程,尽管Achronix每年都在成长,但仍需要加大投入来经历这个过程。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
MK64FN1M0VLL12R 1 NXP Semiconductors FLASH, 120MHz, RISC MICROCONTROLLER, PQFP100
暂无数据 查看
PIC32MX795F512L-80V/PT 1 Microchip Technology Inc 32-BIT, FLASH, 80 MHz, RISC MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100

ECAD模型

下载ECAD模型
$12 查看
MK66FN2M0VLQ18R 1 NXP Semiconductors RISC MICROCONTROLLER
$54.39 查看
赛灵思

赛灵思

赛灵思(英语:Xilinx)是一家位于美国的可编程逻辑器件的生产商。该公司发明了现场可编程逻辑门阵列,并由此成名。赛灵思还是第一个无厂半导体公司(Fabless)。28nm时代,赛灵思提出All Programmable 的概念,从单一的FPGA企业战略转型为All Programmable FPGA、 SoC 和 3D IC 的全球领先提供商。且行业领先的器件与新一代设计环境以及 IP 完美地整合在一起,可满足客户对可编程逻辑乃至可编程系统集成的广泛需求赛灵思于1984年创建于美国加利福尼亚州的硅谷,总部位于硅谷核心的圣何塞,并在科罗拉多州、爱尔兰、新加坡 印度、中国、日本拥有分支机构

赛灵思(英语:Xilinx)是一家位于美国的可编程逻辑器件的生产商。该公司发明了现场可编程逻辑门阵列,并由此成名。赛灵思还是第一个无厂半导体公司(Fabless)。28nm时代,赛灵思提出All Programmable 的概念,从单一的FPGA企业战略转型为All Programmable FPGA、 SoC 和 3D IC 的全球领先提供商。且行业领先的器件与新一代设计环境以及 IP 完美地整合在一起,可满足客户对可编程逻辑乃至可编程系统集成的广泛需求赛灵思于1984年创建于美国加利福尼亚州的硅谷,总部位于硅谷核心的圣何塞,并在科罗拉多州、爱尔兰、新加坡 印度、中国、日本拥有分支机构收起

查看更多

相关推荐

电子产业图谱