AI的快速发展和广泛应用下,使得数据量激增、带宽扩大、效率提升以及与日俱增的安全威胁等现象,变得愈发关键。对于下一代存储器和主机连接方面, DDR5预计在未来几年内将主导市场DRAM类型。同时,CXL内存连接技术预计在2024至2029年间将实现212%的年复合增长。目前,已有半数的服务器支持CXL,预计未来将有更多服务器加入这一行列。应对AI时代挑战,更快速的主机连接、更丰富的内存资源以及更高效的接口技术,推动了PCIe Gen 6、LPDDR5X和CXL 3.1等技术的加速演讲,用于满足行业需求。
日前,AMD推出第二代Versal Premium系列自适应SoC,旨在面向各种工作负载提供最高水平系统加速。这是FPGA行业首款在硬IP中采用CXL 3.1、PCIe Gen6并支持LPDDR5存储器的器件。该系列产品通过采用先进的接口和存储技术,实现了系统加速,能够满足了数据密集型工作负载的需求。全新技术使得处理器和加速器之间的数据访问和迁移更加快速高效,特别适合数据中心、通信和测试测量市场的需求。AMD的这一创新有助于提升系统吞吐量和存储器资源利用率,从而提高整体性能,并支持从云端到边缘计算的严苛应用。
面向数据密集型高带宽应用
基于第一代产品,第二代Versal Premium系列主要在I/O、收发器和存储/内存控制器等方面进行了创新,这种设计复用模式有助于产品的快速推广和部署。此外,第二代产品还新增了LDPC解码器模块,适用于高通量的解码需求。
AMD自适应与嵌入式计算事业部( AECG ) Versal产品营销总监Manuel Uhm表示,相比第一代产品,第二代AMD Versal Premium系列的核心优势在于它通过更高效地管理系统内存来助力计算,而这正是AI模型和数据集成当前最迫切的需求。他强调,第二代AMD Versal Premium系列是对现有产品线的补充,而非替代,400G、800G网络加速等应用仍然是目标应用,也是Versal Premium系列所适配的。
据AMD自适应和嵌入式计算事业部( AECG ) 高级产品线经理Mike Rather介绍,为满足大数据和高计算密度的需求,AMD第二代Versal Premium系列主要实现了三大创新突破:第一,符合PCIe Gen 6和CXL3.1规范加速主机连接,实现了高达64Gb/s的连接速度;采用LPDDR5X和DDR5分别提供了8533Mb/s和6400Mb/s的高速数据传输,同时通过采用CXL存储器扩展模块,进一步增强了存储器接口的能力;在数据安全方面,通过数据加密IDE、DDR加密和400G高速加密引擎确保数据安全性。
加速主机连接
CXL是处理器与器件(例如,基于 FPGA 的加速器)之间的开放式行业标准互连技术,AMD通过支持CXL 来倡导开放式创新。
据介绍,第二代 Versal Premium 器件支持业界当前最快的主机接口CXL 3.1和PCIe Gen6,可实现行业领先的高带宽主机CPU到加速器连接。与支持PCIe Gen4或Gen5的FPGA相比,PCIe Gen6能提供2至4倍的线速率,而运行PCIe Gen6的CXL 3.1在类似时延下则能提供使用CXL 2.1器件的双倍带宽,以及增强的架构和一致性功能。
此外,通过将第二代 Versal Premium 系列搭配 AMD EPYC CPU,系统架构师能够利用经 CXL或PCIe连接到高性能CPU的最新AMD FPGA器件,以加速数据密集型应用并满足快速的数据增长需求。CXL 还能提供内存一致性的额外益处,有助于实现真正的异构加速计算。
提高存储器带宽及利用率
第二代AMD Versal Premium系列自适应SoC能以最高8533Mb/s的快速LPDDR5存储器连接加速存储器带宽,带来更快速的数据传输和实时响应。与采用LPDDR4/5存储器的同类器件相比,这种超快的增强型DDR存储器可将主机连接速度提升至高2.7倍。
与CXL存储器扩展模块进行连接,较单独使用LPDDR5X存储器,可使总带宽高出最多2.7倍。因此,第二代 Versal Premium 系列允许为多个加速器实现可扩展的内存池和扩展,进而优化存储器利用率并增加带宽和容量。
通过为多个器件动态分配内存池,第二代 Versal Premium系列自适应SoC旨在提高多头单逻辑器件(MH-SLD)的存储器利用率,使其无需架构或交换机即可运行,同时支持至多两个CXL主机。
加强数据安全
增强的安全功能有助于第二代Versal Premium系列在传输和静态状态下均可快速、安全地传输数据。
值得注意的是,第二代Versal Premium是业界首款在硬IP中提供集成PCIe完整性和数据加密(IDE)支持的FPGA器件。硬核DDR内存控制器内置的内联加密可助力保护静态数据,而400G高速加密引擎则能帮助器件以最高2倍的线速率保护用户数据,从而实现更快速的安全数据事务。
据介绍,第二代AMD Versal Premium 系列开发工具预计将于2025年第二季度提供,随后于2026年初提供芯片样片。预计将于2026年下半年开始量产出货。
适用应用和用例
第二代AMD Versal Premium系列上述特性,使其非常适用于一些专属应用和用例:
扩大数据中心的CXL范围
由于采用了CXL 3.1和PCIe Gen 6,与CXL 2.0相比可实现带宽翻倍,并且可与现有软件集成,支持NUMA。在操作模式方面,支持CXL.io、CXL.mem和CXL.cache,既可以作为内存控制器,也可以使用主机模式连接CXL扩展模块。在用例方面,第二代AMD Versal Premium系列还支持多主机单逻辑设备(MH-SLD)架构和系统可组合性。
用于GPU集群和横向扩展
对于部署GPU集群的大规模数据中心来说,标准网络接口可能无法满足这些场景下GPU的性能和灵活性需求。而第二代AMD Versal Premium可提供高带宽和灵活性,能够满足这些应用需求。
Mike强调,采用自适应网络技术的好处在于,Versal Premium系列包含非常快速的网络接口,包括400G以太网接口。此外能够实施非常灵活的内存搬运,包括支持RDMA。
测试与测量领域,推进下一代协议
在测试与测量领域,行业对开发PCIe Gen 7器件、下一代MIPI摄像机等测试仪非常关注,而这些应用需要128 Gb/s的收发器。
Mike指出,这些应用非常依赖芯片上的DSP引擎、内存带宽和其他接口能力。同时,开发测试设备的企业,所支持的协议可能包括C-PHY和D-PHY,这也是第二代AMD Versal Premium系列所支持的。
与第一代Versal Premium采用7nm制程相比,第二代Versal Premium采用6nm制程。Manuel指出,随着摩尔定律放缓,制程的重要性相对在减弱,更重要的是架构设计。并且,关键问题在于要选择合适的计算引擎来针对具体的用例。Versal系列产品能够非常精准地针对一些关键应用,确保通过最合适的算力、I/O以及内存组合,来实现最高的性价比。