在芯片丛林竞争中,新的技术架构往往意味着能改变游戏规则。
曾几何时,数据如同汹涌的潮水,以指数级的速度在我们的数字世界里泛滥。从巨型数据中心到小小的个人电脑,都被卷入了这场数据洪流之中....此时,数据的心脏“芯片”,演绎着一轮又一轮技术之战。本文的主角CXL高速互联技术,正是从这片“混乱”的数据海洋中,开辟出一条崭新的航道,使得不同类型的芯片可以实现更加紧密地协同工作,从而成为推动计算领域变革的关键力量。
从传输协议到资源共享,CXL究竟何物?
当前大数据、人工智能(AI)、云计算等领域快速发展,传统的芯片架构和连接方式,在海量数据的冲击下,渐渐有些力不从心。就好比一条狭窄的河道,要通过日益增多的船只,堵塞和低效成为了常态。特别是在数据中心、高性能计算(HPC)应用场景中,存储和计算之间的协作瓶颈愈发明显,大大限制了整个系统的性能。
此背景下,CXL技术应运而生,通过高速接口,打破了存储和计算之间的隔阂,使其更高效地共享资源。CXL被认为是构建芯片之间的“超级高速公路”,允许不同的芯片组件,包括CPU、GPU、FPGA以及内存等,能够以一种高速、低延迟且高效的方式相互通信和共享数据。
从本质上讲,CXL(Compute Express Link)是一种新型的高速互联技术,即下一代接口,可有效连接高性能计算系统中的CPU/GPU、存储器等,支持大容量、超高速计算。对计算机系统而言,PCle和CXL技术都是重要的连接技术。从二者区别来看,CXL比PCIe具有更高的带宽、更低的延迟,以及内存扩展、缓存一致性和设备直接内存访问等更多的功能。其实从另一个角度来说,PCIe技术是CXL技术的底层基础,CXL则可视为PCIe技术的再提高版本,延伸了更多变革性的功能。
1、CXL加速进化,3.2版本已来临
从范式演变路径来看,目前,CXL已经发表了1.0/1.1、2.0、3.0/3.1/3.2多个不同的版本。2019年CXL1.0版本正式发布,到2022年CXL规范更新至3.0版本,随后2023年CXL3.1发布,到如今CXL3.2发布,CXL正在不断进步和成熟。
图片来源:全球半导体观察根据公开信息制图
其中,CXL1.0版本于2019年3月推出,是CXL系列的开山之作,基于PCIe5.0技术构建,并引入了缓存一致性协议(CXL.cache),使得主机CPU能够高效地访问加速器设备上的共享内存资源;
CXL2.0在2020年11月发布,基于PCIe5.0技术,内存的池化(Pooling)功能较好地实现了以内存为中心的构想;
CXL3.0于2022年8月推出,在物理层基于PCIe6.0实现带宽提升和信号传输方式改变,逻辑层增强了连接拓扑、内存共享与访问、数据包大小等,同时扩展了功能,包括消除设备连接限制、增强设备通信、加入错误纠正机制和提升fabric功能等;
CXL3.1于2023年11月发布,具备开启更多对等通信通道的能力,实现了对内存和存储的独立分离,形成独立的模块,据悉它将支持DDR6内存;
CXL3.2规范于2024年12月公布,该版本优化了CXL存储设备的监控和管理,增强了CXL存储设备在操作系统和应用程序方面的功能,并通过可信安全协议TSP扩展了安全性。
2、三套“组合拳”,CXL融合三种子协议
目前,CXL包括三个不同的协议层次,分别是CXL.io、CXL.cache、CXL.memory,每种协议在CXL的架构中都有特定的功能和应用场景。这三种协议的结合,使CXL成为支持异构计算、大规模数据处理和高效计算资源共享的重要技术,尤其是在数据中心、AI加速和高性能计算领域具有广泛的应用前景。
·CXL.io:指CXL的基础协议,用于连接计算、存储和加速器(如GPU、FPGA)等不同的硬件资源。类似于PCIe的角色,可提供一个稳定的通信通道,使得CXL设备可以顺利“对话”。
·CXL.cache:称为缓存一致性协议,主要用于数据缓存,使得不同计算单元之间可以共享缓存信息,从而减少内存和存储的访问次数,进一步降低延迟。
·CXL.memory:称为内存共享协议,属于CXL最核心的协议之一,允许不同的计算单元共享内存资源,适用于需要大规模内存共享和资源池化的场景,如云计算、数据中心、大数据分析等。具体可以理解为,传统的计算架构中,每个处理单元只能访问自己专有的内存,而CXL突破了这种限制,支持GPU、FPGA、DPU等直接访问主机内存,甚至将内存资源进行池化,实现高效的内存共享和灵活的内存分配。该功能提高了系统的可靠性,即使发生内存故障,CPU仍可以通过外部设备继续运行。
CXL启航,存储大厂角逐新蓝海
整个CXL生态正处于加速发展的阶段,技术标准不断演进,从CXL1.0逐步发展到CXL3.2,功能和性能持续提升。在应用方面,范围也在持续扩大,从高性能计算、数据中心,逐步拓展到人工智能加速、云计算、边缘计算等新兴领域。如今,各种各样的CXL产品已经落地应用。
随着CXL技术逐步进入主流市场,多家大厂纷纷布盘落子,目前CXL技术联盟已汇聚了超过200多家成员,涵盖了众多领域的知名企业。
其中,CPU领域如英特尔、AMD等积极参与其中,从技术研发到产品应用全面推动CXL的发展;服务器领域如戴尔EMC、HPE、华为、浪潮信息等也陆续加入,为CXL技术在服务器领域的应用提供了强大的硬件支持和解决方案;存储器领域如三星、SK海力士、美光科技、铠侠等更是在CXL技术的推动下,不断创新和推出新的存储产品。
值得一提是,三星、SK海力士、美光科技、铠侠这几家存储大厂已俨然成为了CXL的资深玩家。
图表来源:全球半导体观察根据公开信息整理
三星
三星于2021年5月开发出全球首款基于CXL的DRAM技术;2022年推出业界首款高容量512GB CXL DRAM;2023年5月开发出支持CXL2.0的128GB CXL DRAM;2024年3月,三星在Memcon 2024发布了CXL内存模块-盒式(CMM-B),支持高达2TB容量与60GB/s带宽,适用于AI和大数据分析等大内存需求应用。此外,三星与博通旗下的VMware推出了基于FPGA的分层内存解决方案CMM-HTM,结合DRAM与NAND介质,优化内存管理,提升性能并降低成本。
2024年6月,三星宣布成功打造业界首个获得红帽认证的CXL基础设施。这意味着从CXL相关产品到软件,构成服务器的各种元素现在都可以在位于韩国华城的三星存储器研发中心(SMRC)直接进行验证。
另据《ZDNet Korea》7月报道,三星电子存储部门新业务规划团队董事总经理Choi Jang-seok表示,即将推出的内存模块被指定为CMM-D2.0,将符合CXL2.0协议。这些模块采用1ynm工艺DRAM颗粒,代表20-10nm级别的第二代DRAM技术,该技术能够生产提供更高容量同时保持性能效率的内存模块。
除了CMM-D模块,三星还在开发一系列CXL存储产品。其中包括集成多个CMM-D模块的CMM-B内存盒模块,以及将DRAM内存与NAND闪存颗粒相结合的CMM-H混合存储模块。
ChoiJang-seok此前强调,随着CXL3.1技术的采用,CXL内存资源可以在多个主机之间共享,预计CXL市场将在今年下半年蓬勃发展,在2028年左右实现显著增长。
SK海力士
2022年,SK海力士开发了首款结合计算功能与CXL存储器的CMS(Computational Memory Solution),该方案是其与SK Telecom合作开发的成果,集成了计算功能,是首个将计算功能集成到CXL内存中的产品。
2024年初,SK海力士还展示了多款CXL产品,包括CMM-DDR5内存模块和Niagara 2.0,通过HMSDK提升系统性能。2024年9月,SK海力士的HMSDK软件成功集成至Linux操作系统,优化CXL存储器运行,带宽扩展30%以上。2024年11月,SK海力士与ASICLAND签署311亿韩元的CXL存储器控制器设计合约,预计将在台积电5纳米制程上量产CXL 3.0/3.1芯片。
此外,SK海力士表示,据半导体行业预测,随着下半年首批采用“CXL2.0”规格的服务器CPU问世,CXL将正式进入商业化阶段。为此,公司正在对96GB(千兆字节)及128GB容量的CXL2.0存储器进行客户验证,并计划在年底实现量产。
美光
2023年,美光发布了CZ120 CXL内存扩展模块,支持CXL 2.0 Type3标准,具有128GB和256GB两个容量选项,带宽高达36GB/s。2024年,美光的CZ122模块通过与英特尔至强6平台的测试,显著提升了HPC和AI工作负载的内存带宽。
2024年5月,美光科技申请一项名为“在计算快速链路通信中使用张量存储器存取的方法”的专利,旨在提高存储器存取效率。业界称,该专利中提到的张量存取电路能够根据与存储器的访问操作相关的CXL命令进行相应的存储器映射,这意味着美光的这项专利技术可以与CXL技术深度结合。
铠侠
2023年8月,铠侠在Flash Memory Summit 2023上展示了其基于3D NAND和XL-Flash CXL解决方案,并透露计划推出两款CXL产品lineup。其中,CXL+XL-Flash-based设备面向内存数据库和AI推理等以性能和可靠性为核心的应用;CXL+BICS 3D NAND-powered设备则适用于大数据和AI训练等对容量要求较高的应用。
2024年11月,铠侠宣布其CXL接口存储器研发项目获得日本政府支持,计划投入360亿日元,加速CXL存储器的商业化进程,预计2030-2034年实现市场化。
与DRAM相比,CXL存储器更省电,而与NAND Flash相比,其拥有更快的读取速度。具体而言,DRAM在电力中断时数据就会消失,而CXL存储器不仅能保留断电时的数据,还能大幅降低AI驱动下的能耗。
结语
CXL技术在数据洪峰的冲击下破局而生,凭借精妙的技术原理搭建起芯片间的高效通路,成为了芯片行业协同发展的关键纽带。CXL联盟中的巨头们的战略布局,各显神通,存储厂商的积极参与也让其生态日益繁荣,共同编织出一张紧密相连、高效协作的芯片产业新网络。
正如美光科技认为的那样,“CXL技术是解决现代计算架构中“内存墙”问题的关键,未来将对DRAM位增长率产生影响。”在这场技术变革的浪潮中,CXL技术从2019年的CXL1.0,到2023年的CXL3.1,再到2024年的CXL3.2,未来将以不可阻挡之势重塑行业格局。