加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • CPO市场预期如何?
    • CPO何能何德受青睐?
    • 怎样重拾CPO?
    • 运营商喜欢什么样的解决方案?
    • 谁是CPO的第一人选?
    • 从现在到未来
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

GPT爆火又引燃了CPO

2023/05/10
4536
阅读需 18 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

GPT爆火,算力“芯慌”,而数据中心HPC的功率效率也备受关注,据称共封装器件(CPO,Co-packaged optics)能将功耗降低30%,每比特成本降低40%。真有这样的好事?条件成熟了吗?我们往下看。

CPO市场预期如何?

CPO是将交换芯片和光引擎共同组装在同一个插槽上,形成芯片和模组的共封装。这样就可以尽可能降低网络设备的工作功耗及散热功耗,在OIF(光互联网络论坛)的主导下,业界多家厂商才共同推出了近CPO器件(NPO)和CPO技术。

共封装方法横截面

根据Yole预测,伴随未来人工智能AI)的发展,数据通信光学器件一直在增长,2022-2028年其CAGR将为24%,2028-2033为80%,收入预计将从2022年的3800万美元增长到2033年的26亿美元。得益于AI/ML设备数据移动的加速,2022-2033年CAGR为46%。其中CPO将从2022年的600万美元增长到2033年的2.87亿美元,CAGR为69%。

2022-2033年数据通信光学收入增长预测

2023年,GPT引发了驱动力和应用范式的转变。高带宽、每机架高功率预算、HPC新型光链路捉襟见肘。随着从联网(交换)到处理(AI/ML(机器学习))的范式转变,预计2024年将推出首个基于光学I/O的封装内Al系统,而CPO的批量交付预计将在2029年之后。

2023年驱动力和应用范式转变

CPO何能何德受青睐?

CPO受到关注是由于其在数据中心高性能计算的功率效率。由于近来宏观经济不利,网络应用CPO的大多数支持者已暂停了对CPO项目的支持。其主要原因包括:一是可插拔产品的工业生态系统需要完善;二是可插拔尺寸的集成电光调制器可以实现所需的低功耗,且可在不改变现有网络系统设计的情况下引入市场。

Yole Intelligence光子学和传感部门高级分析师Martin Vallo博士则表示:“在所需的电密度和光密度、热管理和能源效率方面,可插拔尺寸将限制其支持6.4T和12.8T容量的能力,使用硅光子学技术平台的共封装能够克服上述挑战。”

随着技术进步,能够在商业系统中更紧密地集成通信和计算技术的网络硬件组件越来越常见。不过,CPO对AI/ML系统仍保持着吸引力。AI模型的规模正在以前所未有的速度增长,传统架构(铜基电互连)的芯片对芯片或板对板能力将成为扩展ML的主要瓶颈。因此,HPC及其新的分散架构出现了新的、非常短的光互连。分散设计将服务器卡上的计算、内存和存储组件分开,并分别对其进行池化。通过先进的封装内光学I/O技术将基于光学的互连用于xPU(CPU、DPU、GPU、TPUFPGA和ASIC)、内存和存储器,以实现必要的传输速度和带宽。

此外,未来数十亿光学互连(芯片、电路板)的潜力正在推动大型代工厂为大规模生产做准备。由于大多数光子制造IP由非代工公司(AyarLabs、Ranovus、思科、Nvidia、Marvell、Lightmatter和许多其他公司)持有,Tower Semiconductor、GlobalFoundries、ASE Group、台积电和三星等大型代工公司正在准备硅光子工艺流程,以接受设计公司的任何PIC架构。所有这些代工厂都在加入PCIe、CXL和UCIe等行业联盟。小芯片(chiplet)互连的通用规范允许构建超过最大掩模尺寸的大型片上系统(SoC)封装。这有助于在同一封装内混合来自不同供应商的组件,并通过使用较小的片芯来提高制造产量。每个小芯片可以使用适合特定器件类型或计算性能/功耗要求的不同硅制造工艺。

2023年优选CPO参与者供应链

对快速增长的训练数据集的预测表明,数据将成为扩展ML模型的主要瓶颈,因此,AI的进展可能会放缓。在AI/ML设备中加速数据移动是下一代HPC系统采用光学互连的主要驱动因素,在ML硬件中使用光学I/O有助于应对数据的爆炸性增长。

怎样重拾CPO?

事实上,在过去50年里,每十年都会有一次移动技术创新。移动带宽需求已经从语音通话和短信发展到超高清(UHD)视频和各种增强现实/虚拟现实(AR/VR)应用。尽管疫情对电信基础设施供应链产生了很大影响,但全球消费者和商业用户不断对网络和云服务产生新的需求。社交网络、商务会议、UHD视频流、电子商务和游戏应用将继续推动增长。

每个家庭和人均连接到互联网的设备数量正在增加。随着功能和智能不断增强的新型数字设备的出现,每年的采用率都在上升。此外,不断扩展的机器对机器应用,如智能电表、视频监控、医疗保健监控、连接驱动器和自动化物流,极大地促进了设备和连接的增长,并推动了数据中心基础设施的扩张。

由于预算削减,CPO社区面临困难时期,只有在可插拔设备精疲力竭时CPO的全面部署才会发生。至少在接下来两代交换机系统中,CPO很难与可插拔模块竞争,在很长一段时间内可插拔模块仍将是首选。由于在数据中心中的网络功率效率,CPO最近受到了很多关注。思科、脸书/Meta、IBM、英特尔微软等行业重量级公司一直在努力推动CPO;博通、GlobalFoundries、Marvell、Quanta Cloud Technology等公司也加入了进来。

分析表明,与数据中心总功耗相比,联网节省的功耗可以忽略不计。只有博通、英特尔、Marvell和其他一些CPO公司会将专有解决方案推向市场。

随着6.4T光学模块最晚在2029年到来,CPO和可插拔光学器件之间可能发生激烈的竞争,预计CPO系统中的多个技术障碍将在此时得到解决。不过,收发器行业正在不断创新,以推动可插拔光学器件市场。在CPO系统实现网络应用的批量交付之前,将在可插拔设备中使用CPO方法,且光学引擎将在高性能计算的未来系统中越来越受欢迎。行业生态系统,包括Ayar Labs、Intel、Ranovus、Lightmatter、AMD、GlobalFoundries和其他围绕机器学习(ML)系统供应商Nvidia和HPE,已经取得了相当大的进展,计划在2024年至2026年间批量交付产品。

光子集成电路可以实现高功率和成本效益的光学互连CPO,可以预计,800G和1.6T可插拔模块将备受欢迎,因为它们具有100G和200G单波长光学器件的优势,因此可以在QSFP-DD和OSFP-XD尺寸中实现技术和成本效益。

光纤距离芯片组也越来越近,用光将数据引入到集中处理点是架构设计师的主要目标之一。这一趋势始于十年前安装在PCB上的光学组件专有设计。这些嵌入式光学互连(EOI)的想法在板载光学联盟(COBO)中得到了延续,其制定的规范允许在网络设备制造中使用板载光学模块。

CPO是一种创新方法,可以将光学器件和交换机ASIC紧密结合在一起。由于在50T交换芯片中使用16个3.2Tbps光学模块是当今技术的挑战,NPO通过使用高性能PCB基板(一种内插器)解决了这一问题。NPO内插器更宽,使芯片和光学模块之间的信号路由更容易,同时仍能满足信号完整性要求。相比之下,CPO能以更低的信道损耗和更低功耗使模块和主机ASIC更接近。

运营商喜欢什么样的解决方案?

如今,光可插拔模块市场供应链已经建立完善,包括分立或集成组件供应商、生产发射器接收器光学组件(TOSA和ROSA)、多路复用器DSP和PCB的光学公司以及组装/测试集成商。此外,一个交换机盒中多个不同可插拔模块的互操作性有助于行业的灵活性。高度集成的光学器件和硅片非常需要新的工程能力和代工厂,这对于传统的中型企业来说是不可接受的。只有价值数十亿美元的光学供应商才能负担得起从可插拔产品转向CPO的费用。

需要指出的是,尽管主流部署了主要针对大型云运营商的CPO解决方案,但仍有许多小型企业数据中心没有采用最新的互连技术。这意味着,即使CPO成为主流技术,可插拔模块仍将对CPO在技术或经济上不可行的几个应用(如长途应用和边缘数据中心)有很高的需求。预计可插拔技术在未来10年内不会逐步淘汰。不过,可插拔光学行业可能会整合,而CPO市场将形成多供应商商业模式。

市场调研公司CIR表示,数据中心CPO的部署将在很大程度上受到交换演进的驱动,到2025年,将达到102.4Tbps。CIR表示,与使用可插拔光学器件相比,CPO可以将功耗降低30%,每比特的成本降低40%。

在组件层面,与前板可插拔产品(FPP)相比,CPO具有潜在的经济效益。例如,正如Ranovus董事长兼CEO Hamid Arabzadeh所说:成本是一个关键因素,因为不需要PAM4 IC定时器,“不需要时钟和数据恢复(CDR)芯片和其他FPP项目也可能带来节约。”

串行器解串器(SerDes)链路是CPO的热门话题。Martin Vallo博士认为,224Gbps数据速率的标准化SerDes链路是使CPO成为主流的必备条件之一,可以通过多种链路类型提供信号,包括片对片(D2D)、芯片到芯片、芯片到模块(C2M)、中距离芯片到芯片(MR)和长距离芯片到片(LR)。

FPP和CPO部署模型的比较

与此同时,思科和OIF成员Jock Bovington强调,共封装的好处之一是降低整体功耗。“采用共封装时——无论是在同一基板(CPO)上还是在高密度中间层(HDI)基板(NPO)上——通道的损耗都会大大减少,能够使用明显更低功耗的SerDes,如XSR(10dB)或XSR+(13dB)。OIF开发了两种类型的电气接口。”

谁是CPO的第一人选?

关于CPO首先大规模应用的领域,CIR认为是数据中心,首先是超大型数据中心和大型企业数据中心。创始人兼总裁Lawrence Gasman解释道:“在一段时间内,超级规模将占据主导地位,但企业数据中心将逐渐获得份额,因为它们太多了!此外,HPC和超级计算机多年来也一直在使用接近CPO的东西。”

Ranovus董事长兼CEO Hamid Arabzadeh也同样谈到了计算空间的潜力,该公司3月与AMD/Xilinx合作展示了用于AI/ML平台的新一代CPO解决方案,以实现节能、高通量和高密度光学互连。他认为,CPO的两个主要应用领域是低容量(每个CPO<3.2Tbps)以太网光学模块,以及高容量(≥3.2Tbps/CPO)的以太网交换机和计算解决方案。

Martin Vallo博士同意CPO的高功率计算可能性。他认为,在实现数据中心内互连的实际商业地位之前,CPO会在高功率计算中更受欢迎,而不仅仅是取代FPP。“尽管主流部署的高端CPO解决方案主要用于大型云运营商的200Tbps及以上的交换机,但仍有许多小型企业数据中心没有采用最新的光互连技术,因此速度要慢得多。”他说。

然而,在如日中天之前,CPO还有一系列棘手的问题需要解决,一些与CPO需求侧有关,另一些与供应侧有关,许多问题涉及CPO如何与帧中继终端(FRT)和FPP竞争。

Lawrence Gasman认为,实现批量生产是CPO面临的一个挑战。CPO设备“不是传统意义上的完全可插拔”。由于CPO技术将严重依赖硅光子学,Martin Vallo认为:“为了满足市场需求,并让最终用户相信CPO的可行性,多供应商的商业模式和制造产量必须是可以接受的。”

Yole还指出,如今的光学模块市场已经建立了良好的垂直整合,包括分立或集成组件供应商、光学公司以及发射机光学子组件(TOSA)、接收光学子组件、多路复用器、DSP和PCB产品以及组装/测试集成的供应商。
是否能够拔掉插头?

人们普遍认为,关于插头很快消亡的报道是错误的。Hamid Arabzadeh认为,CPO和可插拔设备将共存,因为后者“为以太网交换机带来了可配置性”。

Martin Vallo认为,可插拔设备本身正在发展。“对于100Terabit的交换容量来说,可插拔1.6T八进制小型可插拔-超密度(OSFP-XD)似乎将成为首选。目前尚不清楚3.2T OSFP-XD是否是一种可插拔的外形,可能实现204.8T。”

那么,CPO高速公路的下一步会发生什么呢?Hamid Arabzadeh认为:“NPO有CPO的缺点,但没有模块的优点。”Hutchins表示,一个更明显的行业趋势是支持更高数据速率的共封装解决方案,例如200G串行电气接口。
Martin Vallo则推测下一阶段的标准可能会导致标准插座设计,将支持不同光学规格和可靠性要求。“标准化才刚刚开始,这个过程可能需要长达五年时间。”他提醒道。

从现在到未来

2020年,开始出现了第一批CPO概念验证并创建了规范。四大超大型云运营商中的两家——Meta和微软——积极支持CPO渗透到其云网络中。

2022年,交付了数千台CPO引擎进行试点测试。今年,尽管遇到一些宏观经济逆风,将对预算密集型项目产生负面影响,但在硅光子学进步的推动下,深度光子学集成已经在某些数据中心应用中证明了可行性。CPO架构也肯定会在数据通信之外的领域继续它的故事。

相关推荐

电子产业图谱