在第 19 届讯石光纤通讯市场暨技术专题研讨会上,华为数通产品线产品规划专家谢耀辉发表《DCN: 以 400GE 的确定性应对不确定》的演讲报告。讲述了 DCN(Data Center Network,数据中心网络)当前的挑战以及对未来的建议。
新基建政策下,阿里巴巴、腾讯和百度都提出了加大投资建设超级数据中心的计划:阿里巴巴未来三年投资 2000 亿元,腾讯未来五年投资 5000 亿元,百度计划到 2030 年智能云服务器增至 500 万台以上。
在数据中心庞大的投资中,光模块厂商的目标市场,属于 10%的网络投资部分,并且往 20%增长。在数据中心网络建设方面,光互连是关键。在 40G 时代,互连光模块和设备的成本比例为 3:7,到了 100G 时代则转变为 5:5。
谢耀辉提出,当前的新挑战是 PAM-4 技术对光互连产业的影响,影响力不亚于相干技术,它对器件线性度、信号增强处理以及设备误码率影响都很大,且功耗与 NRZ 直检直调相比大幅度增长,导致从 100G CWDM4 到 400G FR4,功耗增长 3.4 倍。
PAM-4 里最重要的 DSP 芯片需要硬核的设计能力和先进工艺,DSP 芯片占到模块功耗的 50%,占成本的 30%以上。从光模块到光芯片再到电芯片,代表性企业越来越少。中国企业目前在模块领域有较大影响力,但在电芯片领域影响力不足。目前在新冠疫情加中美关系的影响下,最优要素的获取方式与节奏不可控。
组网变化也存在不确定性(400G 是确定的,不确定在于是否要增加 200G),数据中心为了降成本,服务器接入由多联柜转为双联柜和单联柜,造成的趋势是电缆侵占 AOC 市场,使用 Breakout 也将面临运维的挑战。
对于 DCN 来说,从 100G 到 400G 是一个最佳的演进路径。从计算云到 AI 云 ,DCN 流量激增,需要更大的带宽满足 AI 云服务。新的 PAM-4 技术引入,400G 相对于 100G 可以实现成本和功耗增加在 2 倍以内,确保 Gbit 降低一半,延续摩尔定律,而具有同样架构的 200G 则成本功耗很难与 100G 维持不变。交换机主芯片也存在大小代交替的情况,由 TH 芯片来看,25.6T 容量可能属于小代。从主演进路径的角度,最佳解决的方案就是极简架构加规模上量,同样的器件数量带宽翻番。
谢耀辉针对 DCN 模块的规模上线也提醒业界关注模块生命周期的 OpEx,需要针对性增强模块的监控与运维能力,利用 AI 和大数据技术,确保高质量的模块,通过合宜的 CapEx+低的 OpEx 实现真正的低成本。
对于未来的路,谢耀辉对产业提出如下的建议:
1. 聚焦主代,拉长生命周期。100G 已经上量 3 年,预计持续放量 5 年,400G 的目标周期跨度也会超过 5 年。
2. 突破光电芯片,实现产业话语权。目前我国芯片主要是低端市场,利润较低,国内光芯片水平与国外存在 1~2 代差距,电芯片产业水平与国外差距更为明显。
3. 关注绿色低功耗,创新技术提出自己的原创概念 。
4. 提升运维可管理能力,不能单纯要求低价模块,而是要合适的光模块成本加上低的运维成本。