当前国内算力发展面临的主要问题是什么?从国家层面来看,主要是下面五个问题:
第一,算力结构问题:通算资源占比过大,利用率低;智算占比过小,难以有效支撑未来人工智能技术的深入应用;超算资源充裕,但产业化程度不高;量子计算技术仍不成熟。
第二,算力调度问题:大量算力囤积在各方手里,难以高效利用。受限于技术不完备、协调机制不健全等原因,已有算力调度平台可调度的算力规模、种类和应用场景仍需丰富。
第三,传输网络问题:由于国内算力分布具有显著的区域性,而当前跨区域、多层次算力高速直连网络尚未完全建立,一定程度上阻碍了西部有效承接东部算力需求。
第四,算力能耗问题:算力尽头是电力,要真正实现算力的高质量发展,必须要找到一条绿色之道。
第五,数据安全问题:统一集约化的数据中心安全防范体系尚未完全建立,一体化安全保障服务能力仍需加强。
这些问题该怎么解决?国家发展改革委、国家数据局、中央网信办、工业和信息化部、国家能源局联合发布了《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,深入指导了下阶段全国一体化算力网的建设思路和要求。而《意见》要发挥作用、解决问题,终究还是要有人落地执行的。在这方面,中国移动作为推动数字社会建设的国家队,开创性提出打造像水电一样、“一点接入、即取即用、按需调度”的算力网络,主动站到产业发展的高度进行了全面规划。
从中国移动近期的部署中,我们可以洞察到其站在国家层面助力解决上述五大算力问题的具体落地方案。
针对算力结构问题——
第一,中国移动加大智算资源建设。目前已构建了全栈自主可控、行业领先的智算中心架构,形成了“N+X”智算资源布局体系。据了解,中国移动已明确提出2024年的智算部署目标为17EFLOPS,而今年算力计划资本开支475亿元,同比增长21.5%,其中大部分用于智算中心建设。日前,中国移动发布了《2024—2025年新型智算中心采购招标公告》,招标公告显示,本次项目采购总规模达到8054台,采购规模或将超150亿元,堪称行业内规模最大的一次人工智能服务器集采,也足以见证中国移动发力智算基础设施的决心。当前,中国移动在11个省同步启动12个智算中心区域节点的建设,尤其是在呼和浩特正在建设超大规模单体智算中心,一张多层级、全覆盖的智算能力网络正在快速铺开。此外,为了支持社会人工智能技术的深入应用,中国移动还基于智算中心底层万卡高性能算力资源,构建了从高性能算力到AI训练推理平台到模型服务的全栈智算产品体系,以支持大规模万卡集群的训练和推理一体化需求。
第二,中国移动加快算力并网以提升社会算力利用率。通算过剩、超算产业化低,症结点在于无法实现需求和资源的有效匹配。如何解决这个问题?中国移动提出了“算力并网”的方案,并携手多个超算中心、智算中心,以及云服务商,共同发起全国规模最大的“百川”算力并网行动,打造算力类型最全、规模最大、覆盖最广的“百川”算力并网平台。当前,“百川”算力并网平台已接入社会算力近5EFLOPS,和自有算力形成优势互补,总共具备超10EFLOPS的算力供给能力。更关键的是,中国移动在并网的基础上,实现了一张全国算网地图,同时感知接入通算、智算、超算和量子四类算力,以一个统一运营入口“算龙头”,将并网后的算力,融合移动云自有能力和产品,统一对外提供任务式服务,助推算力成为普惠级社会服务。
针对算力调度问题——为了解决算力调度问题,2023年移动云发布业内首个算网大脑,算网大脑定位为整个算力网络体系的“智能中枢”,旨在实现多样算力可泛在部署、极致网络可智能调度、算网资源可全局优化、算网能力可一体供给,可以说,算网大脑是中国移动算力网络中最硬核的存在。据了解,当前算网大脑已在具体算网场景中应用,支持东数西算、智算超算、数据快递等100多种算网业务,实现日均调度东西部资源上千万次。从当前的能力上看,中国移动算网大脑已经实现算网融合类业务的支撑和一体化算网全领域资源拉通(算网大脑2.0),后续将继续推进算网感知融合统一,进一步提升算网大脑的智能化水平,向“算网智脑”升级(算网大脑3.0)。
针对传输网络问题——日前,中国移动宣布其自主研发的400G全光省际骨干网正式商用。据了解,400G全光省际骨干网是长距离光信号传输网络设备,能连接边缘、中心和枢纽集群算力,是算力网络的连接中枢。相比上一代干线网络,其传输带宽提升4倍、单比特能耗降低65%。400G全光省际骨干网将支撑算力、数据等生产要素实现创新性跨地域优化配置,支撑“东数西算”“东数西存”等新型应用落地,推动产业深度转型升级,语音识别、智慧工厂、自动驾驶等领域的智能应用将向更加高效、便捷方向迈进。此外,结合国家“东数西算”工程要求及自身算力网络业务发展需求,中国移动还打造了全球规模最大的SRv6 Policy骨干网——云专网,覆盖全国31省、300+地市,省际带宽接近50Tbps,向客户提供更加全面、高效、灵活、智能的服务。
针对算力能耗问题——AI的尽头是光伏和储能,这已经是业内的共识!以英伟达最新GPU单张能耗1000瓦,单个数据中心最起码是万卡规模,其中的能耗可想而知。黄仁勋发出预警,不能单单考虑计算机,现在也需要考虑地球现有能源是否能支撑。对此,中国移动一直在积极推进绿色算力发展,在数据中心规划、设计、选型、建设到运营管理的全生命周期内,都积极引进绿色低碳技术和产品。例如,在数据中心的建设过程中,采用智能节能方案,降低数据中心的PUE。同时积极探索可再生能源在数据中心的应用,减少对传统能源的依赖,降低碳排放。
针对数据安全问题——此前,中国移动发布了《算力网络安全白皮书》,提出了“一体化全程可信”安全理念,并在国内外多个标准组织立项算力网络安全总体要求、算力网络数据安全等关键标准11项,形成了较为完善的算力网络安全标准体系。这些标准的制定和完善,为算力网络的数据安全提供了有力的保障。当前,中国移动算力网络安全防护体系已为8大行业近千家政企客户提供了超千次的安全服务。这些服务包括但不限于数据安全保障、网络安全监测、威胁情报分析等,为客户提供全方位的安全保障。
算力即权力。掌握和控制算力,就意味着在某种程度上掌握了对信息处理和决策制定的能力,进而拥有了影响社会和经济运行的权力。当前世界各国正在积极推进算力的建设和运营,尤其是中美之间围绕算力正在开展新一轮的角力。
在这样的大背景下,中国移动大力推进算力网络建设,目标我认为很明确,就是要成为国家级算力网,成为未来社会算力流通的大动脉,以更智能、更集约、更普惠的算力服务推动各行业的数字化转型和智能化升级,提升业务效率和创新能力,从而推动数字经济的发展。这就是我理解的中国移动的算网雄心。