中国移动确实是有野心的。
与其他云厂商或埋头发展技术,或在市场侧搞些小动作不一样,中国移动上来就是高举高打,站在平衡国家算力供需、推动国家整体算力发展的角度,提出了“算力网络”这一全新的算力供给方式。
不得不说,从规划理念上看,算力网络绝对是划时代的设计,它把算力的供给方式从原来单一集中的算力资源池承载向多样化的算力资源承载方式发展。
理论上,一张算力网络可以把社会上所有的算力资源连接起来,包括集中化的超级计算中心、泛分布的边缘/端算力节点,也包括超算、智算和社会算力等多样化的异构算力,算力网络将成为与水电一样,可“一点接入、即取即用”的社会级服务。
简单来说,中国移动想要通过算力网络来一统算力的江湖!这有中国移动转型发展的“私心”,也有打造社会级算力服务体系、提高算力利用率、支撑数字经济发展的“公义”。
- 01 -
但是,理想很美好,要实现它,却面临着巨大的挑战,比如,算力网络化后,如何实现高效准确的调度?这就需要到本文的主角——算网大脑。
算网大脑,顾名思义,就是算力网络的大脑,作为算力网络的中枢调度决策系统,为新型信息基础设施对外一体化服务提供能力支撑。
算网大脑主要用以解决以下几方面的问题:
第一,当前现有的、各厂家各自独立的云和网编排调度系统无法满足复杂的算网融合业务的管理需求,需要一个跨算网各域的、智能化的系统来实现灵活高效的算网统一编排调度。
第二,当前算力形态多样,超算、智算、云、边、端等等,算力网络需要实现跨越物理分布、云边端分层协同和异构融合的算力资源统一调度,同时,在网络层面,需要通过算、网一体化编排管理实现网随算动、以网强算。
第三,算力网络包含的资源类别和资源数量规模庞大,呈现高度的复杂性。传统的数据采集、编排调度、运维方式已无法满足这种高度复杂性的算力网络的需求。算网编排管理需要提高算网感知、编排和运维的自动化和智能化水平,实现面向算力网络的数据智能感知、算网智能编排、智能运维。
第四,当前,算力域和网络域有着各自特有的数据感知体系,并且长时间独立发展,自成一派,暂未打通融合。算力网络缺少统一、全局性的算、网状态实时采集、感知、呈现能力;亟需构建算网感知能力,逐步融合、统一现有的算、网感知体系,制定算网一体化感知模型体系。
第五,算网多要素融合编排和协同调度控制依赖于对于底层基础设施的能力抽象和模型化,需要构建一体统一的算网调度机制,并促进算网基础设施具备自身独立编排能力及跨域协同编排能力,且能够对外提供标准化封装、可自动执行的原子能力和服务。
简单来说,算网大脑需要提供的是算力供给能力、数据处理能力、网络连通能力、业务供给能力,并实现以上能力组合的最大化。
- 02 -
我们必须承认,中国移动的规划能力和执行能力都是超一流的。
2021年提出算力网络后,随即启动了算网大脑的建设,算网大脑是IT和CT两大体系融合的关键,也是对中国移动研发、试验、组织和变革能力的考验。
按照中国移动的定位,算网大脑作为整个算力网络体系的“智能中枢”,是算力网络编排管理层核心,是算网共生发展的关键系统。
在横向上,算网大脑对算网资源、算力服务以及算网应用等算力网络各层的多种原子能力进行抽象、封装,通过按需、灵活的组合方式及规则,形成可以由上一层调用的产品化和模块化的服务;
纵向上,实现从资源、服务到应用的自下而上的统一协同编排,按需组织各层能力,实现算网各层原子能力效能的最大化。算网大脑面向算网基础设施层实现算网全领域资源拉通,面向算网运营服务层实现算网融合类全业务支撑,并融合人工智能技术提升产品设计、编排调度、运维优化等方面的智能化能力。
一个典型的算网大脑业务流程如下图所示:
0.算网感知中心持续感知算力网络基础设施层的各类算力、网络等信息,并向算网智慧中心提供用于智能分析的算网数据。
1.算网大脑能力开放中心接收来自算网运营层的算网业务订单。
2.算网大脑能力开放中心分解业务需求,如果是非算网业务的订单转给其他系统处理,如果是算网业务需求则发送给算网编排中心。
3.算网编排中心从算网感知中心获取算网资源信息和状态,获取备选资源数据。
4.算网编排中心通过算网智慧中心根据业务策略和备选资源数据进行智能分析决策,选中该算网业务订单的算网资源。
5.算网编排中心根据业务模板对算、网资源进行组合编排形成满足订单需求的算网业务资源组合的实例。
6.算网编排中心通过算网调度中心完成对算网业务实例中所有算、网资源的调度和配置,使能底层基础设施。
7.算网调度中心在完成了对于基础设施层的资源的调度和配置后,向算网编排中心返回结果。
8.算网编排中心根据订单完成算网业务的开通,通过算网大脑能力开放中心向算网运营层反馈订单处理结果及算网业务开通的信息。
- 03 -
明确定位后,中国移动开始了密锣紧鼓的建设工作,制定了“1+2+N”的算网大脑研发推进方案,基于算力网络整体规划和业务需求,系统性开展算网大脑研发顶层设计,明确算网大脑系统架构、模块分工和演进方案。
中国移动组建了两支研发团队开展算网大脑的研发,即“天穹队”和“星辰队”。其中,“天穹队”由网络事业部牵头,团队成员包括研究院开发团队、信息技术公司IT云支撑团队、设计院开发团队、浙江公司;“星辰队”由云能力中心牵头,团队成员包括政企事业部、信息技术公司云开发团队、网络事业部云专网团队、浙江公司。
两个团队依托各自的需求、资源和研发能力,面向需求与场景、网络能力封装与开放、多要素编排、多主体编排、任务式服务等五个方向开展攻关,先行先试探索,形成闭环,研发过程中实现能力互补和成果共享,相互提供移动云和网络能力开放的支持。
- 04 -
经过近两年的努力,到今天,中国移动算网大脑无论从理论研究,还是落地实践,都走在了行业前列!
今年科技部启动国家超算互联网部署工作,要求将全国众多超算中心通过算力网络连接起来,构建一体化算力服务平台。基于国家算力互联互通的要求,结合国内算力不断增长且使用率低的现状,中国移动基于转售云、合营云的整合经验,通过移动云统一门户,推出算力并网方案。
同时,今年4月中国移动推出了业界首个运用人工智能技术实现自动化运维的“算网大脑”M-Robot,打造智能、感知、编排、调度等能力,实现算领域、网领域的运营贯通、资源互调,实现全网跨域、跨厂商的算力流动,满足“东视西渲”、“云游戏”等一体化、任务式服务。目前,移动云已基于算网大脑构建了四大典型应用场景,即东数西算类、强算AI类、任务渲染类、泛视频类。
截至当前移动云已并网华为、曙光等10余个云平台,并网对象覆盖了通用算力、超算、智算、新型算力(如量子计算等)全部类型,算力规模达到9.5EFLOPS,初步实现全国多地算力互通。
按照这个方向走下去,中国移动算力网络一统算力江湖,并不遥远。
注:本文部分内容引用自中国移动《算力大脑白皮书》。