“东数西算”工程的推进和“双碳”目标的驱动下,更加集约化、绿色化的数据中心呼之欲出,液冷技术成为扛鼎者。
据赛迪顾问预测,逐渐增长的数据中心算力将推动高功率单机柜快速普及,预计2025年全球数据中心平均功率提升至25kW,液冷变革势在必行,数据中心也将进入“液冷时代”。据预测,2025年我国液冷数据中心市场渗透率将达到20%以上。
政策与技术双重驱动,数据中心“液冷时代”到来
工业和信息化部、发展改革委等七部门联合发布《信息通信行业绿色低碳发展行动计划 (2022-2025 年)》(以下简称《行动计划》),2025 年,全国新建大型、超大型数据中心电能利用效率(PUE)降到 1.3 以下,改建核心机房PUE降到1.5以下。
根据“东数西算”工程要求,内蒙古、贵州、甘肃、宁夏四处集群枢纽设立的数据中心集群PUE应控制在1.2以内;京津冀、长三角、粤港澳大湾区、成渝四处集群枢纽设立的数据中心集群PUE则要控制在1.25以下。
除了政策对PUE的严苛要求,数据中心在技术层面也面临严峻挑战:
当前,芯片功耗与服务器功耗逐步上升,特别是人工智能需求的通用 GPU 功耗急剧增加,使得单机柜功率密度正不断增大。根据《2021-2022 年度中国数据中心基础设施产品市场总报告》,2021 年我国单机柜功率在10kW以上的数据中心市场规模增速超过10%,其中 30kW以上增速达 31%。
如果采用风冷散热方式,通常要把单机柜功率控制在12kW以内,以确保散热系统能够为IT设备提供合适的工作温度。但是,随着服务器单位功耗不断增大,单机柜功率15kW基本成为空气对流散热能力的天花板,一旦超越这一数值,处于高温状态工作的 IT 设备将出现运行不稳、加剧老化甚至频繁宕机等后果。
因此,在政策与技术的双重驱动下,高效低碳的液冷技术不仅是散热方式的改变,更有可能变革整个数据中心生态。
建成亚洲最大液冷基地,浪潮信息加速推进液冷产业化
为推动液冷产业的发展,浪潮信息在2021年建设了亚洲最大的液冷数据中心研发生产基地,该基地年产能超十万节点。日前,浪潮信息举办了首个天池液冷产业基地开放日,展示了液冷智造能力、品控管理体系、液冷解决方案以及在行业标准领域的进展。
浪潮信息服务器产品线总经理赵帅表示,通过天池液冷产业基地的建设,浪潮信息形成了以规划设计、产品定制、实施部署、智能运维四大关键环节为中心的独特液冷解决之道,通过全栈液冷产品和解决方案以及端到端的服务,为客户提供液冷数据中心全生命周期整体解决方案,降低用户应用门槛,从而加速液冷技术普及。
一组数字可以展示液冷技术的实际节能效应:截至目前,采用浪潮信息液冷技术的数据中心累计已节省1.05亿度电能,相当于减少1.3万吨标准煤消耗、3.5万吨二氧化碳排放,种植194万棵树,可供6.6万个中国家庭全年用电。
在“All in 液冷”战略指引下,浪潮信息通过整合研发、生产、测试、品控、交付等在内的全链条能力,构建了“5G+工业互联网+人工智能”的先进智造工厂,实现了工业化生产、系统化品控、规模化交付,并通过持续技术创新加速液冷普惠。
依托天池液冷产业基地强大的研发能力,浪潮信息已经完成了大量液冷技术的多次迭代,通过持续创新不断提升技术成熟度。目前,浪潮信息已通过技术创新,解决了当前液冷技术的多个痛点。
其中,液环式真空CDU是极具代表性的一项技术,它是浪潮信息首创的一种液冷系统二次侧均为负压的动力单元,由于管路内均为负压,因此彻底杜绝了漏液隐患。同时,这项技术创新突破了液冷循环系统只能采用高压水泵,才能实现液体循环流动的“定律”,实现了仅依靠真空泵通过不同传感器控制多腔室功能切换,即可实现流体的循环流动,在技术极简化同时也实现了可靠性的大幅提升,将有效推动冷板式液冷技术的普及。
2025年,液冷渗透率有望超过20%
我国液冷当前的渗透率还较低。从整体现状来看,主要是一些创新型的数据中心在积极应用,东部地区数据中心整体PUE要求较高,液冷使用相对多。此外,不同行业客户对于液冷产品与方案具有多样化需求。
“在国内当前的应用环境下,没有最好的液冷,只有最适合用的液冷,这是我们的一个核心理念”, 赵帅谈到。
再强的黑科技如果不能走进现实,终归只是科幻情节。浪潮信息这一务实的技术路径除新建液冷数据中心外,也非常适用于大量的老旧数据中心,一直以来,改造老旧数据中心的一个挑战就是管井空间不足以实现液冷管路,于是就有了风液CDU的出现。在中国西部科技创新港的数据中心应用案例中,浪潮信息就是通过300多个风液式的节点,满足了实际的使用需求。
“中国的液冷发展会是逐步迭代的过程,到2022、2023年液冷渗透率可能只在5%左右,但是到2025年,我们认为会超过20%”,赵帅表示。
基于浪潮信息天池液冷产业基地一年超10万节点的产能,可以满足2023年左右的业务需求。据透露,浪潮信息一个规模更大的液冷产业基地正在筹建中,届时可以达到40万节点左右,能够满足2025年甚至之后更大规模的发展需求。
液冷技术已成熟,产业化是当务之急
国内液冷产业总体发展现状如何?赵帅表示,液冷技术本身,及其加工、焊接、产品工艺等已比较成熟。现在迫在眉睫的是打通产业链的工作,形成可批量化、可复制化、可规模化的效应。
浪潮信息在提出“All in液冷”战略时设立了一个目标,希望在2025年实现“风液同价”。“这是我们大力推进产业化的一个核心目的,我们一定要实现这个目标,这样才能让液冷使用门槛越来越低”,赵帅谈到。
浪潮信息数据中心产品部副总经理李金波表示,推进液冷产业化的关键是建立标准,对于液冷部件来说,主要是两类:一类是设计标准,要让所有研究团队通过公认的标准,慢慢形成标准的技术体系;一类是测试标准,要把原来的设计准则在测试环节中一一地实现、被行业所认可,这时整体的标准、规范才能打通。
AI服务器液冷渗透率将更快、更高
对于服务器处理器来说,摩尔定律已经面临瓶颈,提升性能的同时功耗难免也会增加。而通过液冷技术,可以让芯片处于适宜的温度,长期稳定地运行。
据了解,数据中心的液冷冷板标准除了覆盖x86处理器(Intel、AMD),也包括Arm架构的CPU。其次,还有针对异构加速的冷板标准。
针对火爆的AI服务器市场,赵帅表示,“短期内,AIGC对数据中心训练需求是爆炸式的增长。长远来看,推理市场也会是爆炸性的增长”。
相比于通用服务器,AI服务器功耗更高,单台服务器约10千瓦。“现在10千瓦的服务器是6U高,单U要解决1.5千瓦到2千瓦的散热量,如果单纯用风冷技术,需要把服务器做成10U高,几乎不可能实现”, 赵帅认为,“液冷技术在AI服务器的渗透率会更快、更高。”
智能化是未来方向
随着数字化的深入发展,数据中心的智能化成为关键。对于液冷数据中心来说,都有哪些智能化的运维手段?
赵帅谈到,首先是将二次侧和服务器本身的控制完整地结合到一起。例如,将BMC的控制下放给CDU,由CDU做服务器控制,从处理器、服务器端传回各种数据,在CDU端用很好的流量控制做整体的管控,这是通过技术一体化能实现的管理一体化。
其次,未来希望把室内外一体化的管控和服务器的管控结合到一起。伴随数字化的发展,早期是服务器作为一个独立节点维护,随着互联网时代的到来,一个机柜作为一个节点去维护。而随着数据中心规模越来越大,会不会把整个数据中心作为节点去维护?这其实是一个发展方向。
李金波表示,液冷数据中心的整体系统是由液体连通的,简言之就是水经过服务器到外围的管路,到冷量分配单元CDU,然后再到外面的冷水机组、冷却塔等。在这样一套系统中,通过监控连通的液体从内部到外部流量、温度、压力的变化等,可以将全部液体监控起来,从而实现从处理器芯片到数据中心环境的打通。
也就是说,通过把CDU作为核心的控制单元,既能连通服务器的参数,又能够检测室外天气的参数,从而通过这个控制单元对整体系统进行调控。未来,AI也将会被引入智能化运维手段中。例如结合天气变化与服务器负载功耗变化,,提前调控水温和水流量等参数,通过实现提前调控减少数据中心能耗,并防止服务器超温报警。
写在最后
如何高效建设液冷数据中心?这是当前全产业都在探究的方向。如果说浪潮信息将通用服务器、高密度服务器、整机柜服务器及AI服务器全面适配液冷的举措,是打通了算力层面的液冷化基础。那么,提供覆盖咨询、规划、生产交付全流程的端到端液冷整体解决方案则是更进一步助推了液冷的产业化。
不过,液冷技术虽然逐渐趋于成熟且需求看涨,但整个产业仍处于商业化的初级阶段。正如笔者在浪潮信息天池液冷产业基地媒体开放日所感受到的:液冷产业提速,当下核心要解决的问题在于标准化建设、产业链整合,从产品技术、生产组织、品质标准等产业要素入手,才能让液冷技术走向更多的数据中心。