AI的狂飙离不开对智能算力的超高需求,智算中心再一次迎来高光时刻。今年以来,北京、贵州、甘肃、湖北、江苏等多地纷纷推出政策,推进当地算力基础设施建设,促进人工智能产业发展。
最新统计显示,截至5月底,全国规划具有高性能计算机集群的智算中心已达十余个。从算力规模来看,我国智能算力在算力总规模中的比重超过了30%。
持续“高热”的智算中心建设风潮背后是否存在资源过剩的问题?智算中心的能耗问题如何解决?
01、提质加速,智算中心遍地开花
智算中心的发展是应对当今世界日益增长的计算需求和信息爆炸的关键,它们为各种行业和科学研究等领域提供了必要的算力资源,通过处理大量数据促进科学发现和技术创新。在生物信息学、气候研究、金融分析、材料科学和人工智能等领域,智算中心都发挥着至关重要的作用。
中国信息通信研究院副院长王志勤在撰文中表示,我国智算中心发展相对较晚,且大模型所带来的智算需求爆发式增长时间较短,产业仍处于快速发展阶段。其中,AI模型训练具有训练耗能大、服务实时性要求低的特点,使得算力布局受能源分布、研发优势影响较大,当前能源优势明显的内蒙古、河北、贵州等地区,以及研发优势明显的北京、杭州、合肥等地区均是智算中心布局的热点地区。与此同时,在大模型热潮下,部分城市建设了规模相对较小的智算中心,也较好地补充了当地的模型微调需求。
2023年10月,工业和信息化部等六部门印发的《算力基础设施高质量发展行动计划》提出,到2025年在计算力方面,算力规模超过300EFlops、智能算力占比达到35%。其中,算力基础设施高质量发展指标显示,2025年要建设50个智算中心。
据不完全统计,目前全国正在建设或提出建设智算中心的城市已经超过30个,建设总数超过100个,投资规模超百亿元。其中,建设主体包括政府机构、三大电信运营商以及部分互联网企业。建设模式包括新建智算中心和已有数据中心改造升级,以及独立投资建设、第三方出资建设和基于特殊项目公司的建设运营等模式。
这些“智算中心”标准不一、规模不同,算力规模一般在50P、100P、500P、1000P,有的甚至达到12000P以上,虽然AI浪潮给智算中心带来了广阔的发展前景,但供需错配、价格昂贵、重复建设等仍然是我国算力建设面临的难题。
对此,中国科学院计算技术研究所研究员张云泉表示,当前,已经有近30个城市建设了智算中心,更多城市正在规划上马新智算中心,甚至出现了一个城市同时建设多个超算中心和智算中心的现象。由于需求不足,追求规模效应,运营过程不透明和缺乏监管,出现了智算中心空转甚至停机的现象,无法充分发挥设备生命周期内潜在效益,造成资源和资金浪费。
为了解决这一问题,智算中心建设需要进行精确的市场调研,确保算力供给与未来的技术需求、产业升级需要相匹配。与此同时,政府应当通过政策引导,加强智算中心建设和运营的监管,避免同质化竞争和无序扩张。通过区域协调和资源整合,推动智算中心的合理布局和高效利用,同时注重环保和能效,驱动智算中心向更绿色、更高效的方向发展。
国家信息中心与相关部门联合发布的《智能计算中心创新发展指南》指出,智算中心建设并非简单做好基建即可,还需结合建设基础、当地或区域产业特色,以差异化算力需求为导向,分类引导施策,优化建设方式,改建并行,发展与数字经济相适应的智算中心。
02、追“新”逐“绿”,液冷或成智算中心“标配”
智算中心作为人工智能产业重要的算力底座,其绿色建设关乎人工智能产业的高质量可持续发展。与传统的数据中心相比,智能中心的建设对能耗和基础设施的要求更高。面对数字化进程加快导致的爆发式算力增长,传统风冷散热方式难以满足大规模数字计算的高效散热需求,智算中心需要不断升级硬件设备、优化功率密度,满足不断增长的计算和存储需求。
近日,工业和信息化部、国家发展改革委等六部门联合发布2023年度国家绿色数据中心名单,通信、互联网、公共机构、金融、能源等领域的50家数据中心入围,重点新增了智算中心领域,将中国电信安徽智算中心A1楼等列入国家绿色数据中心名单,凸显了加快绿色智算中心建设的价值导向。
据了解,入选国家绿色数据中心PUE值呈逐年下降趋势,部分绿色数据中心能效达国际先进水平。2023年度国家绿色数据中心PUE平均值为1.26。其中,抖音—秦淮官厅湖新媒体大数据产业基地一期、中国电信(国家)数字青海绿色大数据中心、中国科学院计算机网络信息中心信息化大厦等绿色数据中心PUE值约1.15。
当前,我国智算中心不断强化绿色节能低碳技术应用。部分智算中心采用液冷、高压离心式变频水冷、封闭冷通道等先进制冷技术,使得机房散热能耗降低50%以上,PUE值降至1.2以下,节约空调电费超过50%,提高服务器算力5%~10%。部分地区依托当地“绿电+冷能”资源,构建源网荷储一体化的绿色能源供给体系,推动智算中心绿电直供,不断提高绿电消费比例,降低绿电使用成本,充分利用自然冷源。部分智算中心建立了运行数据实时采集、分析与控制平台,利用人工智能技术优化温控供电模式,实现智能化精确制冷,推动制冷耗电量下降8%~15%,从而保障智算中心的安全稳定与低碳运行。
值得一提的是,液冷作为一种高效、节能、稳定的散热方式,有望成为智算中心散热的“标配”。传统数据中心有40%左右的能耗用在空调系统上,即传统数据中心只有60%的电是用在服务器上。而如果改用液冷服务器,其散热耗电占比将会下降到20%以内,这是国家倡导建设绿色数据中心的重要原因。
在政策和市场的助推之下,国内液冷技术也受到市场追捧。2023年6月,中国移动、中国电信、中国联通三大运营商联合发布《电信运营商液冷技术白皮书》。其中提到的三年发展愿景指出,三大运营商将于2023年开展技术验证;2024年开展规模测试,新建项目10%规模试点液冷技术;2025年开展规模应用,50%以上项目应用液冷技术,共同推进形成标准统一、生态完善、成本最优、规模应用的高质量发展格局。IDC预计,2022-2027年中国液冷服务器市场年复合增长率将达到54.7%,2027年市场规模将达到89亿美元。
绿色发展是高质量发展的底色,智算中心作为人工智能产业重要的算力底座,其绿色建设关乎人工智能产业的高质量可持续发展。面向“东数西算”和“双碳”战略的时代命题,智算产业链上下游企业应携手推动智算中心的绿色低碳和可持续发展,为千行百业持续打造绿色和低成本的智能算力。
作者:梅雅鑫
责编/版式:王禹蓉
审校:王 涛 梅雅鑫
监制:刘启诚