正如在超级计算专家齐聚的年度盛会ISC上所展示的,加速计算正在帮助研究者努力应对当今的重大挑战。
研究者们致力于构建模拟新能源的数字孪生,或者通过使用人工智能(AI)和高性能计算(HPC)深入探索人类的大脑。
NVIDIA加速计算业务副总裁Ian Buck在汉堡举行的ISC上发表了特别演讲。他在演讲中表示,其他公司正在使用高敏感度仪器将HPC推向边缘或在混合量子系统上加速模拟。
实现超过10 Exaflops的AI性能
例如洛斯阿拉莫斯国家实验室(LANL)的一台名为Venado的新型超级计算机将提供10 exaflops的AI性能,以推动材料科学和可再生能源等领域的研究工作。
LANL的研究者使用该系统中的NVIDIA GPU、CPU和DPU,将其多物理场计算应用的速度提高了30倍。该系统以新墨西哥州北部的一座山峰命名。
Venado使用NVIDIA Grace Hopper超级芯片,将工作负载的运行速度较之前的GPU提升了3倍。这台超级计算机还配备NVIDIA Grace CPU 超级芯片,在长尾未加速应用上的每瓦性能是传统CPU的两倍。
BlueField蓄势待发
LANL系统是全球众多采用NVIDIA BlueField DPU的最新系统之一,该系统用于卸载和加速主机CPU的通信和存储任务。
此外,德克萨斯州高级计算中心也正在为Lonestar6上的NVIDIA Quantum InfiniBand网络添加BlueField-2 DPU。该网络将成为一个云原生超级计算开发平台,能够以裸机性能托管多个用户和应用,同时安全地隔离工作负载。
Buck表示:“这是下一代超级计算和HPC云的首选架构。”
欧洲的百亿亿次级超级计算机
在欧洲,NVIDIA和SiPearl正在一起扩大在Arm上构建百亿亿次级计算的开发者生态系统。这项工作将帮助该地区的用户将应用移植到使用 SiPearl 的 Rhea 和未来基于 Arm 的 CPU 以及NVIDIA加速计算和网络技术的系统上。
日本筑波大学的计算科学中心正在NVIDIA Quantum-2 InfiniBand平台上将NVIDIA H100 Tensor Core GPU和x86 CPU搭配使用。这台新的超级计算机将处理气候学、天体物理学、大数据、AI等方面的工作。
这些新系统将加入最新全球超级计算机排行榜TOP500,该榜单上71%的超级计算机采用NVIDIA技术。此外,榜单上80%的新系统还使用NVIDIA GPU和/或网络,并且NVIDIA的网络平台是TOP500系统使用最多的互连平台。
HPC用户采用NVIDIA技术,是因为它们能够为超级计算工作负载——模拟、机器学习、实时边缘处理,以及量子模拟和数字孪生等新兴工作负载提供强劲的应用性能。
Omniverse大幅推动科学研究的发展
为了展示这些系统的功能,Buck播放了英国原子能管理局和曼彻斯特大学的研究者在NVIDIA Omniverse中构建的虚拟核聚变发电站演示。这个数字孪生实时模拟了整座发电站、其机器人组件,甚至发电站的核心——核聚变等离子体的行为。
三维设计协作世界模拟平台NVIDIA Omniverse使该项目中的远程研究者可以使用不同的三维应用开展实时合作。他们将通过用于创建物理学AI模型的框架——NVIDIA Modulus来改进他们的工作。
Buck表示:“这项工作的复杂程度令人难以置信,但它正在为未来的清洁可再生能源打下基础。”
AI在医学影像领域的应用
另外,Buck描述了研究者如何在NVIDIA Cambridge-1上创建一个由10万张人脑合成图像组成的图像库。这台超级计算机专门用于通过AI推动医疗行业的发展。
一支来自伦敦国王学院的团队使用MONAI(一种用于医学影像的AI框架)生成了栩栩如生的图像,这些图像可以帮助研究者了解帕金森病等疾病的发展过程。
Buck表示:“这充分表明了HPC与AI这对组合正在为科学和研究界做出真正的贡献。”
边缘HPC
HPC工作越来越多地延伸到超级计算机中心之外的范畴。观测站、卫星和新型实验室仪器需要实现数据的实时流式传输和可视化。
例如,劳伦斯伯克利国家实验室的光片显微镜工作团队正在使用NVIDIA Clara Holoscan实时观察纳米级的生命,这项工作在CPU上需要花费数天时间。
为了将超级计算带到边缘,NVIDIA正在开发用于HPC的Holoscan。Holoscan是我们图像软件的一个高度可扩展版本,它可以加速各种科学研究工作。该软件将在Jetson AGX模块和设备、四路A100服务器等各种加速平台上运行。
Buck表示:“我们也期待研究者们通过该软件展开工作。”
加快量子模拟的速度
Buck表示另一个超级计算载体——NVIDIA cuQuantum正在被迅速采用。这个软件开发工具包可以加快GPU上的量子电路模拟速度。
数十家企业机构已将它用于多个领域的研究。该工具包被集成到主要的量子软件框架中,因此用户无需进行额外的编码就可以实现GPU加速。
AWS最近宣布在其Braket服务中提供cuQuantum。该公司展示了cuQuantum如何在量子机器学习工作负载上提供高达900倍的加速,同时减少3.5倍的成本。
Buck表示:“量子计算具有巨大的潜力。为了离有价值的量子计算更近一步,我们必须在GPU超级计算机上模拟量子计算机。我们十分高兴能站在这项工作的最前沿。”