身处数字经济浪潮中,生成式AI成为焦点,展现了AI的巨大潜力。行业数据显示,预计到2026年,将有超过3千亿美元投向生成式AI领域。
为什么生成式AI能够成为引爆热点的关键?日前,在2024云栖大会-英特尔分论坛上,英特尔市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉谈到,生成式AI之所以成为热点,是因为它有望像上一波互联网浪潮一样,凭借技术重塑商业效率和创新价值链。特别是面向新质生产力所铸就的未来,前沿生产力的创新非常重要,生成式AI和算力基础将成为构造新质生产力的关键一环。
英特尔市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理 梁雅莉
多年来,英特尔推动算力和计算架构的发展,与阿里云十几年的合作中,从定制处理器到服务器优化,再到浸没式液冷机柜的研发,以及开源生态的共同构建,双方不断推动创新的边界。如今,面向生成式AI的加速创新,高速发展的AI算力也在驱动着下一代数据中心的演进。
至强6如何驱动下一代数据中心演进?
快速增长的AI算力需求亟需更高性能的基础设施作为支撑。此次大会上,英特尔分享了至强6平台架构,并预览了至强6性能核处理器的性能优势。
为满足多样化的客户需求,英特尔至强6微架构在采用灵活内核设计的同时,还拥有共享硬件平台与通用的软件堆栈,这将有助于提升系统可靠性并简化用户的开发、部署及管理流程。其中,即将发布的至强6性能核处理器通过内置的AMX和专门面向AI优化的AVX-512提高性能与效率,可满足计算密集型和AI工作负载的需求。
英特尔中国数据中心及人工智能事业部产品规划总经理李尔成谈到,企业AI是一个大有可为的领域,面对日益增长的工作负载,企业需要高性能、低延迟的解决方案,这推动了混合云策略的普及。同时,生成式AI工作负载的显著增长,给英特尔计算平台提出更高核心性能和更大内存带宽的需求;微服务市场的增长也促使英特尔继续优化处理器的能效比,以支持更快的开发周期和更高效的系统扩展。
“为了满足现代数据中心不断演进的技术需求,性能和效率需要齐头并进演进,同时,在平台和软件层面做到统一很关键。英特尔希望平台能够覆盖计算密集型(包括AI)的工作负载,同时也能够满足传统企业应用程序,可以进一步拓展云原生应用和使用场景”,李尔成强调,“至强6包括能效核和性能核,旨在满足这些需求,同时保持软件和平台层面的一致性。”
相比前代产品,至强6在AI方面的性能更值得期待,贡献最大的就是AMX(Advanced Matrix Extensions;高级矩阵扩展)运算单元,专门用来加速深度学习应用。与传统的GPU加速器不同,AMX不需要额外的驱动程序,它的使用方式与普通CPU指令相同,编程更简便。AMX支持可扩展性,集成在每个核心内部,可以提高数据处理的效率和一致性。
此外还有内存方面的优化,至强6平台通过CXL 2.0技术支持多样化的内存策略,如将CXL内存与DDR内存结合,以此扩展容量、提升并发访问速度和总带宽。下一代处理器平台将会支持CXL 3.X,引入基于交换机构建的CXL Fabric概念,支持更多节点的互连,满足低延迟、高带宽、容错和大规模部署的需求。据英特尔专家介绍,CXL Fabric的引入预示着在AI大模型时代,英特尔将能够更有效地满足对计算、互连和内存的复杂需求,优化AI大模型的性能和效率。
梁雅莉表示,“至强6平台通过采用共享的硬件平台和通用的软件栈,可以简化开发和部署流程。而这种策略依赖于芯片微架构的一致性。至强6通过共享的硬件平台以及不同侧重的性能核与能效核,能够满足多样化的计算需求。在迈向“双碳”目标的时代背景下,未来微架构的发展将更加注重在能源效率和计算性能之间找到最佳平衡点,以支持数据中心的可持续发展。”
搭载至强6性能核的阿里云ECS第九代企业级计算实例
会上,英特尔携手阿里云预发布了搭载有英特尔至强6性能核处理器的阿里云ECS第九代企业级计算实例,凭借更强性能和一系列先进特性,新一代企业级计算实例组合将持续推动下一代数据中心升级,为AI大模型的落地与发展提供强有力支持。
阿里云智能集团服务器硬件负责人文芳志回顾了与英特尔的合作历程,他表示,多年来,双方在服务器技术研发和云产品方面进行了深入合作,率先在国内进行浸没式液冷技术的商业部署,推出了包括高级RAS、硬件动态内存刷新控制等一系列先进的软件创新。此外,英特尔和阿里云在CXL、UCle和UALink等开放互连组织上合作推动标准建设,并联合推动Alinux和OpenAnolis社区的繁荣和发展。未来,双方将秉持持续创新的合作精神,共同推动技术与生态系统的进步。
据阿里云智能集团弹性计算高级产品专家姬少晨介绍,阿里云在弹性计算产品方面与英特尔有着深度的技术合作,从7代实例联合开发并在全球范围内率先发布基于SGX的安全增强型实例,到8代实例充分利用了英特尔AMX矩阵加速引擎和英特尔QAT技术等,并发布业界领先的TDX机密虚拟机。今年年中,阿里云对8代实例进行了优化,使得性能提升25%的基础上,保持价格不变。
经过不断地迭代升级,双方将英特尔至强处理器上的技术优势,通过阿里云弹性计算转化为云上弹性的算力,持续提供安全、稳定、高性能、弹性的云上算力服务。
据透露,9代实例发布前,阿里云进行了深入的客户调研,发现随着AI和大数据时代的到来,客户对算力的要求越来越高,云原生应用对算力的弹性需求也更强烈。因此,9代实例基于CIPU架构和英特尔至强6性能核处理器,提供了性能、弹性、稳定和安全的全面提升,且内存带宽提升了70%,L3缓存提升了50%。9代实例还支持全新弹性临时盘,相对本地盘实例,提升了资源灵活性,磁盘网卡密度也得到大幅提升。
在阿里云与英特尔的深度合作中,通过CPU原生硬件加速器,实现了场景化的能力增强。AMX通过引入新的硬件结构,提高了矩阵运算效率,适用于AI推荐和大模型数据清洗。此外,9代实例增加了FP16支持,进一步提高了精度和兼容性。同时,英特尔QAT加速器的引入,降低了处理器内核负载,提升了数据加解密和压缩解压缩的性能。
英特尔还分享了一系列与阿里云在诸多垂直领域实现数智化转型的实践成果。在媒体处理领域,搭载第五代英特尔至强可扩展处理器的个性化解决方案,可帮助阿里云视频云AI产品实现在画质修复、一键生成和视频搜索等工作负载上的大幅优化与升级。
在生命科学领域,英特尔亦与阿里云合作优化了多个面向不同场景的AI大模型,从而帮助加速药物的研发、生产以及销售的全流程。
写在最后
在AI加速迈向全面应用之际,英特尔携手阿里云在这次大会上展示了凭借各自技术优势、进行不懈探索的创新成果。
面临生成式AI的广阔机遇,下一代数据中心的变革已开始,不论是计算性能、计算效率还是总体拥有成本(TCO)等,都需要满足大规模、高性能计算的需求。而这将持续推动计算架构向前演进,处理器的微架构创新尤为关键,将从源头奔赴用户和业务场景的需求,解锁解锁AI时代的无限可能。