在不久前于比利时举行的ITF World 2024大会上,AMD的领军人物苏姿丰荣获了备受瞩目的IMEC创新大奖。这一殊荣不仅是对她卓越的行业领导力和创新精神的认可,也让她跻身于传奇人物戈登·摩尔和比尔·盖茨的行列,他们同样曾经荣获过这一大奖。
01.AMD雄心勃勃的目标
在颁奖典礼后的演讲中,苏姿丰公布了AMD未来三年的宏伟蓝图。她透露,AMD正致力于一项雄心勃勃的目标:即到2025年,将计算能效提升至2020年的30倍。而在此之后,公司更是设定了在2027年实现能效百倍增长(与2020年相比)的宏伟计划。所谓计算能效,即计算机在执行任务时能源利用的效率。尽管在诸多性能参数中,它可能不显得那么耀眼,但实际上是核心性能、功耗管理、制程工艺等多方面技术的综合体现。AMD为何如此看重计算能效的提升?答案或许可以从当前AI运算的爆炸性需求中找到。
02.强大的算力刻不容缓
随着AI成为半导体行业的核心驱动力,对高效、节能的计算设备的需求也日益迫切。
以英伟达为例,这家在AI计算硬件领域占据统治地位的半导体公司,近期市值飙升,一度超越德国所有上市公司的市值总和。其背后的推手正是其在AI计算硬件领域的卓越实力,如H100、H200等顶尖的专业计算卡,以及最新发布的GB100和GB200,这些芯片的算力之强大,单个芯片就堪比昔日的超级计算机。
在这样的行业背景下,AMD的计算能效提升计划无疑为业界带来了新的期待。从过去的“25x20”计划到如今的新目标,AMD正不断推动技术创新,从产品架构、制造工艺、封装技术、互连技术等方面提升能效,比如3nm GAA全环绕栅极工艺,比如2.5D/3D混合封装等等,以满足日益增长的AI运算需求,并努力在半导体行业中保持领先地位。
在AI技术飞速发展的今天,强大的算力成为了推动科技进步的关键力量。然而,这背后所付出的能源代价也不容忽视。英伟达推出的H100芯片,其TDP(热设计功耗)高达700W,而最新款的GB200更是达到了惊人的2700W。若按英伟达的官方配置方案,单个搭载最高36个GB200芯片的NVL72服务器,仅芯片自身的功耗便高达97200W,这还不包括其他配套硬件的能耗。
随着AI技术的深入应用,超级计算中心的建设也呈现出井喷之势。亚马逊计划采购2万个GB200来构建全新的服务器集群,而微软和OpenAI更是联手推出了名为“星际之门”的超级计算中心项目,预计投资高达1150亿美元,耗电量将达到数十亿瓦级别。这座计算中心一旦建成,其耗电量将足以在全球各大城市中排名前20,这仅仅是众多计算中心中的一座。
事实上,随着计算中心数量的增加,其耗电量也在迅猛增长,已经引发了电力供应紧张的问题。尤其是在美国,部分城市甚至出现了电力供应不足的情况。从能源角度来看,建设一座发电厂不仅耗时长,还容易受到环保组织抗议的影响,进一步拖延工程进度。
在能源问题短期内难以得到根本解决的情况下,提高计算能效成为了解决能源与算力之间矛盾的关键。通过更高效地利用每一瓦电力,我们可以维持更大规模的AI模型训练,满足不断增长的计算需求。苏姿丰在演讲中也强调了这一点,她认为提高计算能效不仅有助于解决能源问题,还能让超级计算中心被部署到更多地方,为更多城市提供AI服务。
展望未来,AI技术的普及将依赖于更低成本的计算服务。而计算能效的提升直接关系到AI计算的成本。只有当我们能够降低AI计算的成本,才能使其在大范围内得到普及和应用。因此,提高计算能效不仅是技术发展的必然趋势,也是推动AI技术普及和应用的重要手段。
03.进步飞速的AMD
AMD,作为GPU领域的重量级选手,面对英伟达在AI芯片市场的强劲势头,迅速调整战略,加速推进自家的AI芯片研发与上市。为了加快进度,AMD的CEO苏姿丰对GPU团队进行了重大重组,集中资源支持AI芯片的研发。这一策略的调整,虽然暂时影响了消费级显卡的发布计划,如旗舰产品的取消,但中端显卡的推出仍按计划进行。
经过紧张的研发周期,AMD的AI芯片取得了显著进展。最新推出的MI300X,包含1530亿个晶体管,分为12颗小芯片、24颗共192GB HBM3内存芯片。在性能上已超越英伟达的H100,其高达42 petaFLOPs的算力以及192GB的显存,在功耗上却与H100相近,仅为750W。这一成就让AMD在市场上获得了广泛关注,微软、OpenAI、亚马逊等科技巨头纷纷表达了采购意向,极大地推动了AMD在计算领域芯片出货量的增长。
据行业分析师预测,2024年AMD的AI芯片出货量可能达到英伟达出货量的10%,并有望在明年进一步增长至30%。AMD之所以能够取得这样的成绩,离不开其在计算能效方面的持续创新。通过研发2.5D/3D混合封装技术等新技术,AMD成功在保持封装面积不变的前提下,为芯片提供了更多的晶体管和内存,减少了芯片与内存间数据交换的消耗,从而提高了每瓦时的计算性能。
AMD还计划推出新一代能效更高的芯片架构,预计将在2025年发布,并有望实现计算能效提升30倍的目标。然而,要实现更为激进的2027年计算能效提升100倍的目标,AMD还需在制程工艺、架构设计等多个领域取得突破。
对于AMD的积极调整和市场表现,英伟达并未坐视不理。作为全球领先的AI计算硬件供应商,英伟达早已发布了GB200这款算力强大的芯片,其在推理性能和计算能效上的提升同样令人瞩目。随着AMD和英伟达在AI芯片市场的竞争日趋激烈,未来三年内,AI芯片市场无疑将迎来一场深刻的革新。