几天前英伟达发布财报,业绩不错,但不够好,无法推动股价进一步爬升。尽管如此,英伟达已经向投资者证明,竞争对手AMD、英特尔想追上还有很长的路要走。
英伟达高管知道竞争很激烈,他们强调,在AI芯片领域英伟达地位超然。如何保持优势?英伟达会加快研发速度,每年都会发布新品,而不是两年一次。
赶超英伟达不容易
由于英伟达的前进速度非常快,AMD、英特尔想追赶很不容易。分析师Raymond James和Srini Pajjuri认为,明年在AI加速芯片市场英伟达将会占据85%的份额。
Srini Pajjuri还说,因为等待B100芯片,一些客户可能会暂停支出,B100要等到明年下半年才能量产。尽管如此,客户也可能不会购买AMD M1300和英特尔Gaudi 3芯片(明年推出)。
独立分析师Richard Windsor认为:“虽然竞争对手越来越多,英伟达仍然是生成式AI算法训练的领头羊,主要是因为在过去近20年的时间里它辛苦搭建了CUDA软件平台。”
在AI芯片市场,除了英特尔和AMD,谷歌、微软也成了英伟达的竞争对手。面对挑战,英伟达信心十足。Raymond James认为:“英伟达的GPU在通用性、实用性方面比定制解决方案更好。”
英伟达不只有芯片,它还搭建了一整套平台和生态系统,名叫“英伟达科学计算平台”(Nvidia Scientific Computing Platform),它将硬件(Hopper GPU、Grace CPU)和系统软件(比如CUDA、PhysX)结合在一起,让开发者开发模型变得更简单。
不只如此,英伟达还有端到端平台,包括Omniverse、Nvidia AI等。
英伟达的“诗与远方
”未来如何发展?在不久前的SC23大会上,英伟达发布一批新品,从中我们可以窥见端倪。
1、用新GPU保持优势
英伟达推出H200芯片,它相当于H100 Hopper GPU的升级版本,内存设计更进一步。由于从HBM3跳到HBM3e,新的H200拥有更高的内存带宽和更大的内存容量,所以性能会有明显提升。
以前当我们谈及GPU、CPU性能时经常会讨论内存技术,现在面对新的AI模型和HPC负载,更加考验内存容量。H200的内存容量增加76%,内存带宽提升43%。
在AI芯片领域,英伟达本来已经是领先者,有了H200领先优势进一步扩大。不过对手也没有示弱,英特尔正在推进GPU、Gaudi AI加速器战略,AMD将会推出MI300 AI应战,英伟达不能掉以轻心。
英伟达对下一代架构Blackwell和B100 GPU给予厚望,它们预计会在2024年推出,性能是H200的两倍。
为了给未来产品打气,英伟达拉拢一帮合作伙伴和客户站台。例如,2018年成立的EuroHPC Joint Undertaking在欧洲建设超级计算系统,它准备打造Jupiter超级计算机,拥有约24000个GH200节点;该超级计算机将Arm Grace CPU和Hopper GPU组合在一起。还有Texas Advanced Computing Center,它准备搭建名为Vista的系统,用到了GH200 Grace Hopper和Grace CPU超级芯片。
2、瞄准量子计算
许多人认为,计算的下个大变革应该是量子计算。目前英伟达还没有QPU(量子计算单元),但这并不意味着英伟达对量子计算技术无动于衷。不管英伟达是自己打造还是花钱购买量子算力,支持量子计算硬件和软件是确定的,因为它不想落后。
从硬件的角度看,今天的所有量子计算系统几乎都与传统计算系统有关,科学家用传统计算系统模拟或者控制量子系统。这样做会有一些坏处,比如出现计算错误。英伟达提出了“混合量子系统”的概念,意思就是让量子工程师、系统研究人员与英伟达全程合作。
在过去15年里,英伟达凭借CUDA打遍天下。现在英伟达还提出“CUDA Quantum”(CUDA量子)的概念,将量子与CUDA联系起来。
“CUDA量子”包括一套高级编程语言,它让量子系统设计师、应用程序开发者编写的代码既可以在传统系统上运行,也可以在量子系统上运行,让两个系统上的工作可以彼此迁移,或者简单模拟量子系统上的程序。
按照英伟达的说法,前50强量子计算创业公司中已经有92%使用英伟达GPU和软件,78%的企业用CUDA Quantum搭建或者部署量子处理器。
从英伟达的布局不难看出,它不仅要牢牢掌握现在风头正盛的AI计算,还要在下一代量子计算领域占据上风。