• 正文
    • 英伟达,如何成为英伟达?
    • OpenAI造芯,到底是谁疯了?
    • GPT7和暗硅效应
    • AI的黄金时代
  • 推荐器件
  • 相关推荐
申请入驻 产业图谱

万亿造芯?OpenAI能否成为下一个英伟达?

2024/04/02
1850
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

从2023年底开始,英伟达开启了暴涨模式,三个月翻了快一倍,女神节那天最高涨到926.69美元,总市值达到2.32万亿美元,仅次于微软和苹果,成为全球市值第三大的公司,而且只离苹果一步之遥。单从数字来看,英伟达的2.32万亿市值已经超过地球上绝大多数国家的GDP,仅次于美中德日印英法,排名第八

眼看英伟达富可敌国、遥遥领先,买了英伟达股票的人在财富暴涨的同时、期待着英伟达股价超过1000美元;没买英伟达的人一边说着泡沫太大,一边祈祷这趟飞驰的列车什么时候能停一停让他们上车。而整个科技圈和全球投资者都在寻找,看谁会成为下一个英伟达。

从传统的芯片巨头,到初创公司,再到互联网大厂和人工智能公司,算力已经成了人工智能时代最重要的铲子。谁能掌握铲子的销售权,谁就拿到了通往万亿市值的钥匙。

今天要讨论的这家公司,和芯片没毛线关系。但在人工智能领域,它已经是像英伟达那样遥遥领先的存在了。更有意思的是,它是算力这把铲子的最大买家,或许也是英伟达最大的金主爸爸。

是的,这家公司就是OpenAI。OpenAI这个浓眉大眼的家伙,也要自己造芯片了,而且一出手就是七万亿美元。不仅要造芯,如今又传出OpenAI要和微软共建一个地表最强的AI数据中心,代号「星际之门」,耗资1150亿美元

这些操作,简直和英伟达的布局一毛一样。那么问题来了,OpenAI能否成为下一个英伟达?

英伟达,如何成为英伟达?

在详细分析OpenAI的造芯前景之前,我们得先弄明白英伟达走到现在的高度,到底是因为什么原因、它到底做对了什么。先说结论,在我看来英伟达做对了四点,分别是领导者、技术、生态、运气,缺一不可

先说领导者。打工人肯定都有体会,一个靠谱的老大是多重要。不过我们这里说的领导者,显然要更高一层,是带领整个公司甚至行业发展的真正领袖。不用多说,英伟达老大黄仁勋应该是当前全球最炙手可热、而且还在一线工作的科技领袖之一。

31年前,老黄在美国加州的一个小餐厅里创立英伟达,目标是要开拓一个「0亿美元市场」,也就是从0到1进军一个大家从未听说过的领域,而不是在存量市场里不断内卷。事实证明,正是因为老黄非凡的想象力和前瞻性,带领英伟达踩中了过去三十年的几乎所有风口,也把英伟达带到了现在前所未有的高度。

所以对于科技领袖来说,最重要的就是「预见未来」的能力、以及开疆破土的勇气。所有万亿美元的产业,都是来自于0亿美元的市场。这对于我们的创业者来说也是一个很重要的启示。比如在ChatGPT出现之后,一堆初创公司去自研大模型,并不是说这没有意义,而是或许这并不是个0亿美元的市场。如何把握公司的未来方向,领导者起到的作用至关重要。

再来说技术和生态。这是英伟达遥遥领先的两个最重要护城河,之前视频里也说过多次了。一方面通过对GPU架构的不断优化,集成更多AI算力,让GPU成为人工智能掘金路上不可或缺的铲子。另一方面通过CUDA构建软件和开发者生态,培养加强AI从业者对英伟达GPU的依赖。

就像我们从小学中文;长大后是可以再学英语法语,但肯定不如母语用起来顺手。技术和生态构成了一个不断旋转的飞轮,芯片和技术做的好,会吸引更多人来用,从而形成了生态;生态做的好,用户就习惯留在这里,同时提出更多需求,帮助下一代芯片再上一个台阶。其他公司想要成为下一个英伟达,技术和生态缺一不可。

最后再说运气。不管是99%的努力加1%的运气,还是1%的努力加99%的运气,运气本身都是取得成功的必要因素。英伟达之所以达到今天富可敌国的程度,很重要的原因就是踩中了过去三十年几乎所有的风口。从游戏到云计算到数字货币挖矿到元宇宙到汽车再到现在的人工智能,无一例外。

但是,我想说的并不是创业公司要像「周处除三害」里的陈桂林一样去找关圣帝笅杯占卜,而是要不断提升好运到来的概率,这样当运气没来时蛰伏、运气一旦来到就能一把抓住。就像英伟达本质上并不是在追风口,而是构建GPU的基础技术,让它灵活到能适用于前面说的这么多领域,但又足够强大,能成为风口到来时的唯一选择。当然,运气和产业本身的发展状态、甚至和领导者的造势能力也有很大关系。

所以,领导者、技术、生态、运气这四点,是衡量一个公司未来发展的重要因素。接下来我们就用这个框架来看看,到底OpenAI能否成为下一个英伟达。

OpenAI造芯,到底是谁疯了?

很多朋友应该会疑惑,OpenAI不是做大模型的人工智能公司吗?他应该是英伟达的金主爸爸啊。但事实上在大模型领域,算力和模型,谁是爸爸谁是儿子还不一定。由于训练一个大模型特别吃GPU算力,所有公司都在疯狂买卡,这就形成了一个卖方占主导的市场。

强如OpenAI,虽然有微软数据中心近乎all-in的强力支持,也逐渐遇到了算力瓶颈。要知道GPT3的训练成本大概400万美元,到了GPT4就飙升到1亿,有人预估GPT-5的训练成本会高达惊人的25亿美元,其中绝大部分都要用来买英伟达的GPU算力。

于是,OpenAI的CEO Sam Altman大笔一挥,宣布要筹措7万亿美元自己造芯(后来他在Lex Freddman的播客里说「我从来没说过7万亿」,Lex说「OK,但你说了8万亿」……)。听到这个消息,我感觉不是他疯了,就是我疯了。根据他的说法,要用这笔钱彻底改造全球的半导体行业。所以他不止要做芯片设计,还要自己造晶圆厂

7万亿美元是什么概念呢,网友也帮我们算了一笔账,7万亿可以买下包括英伟达在内的全球前20名芯片公司,外加Meta,然后奥特曼还能剩下三千亿美元,就是这么夸张。你把所有芯片公司都买了,搞个OpenChip公司自己玩就行了呗。为此,硅仙人Jim Keller现场打脸,在社交媒体隔空喊话,说这些事儿给我一万亿就搞定了

话说回来,且不论7万亿美元造芯有多疯狂,我觉得OpenAI造芯是在算力紧缺情况下的一个理智的选择。那么套用我们的领导者-技术-生态-运气框架,OpenAI能否成为下一个英伟达呢?领导者方面,Sam Altman可以说是现在全球科技圈最有名的八零后领袖。不管是ChatGPT、GPT应用商店,还是年初发布的Sora,OpenAI在他的带领下已然成为了人工智能领域创业公司的王者公司。他自己的个性也很鲜明,把硅谷搞成了好莱坞,把OpenAI搞成了宫斗现场,还上演了熹贵妃归来的大戏。不过和老黄相比,奥特曼个性有余、从容亲和略显不足。

所以领导者这一项,我给OpenAI四颗星。

再来看技术维度,OpenAI七万亿造芯到底能干成吗?先看芯片架构的选择。根据现在披露的非常有限的信息,我们不知道OpenAI是做专用芯片还是通用芯片,但我猜大概率是以AI专用芯片开始,可能会通过收购一些初创AI芯片公司快速起步,之前就有传言说OpenAI看上了来自英国的Graphcore,这也是很多大厂自研芯片的常用套路。外加OpenAI的看家本领是大模型本身,因此会为芯片设计提供非常理想的应用和优化的场景。所以如果OpenAI真的下场造芯,我毫不怀疑他们能设计出一个高性能的AI芯片。

不过,在奥特曼的七万亿规划中,还包含芯片制造的部分,这就有点不靠谱了。当前芯片行业的主流模式是fabless、也就是无晶圆厂模式。这个模式的核心是绝大部分芯片公司只负责芯片设计,只有少数公司负责芯片制造,让大家专注在擅长的领域、发挥各自的优势,不用既要又要还要,从而实现资源的合理分配。这种无晶圆厂模式也是芯片行业经过几十年的发展分工逐渐形成的稳定而高效的模式。

具体来看芯片制造,如今有高端芯片制造能力的公司只有三个:台积电、三星和英特尔。这是个资本和技术极度密集且门槛极高的行业,没钱不行,只有钱也是万万不够的,必须得有几十年行业经验和工程实践的技术积累。这么说吧,如果你从来没做过包子,想在你家小区旁边开一家包子铺应该都费劲。更不用说从来没做过芯片的人上来就去盖芯片厂了。这么深的水,我怕你把握不住。

也有分析说,奥特曼为了动用钞能力弯道超车,打算搞加盟模式,也就是把钱给台积电,请台积电建厂和运营,只为OpenAI服务,硬生生把台积电搞成7-11,果然有钱就是任性。

综上,开启买买买模式的OpenAI造芯,在技术维度我给四颗星。

GPT7和暗硅效应

再来看生态。OpenAI在人工智能领域有着梦幻开局,但先发优势能否转化为像英伟达那样的万亿市值和技术统治力,还取决于生态的发展和未来路线图的设计,而这恰恰也是我认为最存疑的地方。

为什么这么说呢?四年前,OpenAI发表了一篇论文,提出了大语言模型的缩放定律(scaling law)。这个定律表明,只要对大语言模型投入更多算力和数据进行训练,就能提高它下一个单词的预测准确性。有人也把这个定律简单描述为:scaling is all you need,好像只要不断投算力和数据,大模型就能不断发展下去。

但事实真的是这样吗?有人做了一个计算,如果保持现在GPT1234发展的速度,到2030年左右的GPT7就需要全世界所有计算机提供算力、需要一个超过三峡大坝或者现在任何核电站的巨型发电厂提供能源,以及超过现在地球上所有的数据,这显然是不现实的。

OpenAI提出的缩放定律,让我想到了芯片领域的两个非常类似的缩放规律,一个是登纳德缩放定律(Dennard Scaling Law),一个是阿姆达尔定律(Amdahl's Law)。登纳德缩放定律认为,随着晶体管体积的缩减,它们的工作电压也会降低,从而使得芯片单位面积功耗保持不变

也就是说,随着芯片技术的发展,我们可以同样的芯片面积上放更多晶体管,性能更高,但功耗不变;或者为了实现同样的性能,芯片面积会更小、功耗会更低。阿姆达尔定律认为,要显著提升一个程序的执行速度,就需要尽可能减少他串行部分的执行时间,同时增加并行代码的比例

因此十几年前,芯片领域学术界和工业界的主要发展趋势就是多核心架构。虽然这还没有完全成为一个正式的全球性共识,但在当时,多核架构是非常热门的研究方向。人们认为,如果可以找到编写和运行并行软件的方法,我们就能直接将处理器架构扩展到数千个核心,从而带来芯片性能成百上千倍的提升。

然而,我们现在知道,这种趋势是不能无限扩展的。2011年,德州大学奥斯汀分校的道格博格尔教授发表了一篇论文,提出并研究了所谓的“暗硅效应”。我的骨灰级老粉应该听过这个概念,因为我的第一期视频就讲了这个,大家可以去考古一下,链接在「阅读原文」中查看

那么什么是暗硅效应呢?它指的是虽然我们可以不断增加处理器核心的数量,但是由于能耗限制,我们却无法让这些计算核心同时工作。这就好像一幢大楼里有很多房间,但由于能耗限制,你无法同时开启每个房间的灯光,使得这幢大楼在夜里看起来有很多黑暗的部分。这就是暗硅这个词得名的原因。

暗硅效应的本质原因是,在后摩尔定律时代,晶体管的能效发展已经趋于停滞。这样,即使人们开发出了并行软件,并且不断增加了核心数量,所带来的性能提升也会非常有限。所以为了克服“暗硅效应”带来的问题,业界还需要在其他的方面带来更多进展,包括定制计算等等。道格博格尔之后也加入了微软,并且领导了微软的FPGA项目,这个就不多说了。

再回到OpenAI的大语言缩放定律,OpenAI万亿造芯的本质,其实就是奥特曼希望通过提供「无限的计算能力,带来全能的人工智能」,但现在OpenAI的这种暴力堆算力和数据的方法,或许并不是实现超级人工智能的可行途径。

再进一步,大模型究竟是人工智能的终点、还是人工智能发展过程中的一个重要节点,也是很多人一直在思考的问题。比如图灵奖得主、人工智能教父之一的LeCun就公开反对OpenAI的自回归生成模型的技术路线,并认为Sora「通过生成像素来模拟世界的行为,既浪费资源且注定会失败」

所以,生态部分我给OpenAI三星半。

AI的黄金时代

最后来看看运气。前面说随着芯片的缩放临近极限,迫使人们不得不去寻找更多更高效的芯片设计方法,这反而促进了芯片行业的发展。图灵奖得主John Hennessy和David Patterson也在此时提出了著名的论断,未来十年会是体系结构的黄金时代。至少现在我们可以看到,在这个黄金年代中,英伟达是最大的赢家,没有之一。

所以,当AI缩放定律走到尽头时,是否也会开启AI芯片的下一个黄金时代?从这个角度看,是不是OpenAI造芯的好日子还在后头?芯片是个长周期行业,从现在开始布局,少则两三年,多则五六年才能看到结果。运气方面OpenAI从来没输给过谁,它已经踩中了大模型这个超级大风口,而芯片,或许会成为OpenAI踩中的下一个风口。

所以,运气方面,我给OpenAI四星半。

以上就是我对OpenAI造芯未来的想法,不知道你是否同意?你觉得OpenAI会成为下一个英伟达吗?欢迎在评论区说说你的想法。感谢你一直看到这里,所以我给你准备了一个福利:我列了四个可能成为英伟达的公司,分别是AMD、谷歌、特斯拉、Tenstorrent,你希望我先讲谁?把你的选择写在评论区,我优先安排。

(注:本文不代表老石任职单位的观点。)

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
ATXMEGA384C3-MH 1 Microchip Technology Inc IC MCU 8BIT 384KB FLASH 64QFN
$8.79 查看
STM32F429VIT6 1 STMicroelectronics High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator, FSMC, TFT

ECAD模型

下载ECAD模型
$34.08 查看
MK70FN1M0VMJ15 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 1MB Flash, 150MHz, Graphics LCD, MAPBGA 256

ECAD模型

下载ECAD模型
$18.16 查看

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

微信公众号“老石谈芯”主理人,博士毕业于伦敦帝国理工大学电子工程系,现任某知名半导体公司高级FPGA研发工程师,从事基于FPGA的数据中心网络加速、网络功能虚拟化、高速有线网络通信等领域的研发和创新工作。曾经针对FPGA、高性能与可重构计算等技术在学术界顶级会议和期刊上发表过多篇研究论文。