作者:鹏程
随着聊天机器人和其他生成式AI应用程序变得越来越流行,人们对AI推理的需求将呈指数级增长,该市场规模最终将达到数百亿美元。AI芯片需求快速增长,市场规模增长显著。
从谷歌的TPU、苹果的M1和M2、微软Maia 100和Cobalt 100、Meta的MTIA、亚马逊的Trainium和Inferentia、特斯拉的Dojo,到英特尔的FPGA系列、AMD的MI300系列……
巨头们一次次冲击着英伟达的帝国围墙。而在AI竞速的大时代里,涌现了一大批初创GPU、AI芯片公司,这些从业者和科技厂商们无不在找寻突破口。全球初创企业如今正试图证明它们可以在某些应用领域提供比行业巨头英伟达更好的芯片解决方案。
虽然英伟达的GPU继续主导人工智能(AI)领域,但AI初创企业认为,GPU的高能耗和庞大的设计留下了市场空隙,供新兴企业填补,希望分享AI技术繁荣带来的利益。
01、AI芯片技术层出不穷,初创公司大量涌现
AI芯片也被称为AI加速器或计算卡,从广义上讲只要能够运行人工智能算法的芯片都叫作AI芯片。但是通常意义上的 AI 芯片指的是针对人工智能算法做了特殊加速设计的芯片。按技术架构分类,AI芯片可分为CPU、GPU、FPGA、ASIC、神经拟态芯片等。
CPU不适用于AI计算,但是在AI应用领域也是必不可少,比较常见的是CPU+GPU,CPU+NPU等组合。GPU是一种通用型芯片,ASIC是一种专用型芯片,而FPGA则处于两者之间,具有半定制化的特点。
CPU:CPU是冯诺依曼架构下的处理器,在执行计算任务过程中,数据需要先获取并存入RAM,然后解码获得指令,然后在ALU计算模块计算,最终将计算结果返回RAM。整个流程更强调控制和决策,在并行计算效率上有较大提升空间。
GPU:GPU最早用于图像处理领域,减少了大量数据预取和决策模块,增加了计算单元ALU的占比,从而在并行化计算效率上有较大优势。
FPGA:FPGA的设计使得计算逻辑十分灵活,它不像CPU和GPU那样只能执行编译和汇编的内容,FPGA因为几乎没有控制模块,所有模块都是ALU计算模块,而且所有模块都可定制开发。但这也是FPGA的主要缺陷,因为具备很强的灵活度,导致设计难度和复杂度较高。
ASIC:ASIC是专门针对某一领域设计的芯片,比如神经网络计算芯片NPU、Tensor计算芯片TPU等。因为是针对特定领域定制,所以ASIC往往可以表现出比GPU和CPU更强的性能,ASIC也是目前国内外许多AI芯片设计公司主要研究的方向,可以预见未来市面上会逐渐有大量AI领域的ASIC芯片出现。
神经拟态芯片:神经拟态计算是模拟生物神经网络的计算机制。神经拟态计算从结构层面去逼近大脑,其研究工作还可进一步分为两个层次,一是神经网络层面,与之相应的是神经拟态架构和处理器。其逻辑结构与传统冯·诺依曼结构不同:它的内存、CPU 和通信部件完全集成在一起,因此信息的处理在本地进行,克服了传统计算机内存与 CPU 之间的速度瓶颈问题。
按功能分类,可分为训练(training)和推理(inference)两个环节,对应的AI芯片则分别是训练卡和推理卡。训练卡一般都可以作为推理卡使用,而推理卡努努力不在乎时间成本的情况下大部分也能作为训练卡使用,但通常不这么做。主要原因在于二者在架构上就有很大的差别,推理芯片通常针对前向传播过程进行了高度优化,以实现高效的预测和分类任务。因此,它们的架构和指令集对于训练过程所需的大量参数更新和反向传播操作支持能力就弱了很多。此外,训练芯片通常拥有更高的计算能力和内存带宽,以支持训练过程中的大量计算和数据处理。
相比之下,推理芯片通常会在计算资源和内存带宽方面受到一定的限制。同时,二者支持的计算精度也通常不同,训练阶段需要高精度计算,因此常用高精度浮点数如:fp32,而推理阶段一般只需要int8就可以保证推理精度。
除了高带宽高并行度外,就片内片外的存储空间而言训练芯片通常比较“大”,这是训练过程中通常需要大量的内存来存储训练数据、中间计算结果以及模型参数。相较而言推理芯片可能无法提供足够的存储容量来支持训练过程。AI浪潮席卷全球,一批AI初创新贵企业如雨后春笋般出现,新技术新产品层出不穷。
近期,斯坦福大学的一份《2024年人工智能指数报告》中的数据,展示了过去十年间AI初创公司活动最多的15个国家。数据表明,美国、中国、英国、以色列等已成为全球AI创新领域的领先者。美国情况来看,美国AI初创企业涵盖大模型公司Reka AI、DPU新贵DreamBig Semiconductor、规模化人工智能、自动化机器学习平台DataRobot、AI芯片设计新企Tenstorrent、软件和机器人初创企业Bright Machines、AI芯片创企Etched.ai、训练AI模型新贵Scale AI、边缘AI领军企业Blaize、人工智能模型创企Augment、AI协助工具新企Cognition、硅光子创新企业Celestial AI、大模型开源企业Together AI等等。
中国方面在政策利好和市场急速发展下,一批AI创企杀出重围,优质标的包括大模型玩家商汤科技、百川智能、智谱AI、第四范式、Minimax稀宇科技等等,以及人工智能AIGC大模型零一万物、通用人工智能研究月之暗面、多模态大模型企业智子引擎、视频生产大模型爱诗科技、AI芯片新贵爱芯元智、人工智能视觉技术企业影谱科技等等。英国在AI领域有着悠久的历史,几十年来围绕这个领域建立了丰富的生态系统。从艾伦·图灵早期奠定AI领域基础的工作,到世界级的研究机构推动AI技术的发展(如帝国理工学院、剑桥大学、爱丁堡大学、牛津大学、伦敦大学学院)以及2015年DeepMind的成立,英国一直是AI人才的重要聚集地。
深厚的AI研究历史和顶尖的研究机构使得英国成为AI人才重要聚集地。近年来,英国涌现了包括AI独角兽Wayve、知识图谱初创企业Oxford Semantic、AI语音客户服务企业PolyAI、AI智能员工和软件创企Artisan AI、大模型应用创企Robin AI等。
以色列高科技行业发达,AI初创企业包括有人工智能工具企业AI21、人工智能芯片明星企业Habana Labs、量子芯片企业Quantum、高性能微处理器公司NeoLogic、深度学习和人工智能解决方案架构颠覆企业NeuReality、AI芯片冷却革命者ZutaCore等等。
02、行业巨头大规模收购AI芯片初创公司
过去两年,AI初创公司在资本市场上的表现可谓风头无两,吸引了数十亿美元的投资。然而,随着市场对AI技术的怀疑情绪日益增长,加之生成式AI技术的高成本和长周期回报特性,在迈过前两年的投资高峰热潮后,AI新贵如今面临新的融资危机。
就美国而言,过去一年,美国AI初创企业失败率跃升了60%,尽管数十亿美元的风险投资流入AI公司,但初创企业倒闭的数量仍在急剧上升,原因是相关AI企业创始人在2021-2022年科技繁荣时期筹集的资金近年来已经耗费大半。不止美国企业如此,全球AI新贵无疑都面临着同样困境。行业金融投资相关人士表示,短期大量资金涌入导致某些AI初创公司的估值过高,但是这些企业都面临着巨大的风险,如资金枯竭、投资回报率下降或市场饱和等。
目前,市场投资者已经变得更加谨慎,开始评估AI初创公司的长期可行性和盈利能力,而不是仅仅基于其技术潜力进行投资。与此同时,AI头部企业虎视眈眈,意图吞下更多优质AI标的,快速补充短板,以占领更大市场份额。一场AI芯片并购战,在AI新贵和头部AI大企中悄然拉开。许多初创公司发现自己难以为继,其中不少被迫选择“卖身”求生。头部企业通过收购AI初创公司,快速拓展产品线,布局新的技术和业务,还消灭了潜在的竞争对手。AI芯片巨头企业并购案正在爆发。
英伟达:英国咨询机构 Dealroom曾对英伟达2023年间的一级市场交易进行了统计,仅2023年英伟达就投资了超30家AI初创公司,融资总价值超过50亿美元。投资过程中,英伟达似乎没有排斥任何应用场景,亦不在乎标的的轮次与大小。无论是上游的通用大模型,中游的企业SaaS,下游的To C垂直应用,还是大模型基础设施建设中动辄百亿的B、C轮项目,To C端不到百万的种子轮。而今年以来,英伟达投资的AI企业更是超17家,其中有两笔投资所在轮次融资金额不低于10亿美元。收购方面,英伟达则陆续收购了AI创企Run.ai、Deci。
AMD:过去一年时间里,AMD向十几家AI公司投资了超过1.25亿美元,其中包括Firework AI、AI数据平台Scale AI等,另外还收购了Mipsology 、 Nod.ai等超7家AI公司,以扩展AMD AI生态系统、支持合作伙伴,并提升AMD计算平台的领导地位。近期该公司就有两笔大手笔并购——49亿美元收购服务器制造商ZT Systems,以及6.65亿美元全现金收购欧洲最大的私人AI实验室Silo AI。不过AI巨头的并购也非一帆风顺,特别是跨国并购面临着各国巨大的反垄断压力。比如,英伟达曾尝试以400亿美元的巨额收购Arm,但由于全球监管机构的反对和市场担忧,这笔交易最终以失败告终。
03、AI芯片初创公司前路如何?
当下,AI初创公司面临的主要困境在于,生成式AI的研发和维护需要数亿美元的前期投资,而这些投资往往在短期内难以获得回报。许多初创公司发现,他们根本没有足够的资源和渠道来实现这一目标。
目前来看,投资者对于初创公司的耐心也在减少,越来越多投资者退出这场AI游戏,导致一些初创公司不得不寻找新的融资渠道和合作伙伴。比如一些AI芯片公司正在寻求IPO上市。而就在日前,AI芯片独角兽燧原科技同中金公司签署辅导协议,正式启动IPO进程。
此前,燧原科技已经完成了近70亿元的融资,其中腾讯是最大的投资者之一,天眼查数据显示,腾讯持股比例为20.4944%。值得注意的是,自燧原科技成立以来,腾讯已经在公司的六轮融资中都有投资。通过IPO,企业可以向公众发行股票融资,提供可观的资金来源,有助于企业扩大规模、增加投资,维持企业运转。
此外,一些AI芯片公司正在寻求合并,以应对行业巨头的巨大压力。目前各国都意识到了AI芯片的重要性,AI芯片巨头在跨国并购上收到了极大的限制。为了扶持本国企业,各国政府一方面通过政策和资金扶持萌芽的AI芯片企业。另一方面,也在推动这些公司之间的整合合并。日前,韩国国内两家人工智能(AI)芯片制造商Sapeon Korea和Rebellions签署了正式合并协议。
合并后的新公司的价值预计将超过1万亿韩元(合7.438亿美元),将成为代表韩国人工智能芯片产业的独角兽企业,并将在全球市场上具有更强的竞争力,最终能够与英伟达、AMD等巨头相抗衡。随着AI技术的发展与普及,行业对高性能、低功耗的AI芯片的需求不断增加,全球半导体企业将继续在该领域展开激烈角逐。