2023年,百模大战一触即发!继区块链、元宇宙等新名词后,大模型成为行业大佬竞相抓住的下一个风口。根据9月份高通发布的《混合AI是AI的未来》显示,国内已发布79个10亿参数规模以上的大模型。国外除了Chat-GPT,马斯克最近也推出首款大模型产品——Grok,以“喜爱讽刺”的傲娇性格获得不少用户喜爱。
生成式AI正在加速奔跑,渗透进千行百业,但万丈高楼平地起从来不是神话,正如地基之于高楼大厦,“大”模型的发展也离不开“大”算力。但是算力的供应出现了太多的不确定性。
近期,因算力需求旺盛、供给紧张,有媒体报道,阿里云算力租赁供应捉襟见肘,其A100服务器已宣布暂停对外出租。而就在10月,美政府将禁止英伟达AI芯片对中国销售。
面临突然的算力断租、断供,企业呼唤稳定、可持续的算力底座,谁能助力互联网企业和大模型公司,拥抱未来十年的大模型黄金时代?我们有没有更优的选择?
算力产品面临断供,最受影响的是互联网厂商与大模型公司
算力作为大模型时代的核心驱动力,直接决定着大模型的迭代与创新速度,算力的稀缺性已成为制约大模型发展的瓶颈所在。
今年10月,美国商务部对英伟达运往40个国家的芯片提出额外许可要求,以避免转售给中国,生效日期也从11月16日提前至10月23日,国内阿里、字节、百度等大厂均受到牵连,英伟达在国内的50亿美元订单化为泡影。
从阿里云和英伟达相继传出的消息可以看到,美国对中国科技界的打压正在逐渐加码、愈演愈烈。大家更为关心的是,该事件将给行业带来哪些影响?
一方面,断供会产生巨大的服务器和GPU缺口。根据浙商证券数据显示,国内15家头部大模型厂商对标GPT-3模型的训练需求,需要1920台A100/A800服务器,对应15360张GPU。如果考虑国内5家头部大模型厂商对标GPT-4模型的训练需求,则额外需要13705台A100/A800服务器,对应近11万张GPU。
另一方面,互联网公司最为“受伤”。当移动互联网时代远去,互联网企业日渐式微。百度、腾讯、阿里等互联网领域佼佼者本想借着大模型春风直上青云,却迎来“釜底抽薪”的困境。根据清科集团发布的《2023年上半年中国股权投资市场研究报告》显示,上半年国内互联网领域投资案例数与投资金额双双下滑,均已跌出热门投资行业前五位。
面对大模型带来的时代性机遇和AI算力产品服务断供的“峡谷地带”,许多互联网厂商选择了“能租就不买”策略,这使得算力租赁成了一门好生意。
以通信网络解决方案和服务商中贝通信为例,其以H800设备为基础搭建算力服务平台,服务费从9月份的12万元/P/年涨到10月份的17.9万元/P/年。仅一个月时间,涨幅达到50%。
但算力租赁只是一个短期买卖,不能解决本质问题,那该怎么办?因此,算力产品国产化替代从部分企业不愿意为之的“可选项”变为每个企业学会取舍的“必选项”。选择可靠伙伴做同路人,唯有如此,互联网企业才能“杀出峡谷”,拥抱大模型发展的黄金十年。
盘点互联网大厂近两年动作,在AI算力方面能顶上来的不多。据《45家国产AI芯片厂商调研分析报告》显示,阿里倚天710是CPU,用于逻辑计算,而非AI推理训练;百度昆仑芯2代被应用于文心一言大模型推理端,训练端使用的是英伟达V100和A100;有些芯片训练算力不到100TFLOPS,不足以支持训练大模型;腾讯紫霄定位中低端,用于AI推理。
不过笔者关注到,嗅觉灵敏的百度已于今年8月份下订单,向华为订购AI芯片,作为英伟达A100芯片的替代品。除此之外,中贝通信、恒为科技等算力运营商也已经与华为达成相关合作。
与此同时,我们看到大量互联网厂商并非自建算力基础设施,而是通过向云服务厂商购买云AI算力,来降低获取大量算力的成本和门槛。在该领域,提供昇腾AI算力服务的华为云,同样给了广大互联网厂商新选择,据了解,很多大模型公司也开始与华为云展开洽谈与合作。华为确实正成为国内继英伟达之后的“第二选择”。
迎战大模型时代,中国企业需要“抱团前行”
今年科大讯飞也重磅投入大模型研发,并在8月联手华为发布星火一体机,其董事长刘庆峰就表示,大模型在各个行业深度应用,最关键要具备三大要素。其中首个要素就是安全可控,内容要安全,算力要安全,要把未来发展构建在完全自主可控的平台上。“国外的算力现在不见得能买得到,就算买到训练完以后,安全性也很难得到保障。”刘庆峰如此说。
熟悉华为的朋友知道,迎战大模型时代,华为给自己的定位是“百花园”的黑土地,即通过算力底座、AI平台、开发工具,支持大模型在智能化时代的“百花齐放”。
区别于其他云服务商,华为基于自身的“厚”积累,走出特色之路。一方面,面向计算,华为以硬件交付为主、提供算力业务。另一方面,面向客户,华为云以软件交付为主、提供服务业务。
我们来盘一盘华为云在算力服务方面的“技能点”。首先,华为云在贵安、乌兰察布、芜湖打造了3大AI云算力中心,为企业提供澎湃昇腾AI算力,企业和开发者无需自建AI数据中心,即可直接使用业界主流的开源大模型,让企业不再需要高价抢购“电子黄金”——GPU,无惧GPU断供挑战。
此外,华为云还推出昇腾AI云服务,提供算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts,为大模型应用开发、运行提供最佳算力服务。
王沉森在《天才为何成群而来》中写道:研究工作是没有地图的旅程,是孤独旅行者在未知的地方摸索。
当下AI算力的断供、断租,让华为“孤独的研究工作”迎来一轮收获期。
笔者观察:警惕AI算力这头“灰犀牛”
米歇尔·渥克在《灰犀牛》一书中,将未来的潜在危机比喻为灰犀牛,因为灰犀牛虽体型庞大却常常被人忽视。对于企业来说更是如此,将算力服务的供应链寄希望于美国,无异于将高楼大厦的地基打在沙子上,企业长远发展愿景也将随着沙子的沉降作用而坍塌。
在灰犀牛的身上,我们也能看到“危机时刻,正是改变之机”,与其等别人随意卡脖子,拿走降落伞无处落地,不如自己造降落伞。
解难题,做难事,行稳致远。华为Mate60系列今年一鸣惊人,依靠创新能力,无惧险阻,一路奔腾,在终端领域做到消费者心目中的遥遥领先,让无数人喊出“轻舟已过万重山”。
华为云则如云计算领域的“Mate60系列”,从基础软件GaussDB,到盘古大模型,再到新一代工业软件体系,华为云持续技术创新解难题,构筑起业界领先地位,给了企业一个稳定的、可持续演进的选择,助力企业征战大模型的黄金时代。
我们很开心有这样的选择,我们也很庆幸有这样的选择。