杀死AI算力时代“灰犀牛”，世界需要“第二选择”

2023年，百模大战一触即发！继区块链、元宇宙等新名词后，大模型成为行业大佬竞相抓住的下一个风口。根据9月份高通发布的《混合AI是AI的未来》显示，国内已发布79个10亿参数规模以上的大模型。国外除了Chat-GPT，马斯克最近也推出首款大模型产品——Grok，以“喜爱讽刺”的傲娇性格获得不少用户喜爱。

生成式AI正在加速奔跑，渗透进千行百业，但万丈高楼平地起从来不是神话，正如地基之于高楼大厦，“大”模型的发展也离不开“大”算力。但是算力的供应出现了太多的不确定性。

近期，因算力需求旺盛、供给紧张，有媒体报道，阿里云算力租赁供应捉襟见肘，其A100服务器已宣布暂停对外出租。而就在10月，美政府将禁止英伟达 AI芯片对中国销售。

面临突然的算力断租、断供，企业呼唤稳定、可持续的算力底座，谁能助力互联网企业和大模型公司，拥抱未来十年的大模型黄金时代？我们有没有更优的选择？

算力产品面临断供，最受影响的是互联网厂商与大模型公司

算力作为大模型时代的核心驱动力，直接决定着大模型的迭代与创新速度，算力的稀缺性已成为制约大模型发展的瓶颈所在。

今年10月，美国商务部对英伟达运往40个国家的芯片提出额外许可要求，以避免转售给中国，生效日期也从11月16日提前至10月23日，国内阿里、字节、百度等大厂均受到牵连，英伟达在国内的50亿美元订单化为泡影。

从阿里云和英伟达相继传出的消息可以看到，美国对中国科技界的打压正在逐渐加码、愈演愈烈。大家更为关心的是，该事件将给行业带来哪些影响？

一方面，断供会产生巨大的服务器和GPU缺口。根据浙商证券数据显示，国内15家头部大模型厂商对标GPT-3模型的训练需求，需要1920台A100/A800服务器，对应15360张GPU。如果考虑国内5家头部大模型厂商对标GPT-4模型的训练需求，则额外需要13705台A100/A800服务器，对应近11万张GPU。

另一方面，互联网公司最为“受伤”。当移动互联网时代远去，互联网企业日渐式微。百度、腾讯、阿里等互联网领域佼佼者本想借着大模型春风直上青云，却迎来“釜底抽薪”的困境。根据清科集团发布的《2023年上半年中国股权投资市场研究报告》显示，上半年国内互联网领域投资案例数与投资金额双双下滑，均已跌出热门投资行业前五位。

面对大模型带来的时代性机遇和AI算力产品服务断供的“峡谷地带”，许多互联网厂商选择了“能租就不买”策略，这使得算力租赁成了一门好生意。

以通信网络解决方案和服务商中贝通信为例，其以H800设备为基础搭建算力服务平台，服务费从9月份的12万元/P/年涨到10月份的17.9万元/P/年。仅一个月时间，涨幅达到50%。

但算力租赁只是一个短期买卖，不能解决本质问题，那该怎么办？因此，算力产品国产化替代从部分企业不愿意为之的“可选项”变为每个企业学会取舍的“必选项”。选择可靠伙伴做同路人，唯有如此，互联网企业才能“杀出峡谷”，拥抱大模型发展的黄金十年。

盘点互联网大厂近两年动作，在AI算力方面能顶上来的不多。据《45家国产AI芯片厂商调研分析报告》显示，阿里倚天710是CPU，用于逻辑计算，而非AI推理训练；百度昆仑芯2代被应用于文心一言大模型推理端，训练端使用的是英伟达V100和A100；有些芯片训练算力不到100TFLOPS，不足以支持训练大模型；腾讯紫霄定位中低端，用于AI推理。

不过笔者关注到，嗅觉灵敏的百度已于今年8月份下订单，向华为订购AI芯片，作为英伟达A100芯片的替代品。除此之外，中贝通信、恒为科技等算力运营商也已经与华为达成相关合作。

与此同时，我们看到大量互联网厂商并非自建算力基础设施，而是通过向云服务厂商购买云AI算力，来降低获取大量算力的成本和门槛。在该领域，提供昇腾AI算力服务的华为云，同样给了广大互联网厂商新选择，据了解，很多大模型公司也开始与华为云展开洽谈与合作。华为确实正成为国内继英伟达之后的“第二选择”。

迎战大模型时代，中国企业需要“抱团前行”

今年科大讯飞也重磅投入大模型研发，并在8月联手华为发布星火一体机，其董事长刘庆峰就表示，大模型在各个行业深度应用，最关键要具备三大要素。其中首个要素就是安全可控，内容要安全，算力要安全，要把未来发展构建在完全自主可控的平台上。“国外的算力现在不见得能买得到，就算买到训练完以后，安全性也很难得到保障。”刘庆峰如此说。

熟悉华为的朋友知道，迎战大模型时代，华为给自己的定位是“百花园”的黑土地，即通过算力底座、AI平台、开发工具，支持大模型在智能化时代的“百花齐放”。

区别于其他云服务商，华为基于自身的“厚”积累，走出特色之路。一方面，面向计算，华为以硬件交付为主、提供算力业务。另一方面，面向客户，华为云以软件交付为主、提供服务业务。

我们来盘一盘华为云在算力服务方面的“技能点”。首先，华为云在贵安、乌兰察布、芜湖打造了3大AI云算力中心，为企业提供澎湃昇腾AI算力，企业和开发者无需自建AI数据中心，即可直接使用业界主流的开源大模型，让企业不再需要高价抢购“电子黄金”——GPU，无惧GPU断供挑战。

此外，华为云还推出昇腾AI云服务，提供算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts，为大模型应用开发、运行提供最佳算力服务。

王沉森在《天才为何成群而来》中写道：研究工作是没有地图的旅程，是孤独旅行者在未知的地方摸索。

当下AI算力的断供、断租，让华为“孤独的研究工作”迎来一轮收获期。

笔者观察：警惕AI算力这头“灰犀牛”

米歇尔·渥克在《灰犀牛》一书中，将未来的潜在危机比喻为灰犀牛，因为灰犀牛虽体型庞大却常常被人忽视。对于企业来说更是如此，将算力服务的供应链寄希望于美国，无异于将高楼大厦的地基打在沙子上，企业长远发展愿景也将随着沙子的沉降作用而坍塌。

在灰犀牛的身上，我们也能看到“危机时刻，正是改变之机”，与其等别人随意卡脖子，拿走降落伞无处落地，不如自己造降落伞。

解难题，做难事，行稳致远。华为Mate60系列今年一鸣惊人，依靠创新能力，无惧险阻，一路奔腾，在终端领域做到消费者心目中的遥遥领先，让无数人喊出“轻舟已过万重山”。

华为云则如云计算领域的“Mate60系列”，从基础软件GaussDB，到盘古大模型，再到新一代工业软件体系，华为云持续技术创新解难题，构筑起业界领先地位，给了企业一个稳定的、可持续演进的选择，助力企业征战大模型的黄金时代。

我们很开心有这样的选择，我们也很庆幸有这样的选择。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
STM32F207IGH6TR	1	STMicroelectronics	High-performance Arm Cortex-M3 MCU with 1 Mbyte of Flash memory, 120 MHz CPU, ART Accelerator, Ethernet	ECAD模型下载ECAD模型	$69.82	查看
TMS320F28335PGFA	1	Texas Instruments	C2000™ 32-bit MCU with 150 MIPS, FPU, 512 KB flash, EMIF, 12b ADC 176-LQFP -40 to 85	ECAD模型下载ECAD模型	$29.61	查看
STM32F030C8T6	1	STMicroelectronics	Mainstream Arm Cortex-M0 Value line MCU with 64 Kbytes of Flash memory, 48 MHz CPU	ECAD模型下载ECAD模型	$3.22	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

STM32F207IGH6TR

STMicroelectronics

High-performance Arm Cortex-M3 MCU with 1 Mbyte of Flash memory, 120 MHz CPU, ART Accelerator, Ethernet