作者 | 方文三
前言:降价带来的压力迫使生产者进一步压缩成本,提高效率,同时使产品能够更广泛地渗透市场。这一点在过去的网约车和电商价格战中已得到多次验证。
同样,在价格竞争的背景下,大型模型市场正在逐渐发生变化。市场对大型模型的关注点正从技术性能本身,转向人工智能应用的实际落地和商业变现。
大模型厂商价格战停不下来
在2024年的岁末,阿里云正式宣布其通义千问视觉理解模型的价格全面下调超过80%,这标志着通义千问在一年内实施的第三次降价。
此次降价幅度高达81.3%,创下了全网最低价。
根据新的定价,消费者仅需支付1元人民币,即可处理最多约600张分辨率为720P的图片,或1700张分辨率为480P的图片。
在阿里云宣布降价的十余天之前,字节跳动推出的豆包视觉理解模型的价格已较业界平均水平低出85%;
其千tokens输入价格仅为0.03元人民币,这意味着1元人民币可处理284张分辨率为720P的图片。
行业竞争以价格战的形式出现时,通常意味着行业内的企业已经处于激烈的竞争状态。
降价并非万能之策,但在大型模型的竞争中,任何一方都难以承受失败。
目前,大型模型主要向企业端(B端)收费,而向消费者端(C端)收费的情况较少,且消费者的付费意愿普遍不高,这决定了大部分消费者对价格战的感受并不显著。
在消费者端,许多大型模型应用程序采用的是[对话体]界面,即用户输入一段文字,大型模型提供相应的回复,使用体验类似于使用微信、QQ等应用程序与朋友聊天。
次回复背后都在调用大型模型,消费者无需为聊天服务付费,但提供聊天服务的机构却需要为此承担成本。
也就是说,API调用是一门亏损的生意,大型模型的成本越高,亏损就越大;大型模型降价,亏损就会相应减少。
大型模型的商业模式
①包含模型推理的基础服务,即根据输入的信息内容提供答案的过程。简而言之,这是[实际使用]模型的环节。不同供应商提供的模型标准各有差异。
②模型精调服务,厂商可根据客户需求,按照token使用量(训练文本乘以训练迭代次数)进行计费,训练完成后结算,实行按需付费。
③服务为模型部署,这相当于客户独享一部分计算资源,属于大客户范畴,其收费模式是根据消耗的计算资源或模型推理的token数量按量计费。
这三种收费模式反映了大型模型开发由浅入深的演进过程。
而各大科技公司激烈竞争的焦点,实际上是第一种基础服务,即标准版模型的推理费用。
在调用大型模型时,通常会根据输入和输出的token数量实施双向计费。
当前,科技企业逐渐认识到,单纯推出免费应用程序已不足以直接为公司创造收益,且难以有效增加消费者用户基数,获客成本显著上升。
更为关键的是,直接接触那些愿意为服务付费的商业客户,例如金融、政府、汽车等行业的企业。
然而,当众多企业纷纷涌入同一行业时,往往会导致长期的价格竞争。
这是因为各企业都试图建立一个示范客户,以利于后续的市场扩张。
将加速大模型应用生态发展与智算云增长点
技术的普及将推动应用领域的创新成本降低。
随着大模型推理成本的降低,基于大模型开发应用的创新成本也将随之降低,可能会迎来新应用开发和新场景试错的高潮期。
数据显示,百万tokens大约相当于70万个英文单词或50万个汉字,按照当前大模型API调用价格计算,1元可以购买超过100万个汉字。
对于中小企业而言,部署并应用针对本企业的大型模型应用的成本降低,可能会激发企业开发应用的意愿。
可以预见,随着大模型应用开发成本的不断降低,将加速出现爆款超级应用,推动大模型应用生态的加速繁荣。
从长期来看,这将进一步催生智算云的新增长点。
据Gartner的研究显示,随着价格的持续下降以及云服务在敏捷性、创新速度和生态系统构建方面的优势,中国企业的人工智能部署将逐渐从本地环境转向云端。
Gartner预测,到2027年,中国所有AI推理工作负载中,基于云的负载比例将从先前的20%增长至80%。
Gartner高级研究总监方琦指出:[多家中国生成式人工智能(GenAI)供应商已将大语言模型应用编程接口(API)的推理成本降低超过90%,这极大地促进了企业对GenAI技术的采纳。]
2025年国内大型模型的竞争将持续激烈
从[百模大战]演进至当前的[应用之战],市场愈发期待在模型中孕育出能够实际应用的成果,以此为大型模型的生产商创造收益,并为各行各业提升工作效率。
相较于OpenAI的同规格模型,国内模型的价格普遍较低,仅为后者的20%-50%。尽管大模型的价格竞争已导致负毛利,但各大云服务提供商仍持续下调价格。
据国际市场调研机构IDC预测,2022年至2027年,中国通用算力的年复合增长率为16.6%,而智能算力的年复合增长率将达到33.9%。
在智能算力领域内部,推理算力的占比预计将在2027年上升至72.6%,而训练算力的占比则会降至27.4%。
国企业缺乏与OpenAI相似的算力资源和融资环境,算力成为中国模型制造商的关键短板。
过去一年多,中国云服务提供商为采购英伟达的AI芯片支付了超过1.5倍的采购成本,这导致了模型算力成本的居高不下。
这不仅影响了大模型的性能上限,也阻碍了大模型的产业化进程。
在这种背景下,不得不放弃收费模式,通过降价甚至免费的方式,通过用户[免费试用]来探索商业落地的场景。
据了解,几家大模型制造商都提供了不同程度的注册免费额度,例如智谱AI宣布为新注册的开放平台用户赠送2500万tokens。
据IDC预测,到2026年,中国AI大型模型市场的规模有望达到211亿美元,届时人工智能将进入大规模应用的关键时期。
激烈的价格战可能会导致一些企业主动或被动地退出市场,待市场稳定后,价格才会回归正常水平。
大模型的市场推广战,与移动互联网初期应用争夺用户的烧钱推广策略极为相似,各应用通过大量资金投入甚至直接补贴来吸引用户。
然而,动辄上亿的广告成本未必能确保用户长期的消费意愿,用户留存仍是大模型厂商面临的不确定因素。
在长期的价格战中技术成本成为竞争的关键
简而言之,在提供相同的解决方案和报价的情况下,技术成本较低的企业将承受较少的亏损,并能更长久地生存。
目前,国内主要的大模型制造商在这些方面基本处于同一水平,并且他们的迭代速度和相互追赶的节奏也相差无几。
价格是影响大模型企业的一个因素,但更为关键的是技术能力。
国内的阿里、昆仑万维等企业也推出了类似o1模型的产品,尽管存在差距,但这也表明他们认同这一发展趋势。
根据GPT系列的发展节奏,预计所有厂商将在2025年上半年全面跟进o系列的步伐,此后,当前的技术将逐渐退出市场。
因此,对于大模型制造商而言,与其坐等被市场淘汰,不如在淘汰到来之前,让技术迭代发挥更大的作用。
结尾:
在短期内,大型模型的性能似乎遭遇了发展瓶颈,各竞争者之间难以显著拉开差距,亦难以推出决定性的突破技术。
然而,从另一角度来看,大型模型的价格下降对用户而言是一个积极的信号,因为这将使他们能够以更低的成本接触并利用先进的AI技术,从而促进市场上优秀AI应用的涌现。
尽管如此,整个行业距离形成成熟的商业生态系统仍有相当长的路要走。
部分资料参考:
FT中文网:《大模型的2025:卷价格,更要卷应用》,APPSO:《中国大模型价格战:大厂杀疯了,李开复王小川不跟风,最先被卷死的是谁》,科创板日报:《大模型降价潮再起》,财经杂志商业评论:《大模型价格战,打到了负毛利》,数字经济杂志:《人工智能大模型[价格战]的原因及影响分析》,中外管理传媒:《为何OpenAI在涨价,国产大模型却陷入价格战?》,惊蛰研究所:《大模型2024:先把价格打下去》,吴晓波频道:《AI大模型价格战开打,一年决胜负?》,豹变:《大模型[自杀式降价],大厂为抢生意开打价格战》,科技新知:《[卷王]豆包上桌,压力给到了谁?》