Twitter上有人对比了ChatGPT、instagram、spotify、Facebook、netflix、twitter,收获百万、1亿用户所花的时间,其中,ChatGPT以火箭蹿升之姿光速登顶,业内人士评论“Something different is happening”、“它不是一个新产品、而是一个新物种”。
科技界这种盛况并不多见,上一次还是iPhone问世?ChatGPT霸屏的这段时间,相关概念股群魔乱舞,创业公司争做“中国版的Open AI”……一个核心的问题浮出水面:ChatGPT会不会固化AI产业格局,强者恒强?如果这是一场巨头的游戏,国内的中小企业该怎么玩?
会否加剧“强者恒强”的两极局面?
从硅谷到中国,ChatGPT的热度有增无减,但主要玩家都是巨头。目前国内有能力竞逐的也都是行业翘楚:百度文心一言、腾讯HunYuan-NLP 1T大模型、阿里“通义”大模型、华为盘古大模型、中科院自动化研究所“紫东·太初”等。当AI阔步进入大模型时代,走在前列的巨头会不会把追逐者远远甩开?
曾任华为系NLP企业首席科学家、现任千芯科技董事长陈巍认为,可以从企业和国家整体产业两个层面来看。
目前ChatGPT这类大模型领域确实有一定的马太效应,跑在前面的企业玩家具备完整的算法、数据和算力优势,后发者想要追赶确实有较大难度。但是对企业来说,未必就是强者恒强。例如OpenAI在ChatGPT这类问答型NLP算法曾一度落后于Google BERT,但现在又开始重新领跑。这其中少数研发人员的智慧、天赋,以及破釜沉舟般的专注,实际上是决定胜负的关键。
“而资金或者攒局恐怕无法代替技术,比如微软自己做小冰,最后也要让位于ChatGPT”, 陈巍谈到,“如果国内的技术偏执狂人能够领悟或训练出更高水平的模型,在算法或训练方法上形成降维打击,超越OpenAI也不是不可能。”
再从各国产业发展而言,由于AI领先的国家确实具备了系统化且领先的AI技术人群和丰富的算力基础(大算力芯片),已经在教育-研究-产品-需求上形成完整闭环,一旦在ChatGPT这类大模型上拉开差距,很可能形成两极分化的国力竞争格局,甚至形成“强者恒强”的局面。
面对ChatGPT冲击波,中小企业的机会在哪里?
近期不少人给ChatGPT算经济账,国盛证券以英伟达A100芯片、DGXA100服务器、现阶段每日2500万访问量等假设为基础,估算得出:在初始算力投入上,为满足ChatGPT当前千万级用户的咨询量,投入成本约为8亿美元,对应约4000台服务器。
反观国内AI中小企业,他们既撑不起全栈式的AI研发,也无力为高昂的算力买单。那么在大模型快速发展、走向商用的过程中,他们的发展机会主要有哪些?如果只能接入巨头的生态求生存,会不会产生同质化竞争?
陈巍表示,对于做NLP算法的中小创业企业来说,初期确实可能会遇到比较大的打击。因为ChatGPT这类应用,把这些公司之前的积累基本拉平到同一档位上,甚至可能早期的一些投入基本打水漂了。
不过,中小企业有自身的灵活优势,船小好掉头,可以基于ChatGPT这类应用,针对细分垂域做专用的领域模型(例如做ChatGPT+领域模型的混合模型)。而对于巨头来说,由于细分领域众多,即便分散兵力、撒胡椒面也未必划算。他强调,ChatGPT是通识智能、千人一面,目前并不具有个性特征、情感和某些特定领域专家知识,国内的中小NLP企业反而可以充分借助ChatGPT带来的通识和多轮对话能力提升来拓展更多客户。
“国内中小企业说不定能诞生有高超天赋的NLP人才,未必不能打造出类似当年TMD(今日头条、美团、滴滴)在BAT(百度、阿里、腾讯)之后成为新巨头的故事。因为巨头内部有严格的季度ROI考核,对于ChatGPT这类需要多年冷板凳的研发项目不是太友好,顶尖项目在巨头内部发展未必好”,陈巍从研发方面指出了中小企业的可能性。
其次,对于做NLP应用的中小创业企业来说,他们往往侧重于场景、模型研发少,ChatGPT这类产品会在一定程度上加剧同质化竞争。但接入ChatGPT,也会让这些企业更好地提升服务获得更多客户。特别是那些有深厚行业积累、充分理解行业的NLP应用企业,反而会进一步受益。就好比淘宝最初把中小商家和大商家放到同一个平台上,开始的时候竞价激烈,但后来大家发现平台大了,客户圈也大了,反而扩展到省外甚至国外。
2年后有望追上ChatGPT现有水平?
以ChatGPT为代表的AIGC应用,离不开大数据、大算力、大模型的训练结果。当我们面对这股龙卷风般的潮流席卷时,首先要看清自身的水平和现实差距。
陈巍指出,首先数据方面,国内的高质量语料较少,大部分能用的语料标记质量恐怕达不到ChatGPT的训练要求。就拿OpenAI来说,是雇用了约40多个全职的标记员,按照特定的要求来标记语料,而不是直接找数据公司买通用的标记数据。推测这个标记方法应该与其训练策略密切相关,可能有一定的保密要求,是完全私有的数据集。因此,国内企业首先要补上私有数据集这个短板、以及数据集的标记策略,而这可能都是大量烧钱训练之后学到的经验。
再说模型本身。以ChatGPT为例,基本上国内大部分开发者都是从开源的GPT-2开始起步,大部分企业恐怕要经过大量的盲人摸象般的训练才能进阶到GPT-3的水平,然后再继续训练到GPT-3.5和ChatGPT。假如按理想的情况:准备数据和摸索训练方法用半年,GPT-2到GPT-3用半年,依此类推,大概也需要2年时间才能追上ChatGPT现有的速度。而这还是项目进展顺利、没有被公司砍掉的情况下。而2年后,国外可能已经进阶到GPT-5或者GPT-6的水平了。
最后是大算力芯片,这才是对国内开发者最头大的事情。大模型训练规模的现实摆在那里,即便使用GPU,也要消耗巨大的成本。“现在看GPU训练大模型,有点像早期的深度学习研发人员看CPU训练AlexNet这些早期的深度学习模型,训练成本很高,速度又慢,这是大模型训练未来需要努力改进的方向”,陈巍表示。
综合来看当前的三方面短板,数据和模型方面,可以通过大量资金投入和研发人员的努力来补上;但大算力芯片方面,则需要半导体和相关产业链的整体提升,这点并不容易且是一个长期的过程,可能会成为国内赶超的重中之重。
写在最后
一个朋友感慨:“我对AI的印象还停留在人工智障阶段,怎么突然就成了再进宫的甄嬛——不可同日而语了?”
ChatGPT的横空出世,让AI再度引发轰动。随着国内AI大模型的发展,使用成本的降低,AI将通过各种NLP或AIGC应用进入每个人的生活,甚至成为普通人的伙伴、助手或老师。ChatGPT这类大模型技术,还可以与机器人或传统的制药、材料、航空、汽车等领域结合,促进行业技术的快速发展。
因此,ChatGPT绝不仅仅是一个聊天机器人,也不会止步于颠覆现有的搜索引擎,它可能只是通用人工智能的一道开胃菜。