最近,从行业、公众到资本,整个科技领域最火热的话题,莫过于ChatGPT。
对此,我跟很多朋友都有一致看法:这是一个具有重大意义的里程碑,但也正在演变为一场新的投机潮。
下面,具体谈一谈个人思考:
1
ChatGPT最大的意义,是为我们验证了一条通往“强人工智能”的可行路径。
在此之前,人工智能的上一个关键里程碑事件,是2016年3月,“深度学习”的代表AlphaGo正式击败围棋世界冠军李世石。
此后6年来,人工智能的发展日新月异。然而,时至今日,几乎所有AI,都还只能同时在少量的垂直场景里,实现接近或超越人类的智能表现,而无法实现一个模型在多个行业复用。
在对话、创造性工作、情感、认知等更开放、更复杂的领域,它们普遍被归类于“人工智障”。
所以,在全球日益数字化与智能化的当下,从大国博弈到巨头厮杀,“通用人工智能”都将成为一个新的产业制高点。
而ChatGPT的破冰,它证明了沿着“大语言模型”这条路径,我们有望创造更通用性的新一代人工智能,甚至在复杂开放的环境中,实现“弱人工智能”向“强人工智能”的关键跃迁。
具有更强感知、交互和创造力,能适应更复杂环境的新一代人工智能,将从AIGC应用、生成式AI到更多应用场景,为整个人类社会带来新的巨变。
这意味,新的制高点已经从设想走进现实,以当下的技术条件,就可以抵达。
2
中国能不能复制open AI和ChatGPT?
对于这个问题,目前还存在争论。
但我个人的答案,是肯定的。
此前,ChatGPT的开发过程中,既没有颠覆性的算法升级,也没有独一无二的资源差异。
OpenAI获得成功的最关键因素,在于坚持:
以绝决的姿态,朝着一个不一定成功的方向,不计成本地持续投入,最终“大力出奇迹”,成功抵达新大陆。
这个过程中,长期看不到结果的巨大不确定性,才是挡住了其他人的最大障碍。
现在,这个障碍已经不复存在。
路径和终点都已经清晰,在资本情绪的助推下,后来者无需承担试错风险,就能沿着open AI趟出来的正确路径,复制它的模式,以最快速度追赶。
在这样的大潮下,即使英语语系和中文语系的语法结构和复杂度存在差异,即使政策监管、网络数据和商业竞争等环境条件存在差异,都不可能形成无法逾越的门槛。
所以,无论美国还是中国,很快出现越来越多的“类ChatGPT产品”,已经成为必然。
3
尽管如此,对ChatGPT的路径复制,也并非易事。
越来越多的产业巨头、地方政府到和行业名人,都正以“大干快上”的气势,蜂拥杀入了这个赛道。
其中的绝大多数,我都不看好。
ChatGPT路径的基本逻辑,是依托超大规模的海量数据,来进行深度学习训练,最终实现自然语义处理能力的质变。
这不仅要有合理的算法模型,更对算力和数据都有极高要求。
以ChatGPT为例,这个包含1750亿参数的超级神经网络,模型训练使用了45TB数据、近1万亿个单词,单次训练的费用就高达千万美元。
甚至为了不打开“潘多拉魔盒”,训练数据也必须进行筛选和清洗,以剔除可能对人工智能训练产生负面影响的内容。
所以,以ChatGPT为起点,大模型的人工智能开发,已经进入了一个“重工业时代”。
绝大多数“创业者”的资金和算力资源,都远不足以支撑大模型训练的海量消耗。
大多数的垂直应用场景,也达不到训练通用人工智能所需要的数据规模和数据质量(比如语义的复杂度)。
与垂直领域“小而美”的人工智能相比,需要海量算力、数据和资金投入的大模型AI训练,注定只会是一个“巨头战场”。
4
面向未来,ChatGPT是人工智能的又一个起点。
就语言来说,如何提高对比喻、暗示、双关等复杂语义的理解,提高人对法律、道德、伦理等风险内容的理解等等,都还有待人工智能进一步完善升级。
与此同时,沿着这个路径,我们能否在语音、图像等其他模态下,实现大模型通用智能的突破,甚至更进一步,将多种模态的训练整合为一,创造更强大的多模态大模型智能,也都还有待后来者证明。
而在技术之外,在市场层面,新一代人工智能如何更深入地应用于各种场景;
在社会层面,如何在充分利用人工智能同时,以尽可能小代价消化“机器换人”等人工智能对社会秩序的负面影响;
在政府层面,如何引导和规范人工智能,在社会治理、产业升级、公众利益、国防安全等各方面,以更快速度向善发展;
……
这些,都还有待我们整个社会,一起思考,一起准备,一起摸石头过河。