千呼万唤始出来,继“GPT-4”发布一天之后,百度“文心一言”于今日正式亮相。没有预想当中的实时对话场景体验,发布会上播放的是提前录制好的DEMO;也没有直接对外开放,而是回以3月16日起正式对外开放预约。这一番操作下来,不少网友戏称,说好的产品发布,结果还是相当于内测。发布会上,李彦宏坦言,这段时间不断有人问他为什么现在发布文心一言,百度是否真的准备好了?对此,他的回答是:“从我自己在内测过程中体验到的‘文心一言’的能力来说,(当前)确实不能叫作‘完美’。”
对于“文心一言”,根据此前百度官方给出的介绍,其是基于百度自主研发的文心大模型技术推出的生成式对话产品,而文心大模型是目前世界上最大规模、最先进水平、最具中文特色和应用价值的预训练语言模型之一,拥有超过1000亿个参数。仅参照Chat GPT来看,Chat GPT其大模型GPT经历了三次迭代,参数量一度从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,整体运行所需的投入达到百亿。因此,就目前算力投入与运行来看,这个号称中国版的“ChatGPT”确实稍逊一筹。
明知算力上尚有不及,但为何此次“文心一言”依旧如期发布呢?对此,李彦宏也给出了答案:”之所以发布是因为有市场需求,百度各个产品线,从搜索到智能云到自动驾驶到小度,再到合作伙伴都在等着我们的发布。另一方面,发布后的用户反馈也能够帮助提升产品迭代。”
就现场演示来看,“文心一言”在面对文学创作、商业文案创作、逻辑推算、中文理解及多模态生成等方面能够生成自己的答案。据介绍,自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。
就资本市场来看,可能出于对产品还不成熟的考虑,“文心一言”此次发布并未被看好,发布会中,港股百度集团跌幅扩大至7%,最大跌幅达10%。
虽然质疑之声不绝,但不可否认在AI生成式对话产品领域,百度做到了国内首发。这与其在搜索引擎时代就进行中文语言相关数据、算法等的积累分不开,所以不论此次发布会的结果如何,我们依然无法否认百度在“文字”“语言”“检索”“词条”方面的领先性。正如互联网分析师丁道师所说,本次发布会就今天业界朋友的评价来看,百度“文心一言”的首秀难言及格,我们还要给他较长的成长时间,我们要抱以包容的心态看待。随着时间的推移,训练数据量的提升,交互会越来越精确,越来越聪明。
回归到行业本身,无论是“chat GPT”几度更迭,还是“文心一言”顺势发布,其背后都是人工智能的发展浪潮推动,是社会数字化发展的大势所趋,而实践的发展需要时间沉淀,正如李彦宏所说,深度学习、自然语言处理,需要多年的坚持和积累,没办法速成。
劈波斩浪,扬帆远航,期待未来的生成式AI乃至人工智能为我们带来更多惊喜。
作者:包建羽
责编/版式:包建羽
审核:舒文琼
监制:刘启诚