作者|李禾子,邮箱|lihezi@pingwest.com
11月14日,阿里巴巴智能信息事业群宣布正式推出夸克大模型。据介绍,夸克大模型是基于Transformer架构、全部技术均为自研,同时参数规模达千亿级的多模态大模型;其应用场景除了基础的通用搜索,还将包括医疗健康、教育学习和职场办公等更垂直的领域。
从其应用方向来看,夸克大模型的推出很符合当前大模型“重落地”的发展趋势。
推出之前,夸克大模型已经组建了数百人的研发团队,在上述垂直领域进行了预训练和精调。官方发布的数据至少显示,夸克大模型并非是一个“赶时髦”的产物,而是有着想做到行业顶尖的野心——
11月16日,在C-Eval和CMMLU两大权威评测榜单的最新评测结果中,夸克大模型分别以89和以77.08的均分登顶;国内专业考试测试方面,它在中考、高考和研究生考试中均超过了GPT-4,包括在临床执业医师资格考试、计算机等级考试、公务员考试、教师资格证考试等评测中,也均优于GPT-4(其中临床执业医师资格考试成绩为486分,远高于360分的及格线)。
如果进一步结合阿里巴巴在AI生态的布局,就会发现夸克大模型的诞生有着很强的战略属性,阿里巴巴智能信息事业群连同大模型在其中的地位一起,都被提到了相当的高度。
AI技术基因
需要指出的是,智能信息事业群属于阿里巴巴“1+6+N”中的N公司,同闲鱼、钉钉等公司于集团内的序列类似。
阿里巴巴智能信息事业群更注重产品创新和技术研发,这也是内外部对其的认知之一。
该事业群成立于2021年4月,定位于信息服务方向的智能化创新,旗下包括了夸克App、UC浏览器和书旗小说等产品。
同年10月,智能信息事业群升级组织架构,围绕夸克App成立了夸克事业部。该动作被外界解读为是在加码信息服务赛道,夸克则有望承担起创新突破的使命。包括此次推出的夸克大模型,研发路线也是为了服务夸克的业务战略。
随着AI时代的到来,信息服务领域的用户价值和商业价值仍处在高速增长的初期,夸克开始被置于更高的发展优先级。
今年9月,阿里集团宣布了用户为先、AI驱动的两大战略重心,将加大对“技术驱动的互联网平台业务”、“AI驱动的科技业务”等业务的战略性投入。
吴泳铭指明的阿里巴巴未来的战略投入方向,夸克显然是AI生态中的一份子,夸克大模型的推出已经是一个证明。
为什么是夸克
夸克当前的定位将关系到夸克大模型将如何应用。
把时间拉回至几年前,当时出现在人们眼中的夸克还是一款极度简洁的小众产品,专注于优化用户的搜索体验。也因为体验做得好,在极客和App玩家里圈了一大波粉丝,月活也达到了百万级。
后来夸克所有的探索,也都是在此基础上展开的,各种变化也一直围绕着夸克的成长。
对于当时已经拥有一定体量的夸克来说,一条分岔路其实已经摆在了面前——作为一款信息服务产品,它必然要考虑后续的发展方向,单一的功能定位能赢得当下,却不一定争取到更大的市场。夸克需要在克制的前提下做加法,然而对于这样一款对用户体验有着执念的搜索为主的应用而言,做加法不是个容易的过程。
期间夸克进行过一些尝试,譬如垂直领域的专业搜索,以及不同形态的优质内容生态建设。
但就在人们以为夸克要走上内容付费时,它又结合用户需求和市场变化迅速对自己的业务体系进行了梳理。
2021年夸克事业部成立,按照阿里巴巴智能信息事业群总裁吴嘉的说法,夸克已进入新的阶段,正在从一个好用的搜索App,迈向个人学习、生活和工作的智能助手。
此前,夸克已经在搜索业务的基础上延展出了一些信息服务,譬如辅助考生进行志愿筛选的高考信息服务,包括健康百科和健康精选问答在内的健康信息搜索,以及内容涵盖简历、PPT、论文、合同、表格和期刊等在内的文档等。此外,工具属性更强的夸克网盘也在2019年就已上线。
这些服务在“智能信息”的概念出现之前,还是较为分散的,而当明确要做用户“个人学习、生活和工作的智能助手”之后,夸克的定位也逐渐清晰起来。
依然是在不牺牲用户体验的原则上,夸克后续又对这些服务进行了更深入的优化,并在2022年推出另一款工具产品夸克扫描王,补足了扫描场景下的用户体验。也是在2022年,夸克App的Slogan正式由“新生代智能搜索”升级为“你的高效拍档”,自此完成了从一个“小而美”的App走向新一代智能信息产品的生态化发展的蜕变。
由于服务场景更贴合学生以及年轻的上班族,夸克也在更新自己的同时,积累起了一批画像更加年轻的用户——据QuestMobile发布的《2023年轻人群智能效率应用研究》报告,夸克App在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一;此外,在夸克服务的数千万级用户中,25岁以下用户占比超过一半。
这些统统构成了夸克区别于其他同类应用的差异化用户心智。
很显然,对于夸克这样致力于帮助用户提高效率、有更强实用性质的应用来说,大模型的引入在现阶段是适配的,也符合大模型的进化规律。夸克的发展已经从单一服务变成产品矩阵形态,这也给大模型提供了足够多的落脚点。
大模型将如何“升级”夸克
当我们提大模型对某个应用的改造,一定是建立在这个应用原有的业务基础之上。
夸克首先作为一个搜索工具,在过去几年已经积累起了海量的中文数据,并号称有“最全面的中文数据库”。训练大模型最核心的三要素之一就是数据,夸克过去的积累首先给了大模型能更好理解、评估和提炼中文知识体系的前提。
而在更细分的领域,夸克的知识内容体系也相对更完整。
比如高考服务,到今年夸克已经连续五年提供高考信息服务,各省市的高考数据非常齐全,同时也涵盖了丰富的图文、视频和直播等针对不同省份、分数段学生的填报技巧内容;健康服务方面,夸克也联合数百位院士、医疗专家和专业协会建立起了夸克健康百科,并且和数十家行业头部医疗机构合作建立起了健康精选问答体系;至于文档服务,其内容也包括了实用范文、求职简历、合同模板、PPT模板、教育教学、表格模板和研究报告等八大类,精选文档也已上线了超千万份……
更重要的是,这些数据和内容背后,包含的是非常丰富的用户场景,对于大模型理解和认知不同用户对工作、学习和生活上的真实需求,亦是加分项。
某种程度上,大模型的加持和夸克一直以来的技术传统是一脉相承的。
AI此前就在夸克的各项服务中多有应用,就高考和健康服务来说,已经在录取预测、模拟填报以及针对病例、药品的筛查等等使用场景下借助过AI帮助;夸克网盘也在今年先后上线了AI自然语言搜索以及播放器AI字幕生成功能;夸克扫描王在识别的准确性上,也一直离不开AI的贡献。
夸克可以说对浪潮的到来早有准备,而大模型一旦加码融入,对夸克各项功能服务的影响可以预见地也将十分显著。
想象这样一种场景,在扫描工具的使用中,用户的痛点通常在于相机识别出的内容不够准确,尽管此前借助AI已经能在诸如版式、公式和手写内容等的识别上提升准确度,但此类AI往往在语义和前后文的理解上较为机械。而大模型最强的能力恰恰就在于认知,因此当大模型被用于扫描场景,识别准确性又可以提升一个量级。
类似的大模型应用场景,几乎可以匹配到夸克当前的每一项服务,从而带来更多体验上的变革。
而在大模型现阶段普遍存在的幻觉问题方面,夸克也提出了自己的应对,建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系,尤其是在通用知识、图文知识、专业知识、推理知识和写作增强等方面,有望让大模型提供的内容更具有准确性和专业性。
在给用户带来改变前,夸克先积极拥抱了变化,改变了自己。
吴泳铭几天前在世界互联网大会上的预判是,“在可见的未来,会有更智能的下一代产品进入人们的生活,AI助理会无处不在,成为每个人工作、生活、学习中的助手”。夸克已经到了迈向下一代搜索的临界点,大模型也将成为推动夸克持续进行产品体验创新的技术底座。