作者 | 李梅 编辑 | 陈彩娴
“打开‘深度学习+’大门的三把钥匙:知识、生态、千行百业。”
1764年的一天,“珍妮纺纱机”诞生在英国一个织工哈格里夫斯的家中,将织布效率提高了八倍,吹响了人类进入机器时代的号角。很快,这股“机器之风”就吹到了采煤、冶金、制造、交通等各个领域。一项技术能够将它的触角延伸至各行各业,靠的是其底层通用性。正如百度CTO王海峰所说,深度学习具有很强的通用性,呈现出标准化、自动化和模块化的工业大生产特征。
在以人工智能为核心的第四次工业革命中,也正是深度学习技术的通用性打开了AI走向大规模落地应用的空间。其中,深度学习框架平台和大模型承担了技术基座的角色,被委以AI时代基础设施的重任,前者是让各类神经网络在不同硬件条件下高效执行的枢纽,后者则使用预训练技术适配各类上游任务。进入2023年,深度学习下一个黄金十年的列车将驶向AI工业大生产时代,我们要如何穿过迷雾、找到AI技术创新和产业落地的最佳路径?在深度学习领域有着十余年技术积淀的百度,及时地给出了一个答案:“深度学习+”。在今天的百度Create AI开发者大会上,百度CTO王海峰发表了题为《“深度学习+”,创新发展新引擎》的主题演讲,他提出:人工智能的技术创新和产业发展,已经进入“深度学习+”阶段。
王海峰在百度Create AI开发者大会上王海峰揭示了“深度学习+”的“+”在三个层面的内涵:技术角度,是深度学习+知识;生态角度,是深度学习+上下游生态伙伴;产业角度,是深度学习+千行百业。AI走向规模化的大生产,这三个层面缺一不可。
01、知识:AI是通才,也是行业专才
过去几年,深度学习模型在视觉、NLP、语音等各领域已经取得了巨大成功,但业内的一个普遍共识是,目前模型还存在可解释性差、通用性不强的弊病,模型的性能也还有很大的提升空间。一个关键原因就在于,模型在学习过程中缺乏先验知识的输入。这从技术上筑起了一道墙,拦住了AI走向大规模产业化的路。在王海峰看来,深度学习+知识,是AI技术进一步发展的重要方向。人类的推理能力依赖知识,知识凝结了人类千百年来的智慧,捕获和识别领域知识并将其编码到模型当中,提升模型对于知识的记忆和推理能力,这种知识增强的深度学习范式更为接近人类大脑。在AI的大模型时代,为智能注入更多智慧,这正是百度走出的一条与众不同的大模型路线。
2018年,谷歌发布语言模型BERT,在NLP领域掀起了预训练模型的技术革命。百度则是国内最早一批占领高地的机构,2019年3月,百度发布并开源了国内首个知识增强的语言模型文心ERNIE 1.0,它在语言推理、问答匹配等各类中文语言任务上的性能超过了BERT。通过引入知识图谱,将海量数据与多源的丰富知识相融合,模型的学习效率大大提高,可解释性也得到了增强。这先行的一步,背后是百度在NLP领域深厚的技术积累,早在2010年,国际顶级NLP专家王海峰加盟百度后,就牵头成立了国内第一个NLP研发部门,如今也在大模型上发力最早。到了今天,文心系列大模型的参数规模最高已经进化到千亿级别,在语言理解、文本生成、跨模态语义理解等领域取得了多项技术突破。百度沿着“深度学习+知识”这条路线,走出了大模型的差异化道路,并且已经走得很稳、很长远。
纵观国内各家大模型的发展,与其他玩家相比,百度更早地从拼参数的盲目风潮中抽身,确立了文心的另一个“杀手锏”:产业级。这背后遵循的依然是“深度学习+知识”的逻辑:在AI走向大规模产业化的过程中,大模型在具备通用知识的同时,必然还要向各行各业“拜师学习”,进而成为精通各领域的“专家”。所以,“+知识”加的不仅是科学知识、经验知识,还要有行业知识。为了填补基础模型与应用场景之间的鸿沟,在文心通用大模型的基础上,百度与多个领域的头部企业和机构合作,运用行业知识增强技术,首次把各个行业的特有数据和知识融合到大模型中,将大模型的能力适配和延展到了能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域。百度的11个行业大模型,勾勒出了未来AI工业大生产图景的雏形。
目前来看,大模型的产业化尚任重道远,而2022年AIGC赛道的火爆,则给我们指明了眼下大模型落地最为清晰的一个路径。OpenAI于去年4月发布的文生图模型DALL·E 2打响了AI绘画热潮的第一枪,随后Stability AI在8月推出开源的Stable Diffusion模型,让AI绘画的圈子彻底沸腾起来。而在Stable Diffusion上线前三天的8月19日,百度就发布了一款AI绘画产品——文心一格。它基于文心大模型的技术,能够根据文字生成多种风格的高清画作,是普通人进行高质量艺术创作的一支“神笔”。而长远来看,AI作画在toB端有着更为宽广的场景,在解决了版权、生成的可控性等难题后,像文心一格这样的工具在移动内容生产、游戏、工业设计等场景都会有广泛的应用。
AIGC巨大的想象空间植根于大模型的跨模态能力。多模态学习是深度学习在下一个十年的重点方向,如同人类能从一段文字描述中构想出一幅画面,模型融合了语言、视觉等多模态知识后,可具备跨模态生成的能力,文生图、文生视频都会是未来大模型的风口所在。这也便是“深度学习+知识”这一概念在模态层面的延展。
02、生态:乘飞桨驶向产业更深处
一项缺乏生态体系的技术,终究会被历史淘汰。AI技术要走向工业大生产,深度学习框架、基础算法、AI芯片以及数据、应用和人才等等,都缺一不可。在AI的产业链上,每一个需求和反馈都需要顺畅地传递到深度学习技术及应用的每个环节,经过各环节的持续迭代优化,才能最终加速AI的技术创新和产业化。正是基于这样的思考,百度提出了“深度学习+上下游生态伙伴”的观点。
在这样一个生态体系中,深度学习框架上承神经网络模型和应用,下接各类芯片,因而处于一个非常核心的位置。类比PC时代的操作系统Windows、移动时代的操作系统IOS和安卓,王海峰认为,深度学习框架可以说是当今“智能时代的操作系统”。一个好的框架,能够帮助开发者和企业大幅提升深度学习模型的研发效率及效果,避免重复“造轮子”。尤其是对于大模型而言,框架可以解决开发效率低、推理速度慢、部署成本不可控、芯片难以适配等棘手难题。
百度的飞桨平台(PaddlePaddle)作为一个技术底座,其强大的能力如今已经在文心系列大模型上得到了验证。而回溯飞桨的诞生,从一开始,它就不仅仅是百度自身的一个成果,更是中国AI发展历史上的一次重大飞跃。早在2012年,百度就开始探索深度学习技术及应用。2013年1月,百度建立全世界第一个深度学习研究院(IDL),并开始布局研发深度学习框架,最终于2016年开源首个国产深度学习框架PaddlePaddle。
在国内市场上,PaddlePaddle至今都是唯一可与国际两大主流框架TensorFlow和PyTorch正面交锋的深度学习框架。而细究中国人在深度学习框架领域的研究历史,我们会发现这样一个演变:早期的代表性框架如Caffe(2014年)和MXnet(2015年)都始于学术界,出自一群在国外读博的华人学生之手,而从PaddlePaddle开始,百度向深度学习框架注入了深厚的产业基因。直到2020年,各家公司纷纷推出自己的框架,国产框架才迎来在产业界的爆发元年。2019年,PaddlePaddle拥有了中文名“飞桨”,其直意是“很快的快船”。如今,乘着这艘快船,AI已经驶向了技术落地的深水区。飞桨平台已经汇聚了535万开发者、创建了67万个AI模型,服务着20万家企事业单位。
可以看到的是,越来越多的企业正在借助飞桨的AI技术生态,进行低门槛的AI应用和开发。例如,中小型企业可以基于飞桨开发大量不同种类的技术服务型应用或者模型,大企业则可以凭借自身的数据优势,借助飞桨提升业务经营效率。基于研发模型所用的核心框架、包含各种已经训练好的深度学习模型的模型库、支持低代码的开发套件和工具组件,以及飞桨企业版零门槛AI开发平台EasyDL和全功能AI开发平台BML,飞桨将AI的能力开放给了各行各业。事实上,从生态的角度看,百度不仅是国内唯一,而且是全球范围内极少数拥有全栈布局的人工智能公司。在AI的算力层,飞桨亦建设了极具竞争力的硬件生态。飞桨正紧密与国内外硬件厂商开展软硬一体联合优化,截止目前已有超过30家硬件厂商与飞桨深度融合优化,国内外主流芯片基本都已适配飞桨。
2022年,飞桨还联合硬件伙伴发布了“硬件生态共创计划”,目前伙伴数量已达28家,包括英特尔、英伟达等硬件厂商。从中国第一款云端全功能AI芯片“昆仑”、飞桨深度学习框架、文心大模型等核心技术,到搜索、智能云、自动驾驶、智能家居等应用,百度自身的技术创新与落地体系,是国内AI走向工业大生产的一个缩影。
03、千行百业:百度的大视野
AI技术最终要落到何处?在百度看来,必然是千行百业。凭借飞桨平台和文心大模型,百度不仅在自身的搜索、信息流等业务中实现了大规模应用,还将眼光放在了更广阔的各行各业上:工业、农业、能源、城市、科学计算等等20多个领域。应用深度学习技术来降本增效,基本上已经成为各行各业的一个共识,但企业要真正应用AI来解决实际问题,面临的难题其实不少:首先,每个行业有每个行业的难题,行业虽数得过来,但细分场景的数量是难以统计的,提供算法、模型的AI公司很难洞悉每个行业自身的特殊场景需求。其次,传统行业大都没有自己的AI研发团队,算法生产的成本相对太高,不是所有企业都能承担得起的。
此外,没有适用工业场景的部署硬件系统,也成了AI落地的“最后一公里”难题。为此,百度飞桨给出的解法是,基于行业的特色数据,为企业提供相当于“一整个算法团队”的能力。举一个制造业的例子。在每架飞机起飞前和降落后,飞机航线维修人员都需要进行全面的检修,但人工检修很难做到100%不出差错。因此,许多飞机维修服务公司希望能开发一款辅助检修的AI应用,但没有专业的算法团队,预算也不够,这件事无从下手。在四川赛福威飞机维修服务有限公司,一位IT项目负责人最终借助百度飞桨EasyDL平台解决了这个难题。毫无AI算法经验的他,基于EasyDL平台开发了一套机务维修安全卫士系统,能够高效检测飞机空速管套、飞行记录本等,已经在长沙黄花机场实现了落地。
飞桨还正在让AI走进田间地头。在北京市大兴区长子营镇,百度飞桨与京东方后稷、裕农联合打造了一个AI智慧植物工厂。基于百度AI技术算法构建的克重识别模型,通过拍摄的图片就识别重量、健康状态,准确率达到95%以上;基于飞桨EasyDL平台的目标检测模型则实现了自动识别常见昆虫,识别精度达到90%。
从前,为了观察蔬菜的生长和虫害情况,厂里唯一一位农业专家需日行两三万步,而现在,在2600平米的空间里,AI 正在24小时看护植物,两位工人只需做一些基础工作,整体工作效率大大提高。像这样的智慧植物工厂,正在落地到全国各地的智能温室中。国内有着庞大而丰富的产业体系,这为AI技术落地带来了巨大机遇,百度飞桨正在让强大的AI变得人人可用,为每一个行业的问题提供答案。同时,丰富的应用场景也反过来会推动底层技术本身的突破,形成一个良性循环。
04、写在最后
大卫·米切尔在他的科幻小说《云图》中说:历史是一副牌,从中随意抽出几张出来,我们的祖辈那代抽到的是3、4、5,而我们这一代人抽到的则是10、J和Q。一代人有一代人的使命。深度学习的前十年,AI的能力在算法、学术论文、纸上项目中不断打破天花板、刷新人类的认知;而在下一个十年,AI的工业大生产是落在我们肩头的使命。在这个过程中,国内一众大厂必然要担当起引领者的角色。于百度而言,它不曾错失过去十年深度学习的每一个重要节点,今日,百度在业界率先提出“深度学习+”的概念,则又是一次先行者的远见。在国际人工智能竞争愈发激烈的当下,中国AI的下一个十年要往何处走,百度已经趟出了一条清晰可见的路。
以大模型为例,谷歌、微软、Meta、OpenAI、英伟达等国外科技巨头都在这条赛道上竞相追逐,对比之下,在资源投入、技术创新、商业化落地等方面,国内的大模型发展都不容乐观,近日火爆出圈的ChatGPT更是引许多国内研究者发出了“此诚危急存亡之秋”的呼喊。在AI深入产业的视野下,国产大模型配国产架构,这是百度区别于其他AI玩家的核心竞争优势。在2023年的开始,百度用“深度学习+”初步打造了一个AI工业大生产的宇宙,期待更多住民的到来。