在今日举行的“2022百度世界大会”上,百度用实践进展证明了:人工智能可以是一蔬一饭一滴水,可以是一只初生小羊,可以是一张恢宏的电网,可以是一幅惊世画作,还可以是一场太空之旅……这些年,百度推进人工智能走向普惠,上可探索“星辰大海”,下可走进“田间地头”,着力赋能千行百业,惠及千家万户。
百度飞桨赋能产业智能化
在百度人工智能走向成熟应用的这些年,百度打造的深度学习开源开放平台飞桨在AI和行业迅速结合的过程中发挥了重要作用。在今日的大会上,百度CTO王海峰和央视主持人撒贝宁在讨论飞桨时,有一段有趣的对话:
“百度飞桨有点像‘半成品菜’?”
“不只半成品,已经是九成了,加把火就行。”
“就比如我想吃清蒸鲈鱼,相当于飞桨已经把鲈鱼、佐料全都准备好了,我只需要拿回去往锅里放就行了?”
“对!”
这段对话很形象地说明,飞桨相当于做好了人工智能的“预制菜”,企业和个人开发者只需要适用到自己的需求场景中,就可以实现AI应用落地。有三个生动的案例故事展示了飞桨赋能产业智能化的广阔图景。
百度CTO王海峰和央视主持人撒贝宁
目前,基于飞桨的创新已经渗透到各行各业,加速产业智能化升级、改变人们的生产和生活。现场,王海峰分享了飞桨助力牧民、农民、电厂工人用上强大AI的故事。
内蒙古草原上,为了应对母羊生产时难产、小羊羔被冻死的情况,牧民在寒冬深夜里需要多次往返住所和羊圈,费时费力。内蒙古工业大学教授秦俊平带领团队与内蒙古智慧牧业信息技术集团公司合作,使用飞桨开发母羊分娩预测和预警系统,切实减轻了牧民工作量,提高羊羔成活率。牧民感慨,“科技养羊还是好!”
近年来,无人驾驶农机在农业领域发展迅速,但其作业精度要求极高,且农田里各种因素给无人驾驶农机全程自主作业带来很多困难。国家农业智能装备工程技术研究中心王昊博士开展农田地块分割和农田障碍物识别方法研究,利用飞桨克服各种技术难题,成功在相关系统当中完成落地,即使在形状不规则、环境复杂的农田地块里,也能方便快速获取高精度农田场景模型,保障农机精准作业。
能源安全、电力保供关系国计民生,但传统发电生产依靠人员“传帮带”传授业务技能,信息经验分享沟通不够及时高效;面对新技术问题老师傅也会出现研判不准确的问题,可能会给电网安全、居民用电带来不便。浙能集团数字科技有限公司算法工程师朱凌风和团队利用飞桨开发电厂设备智能研判系统,可智能诊断设备故障,自动分析故障原因及可能产生的后果,还能结合业务流程自动推送处置信息和运维策略,帮助生产人员有效提高了设备运维工作质量,提升应急抢险和设备故障抢修效率。
百度飞桨是“智能时代的操作系统”
如何让AI开发、落地更容易?这应该是每一位AI从业者关注的焦点。深度学习方法极大提高了机器自学习的能力,推动AI应用走向爆发的同时,一个巨大的痛点也浮现出来:深度学习的“深”和神经网络的复杂度紧密相关,随着参数量增大、网络模型层数增多、硬件芯片选型难等问题出现,这意味着深度学习的开发和训练难度越来越大。
要想把深度学习技术应用于千行百业,需要一个平台集合算法和模型模块,让每一个开发者方便地使用,这就是深度学习平台。百度飞桨是中国首个自主研发、开源开放的产业级深度学习平台,对此,王海峰强调,飞桨的三大“关键词”是:深度学习、产业级、开源开放。
其中,深度学习是人工智能的核心基础技术;产业级是指飞桨平台上所有的深度学习技术都是经过真实的产业实践验证的,非常稳定、可靠,会为产业带来实实在在的帮助;飞桨是开源开放的,百度把多年积累的技术成果开源开放出来,与社会各界一起共享共创,建设更加强大、更加繁荣的人工智能生态,赋能各行各业。
百度飞桨所发挥的作用,更像是“智能时代的操作系统”,它集深度学习框架、产业级模型库,以及丰富的开发套件和工具组件为一体,能够持续降低门槛,支持企业和广大开发者开展技术创新和产业应用。目前,百度飞桨已凝聚477万名开发者,据IDC报告,稳居中国深度学习平台市场综合份额第一。
AI大模型——能“上天”,能作画
百度在AI大模型领域的突破,进一步增强了人工智能的通用性,也让广大开发者可以更低成本、更低门槛地开发AI模型,促进人工智能的广泛应用。
人工智能走入深空探测——世界首个航天大模型发布
百度在去年12月,已经成为“中国探月航天工程人工智能全球战略合作伙伴”,双方将在深空探测领域,开展航天技术与人工智能技术的相关合作。航天与百度的技术团队交流之后,认为百度的AI技术在航天领域大有可为:
比如,航天飞行任务规划是一个典型的知识处理过程,未来可以采用人工智能实现即时优化飞行轨道与姿态控制,最大限度规避飞行风险;再比如,深空探测器目前主要采用遥测遥控方式进行探测,未来可以把人工智能与遥操作有机结合起来,更好地实现探测器自主规划探测路线、自主选择探测目标等。
在2022百度世界大会现场,百度和航天合作研制了世界上第一个航天领域的大模型——航天-百度·文心大模型,从航天的场景、数据和知识中融合进行学习,可以对航天数据进行智能的采集、分析和理解,助力深空智能感知、规划和控制。
国家已经制定出了深空探测未来十年的规划,启动一批新的航天重大工程,包括探月工程四期、行星探测工程。关于探月四期工程,规划主要包括四次任务。第一次任务是已经成功实施的“嫦娥四号”,后续还有三次任务:“嫦娥六号”要到月球高价值地区进行采样返回,后续还有新的月壤、新的样品返回地球;“嫦娥七号”主要对月球极区进行科学探测,特别是对月球水分布进行探测,“嫦娥八号”将实施极区的科学探测以及为科研站后续的关键技术进行验证。探月四期基本要达到建设科研站基本型的目标,为后续我们与国际合作建设国际月球科研站打下基础。按照整体研制进展,2025年前后将完成“嫦娥六号”和“嫦娥七号”相关工作,同时开展“嫦娥八号”研制;2030年之前完成“嫦娥八号”发射。
行星探测方面,计划2025年前后,“十四五”末左右,实施近地小行星取样返回和主带彗星环绕探测任务,实现近地小行星的绕飞探测、附着和取样返回;2030年前后,实施火星取样返回任务,以及木星系的环绕探测和行星穿越探测任务。目前,火星采样返回还是一个全世界都没有实现的目标,中国计划在2030年前后实施火星采样返回。木星是太阳系体积最大、自转最快的行星,离地球也更加遥远,进入到木星系及行星穿越,这将是深空探测规划中的亮点。
AI助力分隔三百多年的《富春山居图》山水合璧
今年5月举行的百度WAVE SUMMIT 2022深度学习开发者峰会上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜就表示,今年是大模型产业落地的关键年,大模型与真实场景需求的有效匹配是落地要解决的关键问题。她给出了支撑大模型产业落地的三个关键路径:建设更适配场景需求的大模型体系,提供全流程支持应用落地的工具和方法,营造激发创新的开放生态。
如今,百度文心大模型已从技术创新迈进场景落地,为不同产业提供新思路。
在2022百度世界大会上,“轻轻几笔连接山河”, 文心大模型“补全”了传世名画《富春山居图》。
《富春山居图》是元代画坛宗师、“元四家”之首黄公望晚年的杰作,也是中国古代水墨山水画的巅峰之笔,被誉为“中国十大传世名画”之一。该画于清代顺治年间遭火焚,从此断为长短两卷。前半卷被另行装裱,重新定名为《富春山居图·剩山图》,现藏于浙江省博物馆;后半卷被称为《富春山居图·无用师卷》,现藏于台北故宫博物院。
在2022百度世界大会现场,这幅传世名作实现了“合璧”。百度首席技术官王海峰展示了基于文心大模型“补全”后的《富春山居图》。
尽管原画缺失的部分后人已无法知晓,但该画得到了黄公望纪念馆负责人毛传镔的高度评价,他表示,文心大模型补全的《富春山居图》“与现存真迹风格一致,使两岸画卷走出博物馆实现了合璧,光线风格统一,山水脉络和谐,不仅符合原画审美特点,视觉上还同样具有观赏价值”。在补全画作之外,文心大模型还按照传统,作文以记之。
此外,在百度APP搜索“富春山居图”,人人都可以参与到这一传世之作的“虚拟修复”中。只需不到1秒钟,在中间空白处简单勾勒几笔,文心大模型就能自动“补全”画卷,人人都能像专业画家一样画出自己心中的山水。
撒贝宁也现场体验了补全的过程,直言“自己得到了黄公望先生的真传”。
用AI复原老照片,让古画中的人物“活”起来……这些利用AI参与到文物修复中的新闻已屡见不鲜。但此次应用百度文心大模型“补全”富春山居图与以往有所不同。其中最大的亮点在于,每个人都可以根据自己的想法,去补全《富春山居图》缺失的部分,通过大模型技术的支持,让每个人都可以补全自己心目中的《富春山居图》。
不过,要实时生成一幅高清晰度、高还原度,并且支持全民参与的《富春山居图》画作,对AI算法提出了诸多挑战:
难点一:高清晰度。将AI应用于历史画作的修复并不罕见,但往往清晰度不高。此次百度针对《富春山居图》实现了高清尺寸的补全,生成的画作更加逼真,具备了更高的艺术观赏性。
难点二:高还原度。在只有一幅《富春山居图》样本的条件下,仍然要高度还原黄公望这位“元四家”之首的大师作品,对模型的迁移学习能力要求极高。
难点三:全民参与。由于不同用户输入的笔触千变万化、形态各异,需要同时满足所有人多样化的创作期望和天马行空的创意想法,并且近乎实时地生成画作。
为了呈现最好的效果,百度使用文心视觉大模型实现了对画作的补全。文心大模型先是学习了大量的中国山水画,实现了从山水画“小白”向“大师”的进阶,然后具备“大师”水平的文心大模型再去学习黄公望的《富春山居图》时,就能够更容易地掌握这幅传世名作的精髓,从而让补全出来的画作与现存真迹风格一致。这就是“视觉生成大模型+单样本微调”的技术策略。
此次参与《富春山居图》补全的视觉生成大模型因为参数量大,建模能力强,能够让用户在勾勒线条的当下,既能实时生成清晰度较高的画作,又能将大众不同的补全创意实时转化生成。
人工智能虽不能百分之百地还原残画,但能提供更加多样的修复方案。从应用角度来看,文心大模型可以持续在书画文物的修复中发挥作用,发扬中国传统文化,做出基于中国文化艺术的数字内容创新。同时也能帮助更多非专业人士、普通受众,以多元的方式参与书画艺术创作,拉近艺术与生活之间的距离。
未来,书画文物修复可能是人机协同完成的,专家的经验加上人工智能的助力,将为数字创意艺术的发展开创新颖独特的创作局面,也有利于更进一步还原遗失的传统文化。
写在最后
李彦宏说:“我们正处在技术创新的大周期中,新能源、太空探索、生物医药、智能制造等新技术纷纷涌现。中国的科技发展一定会走到世界前沿。而这条路,需要很多‘石块’铺就。百度愿意成为其中的一块‘铺路石’,在基础研究、基础技术和底层创新上贡献力量。”
深耕AI多年,百度不断夯实AI技术底座。百度飞桨经过对大量真实生产场景的反复打磨,已经能够使传统企业在智能化转型中实现高性能开发、大规模训练、不同场景和不同软硬件平台的敏捷部署,最大程度实现降本增效。大模型作为AI基础设施的一部分,进一步拓宽了AI技术落地的场景覆盖广度,更加深了产业应用的深度。
通过在技术、场景、生态的持续突破,也将进一步夯实百度AI的技术底座,加速AI规模化落地。如何诠释人工智能的未来?它不过像一蔬一饭一滴水,将越来越普惠,赋能千行百业,惠及千家万户。