百度交出的这份教科书般的 AI 疫情防控答卷,让人们感受到 AI 给这个行业带来的技术之光。
武汉“解封”进入倒计时,这场持续了 2 个多月的战“疫”与期待终见尾声。
在庚子年的这场疫情战事中,百度 AI 所展现的扎实落地及技术开放态度,让 AI 真正与物理世界建立了联系、让用户真正对 AI 有了感知的温度。
2 月 3 日,百度董事长兼 CEO 李彦宏发出一封内部信。信中说,“让我感到骄傲的是,在百度,无论什么时候,无论情况有多难,总有那么一群最有勇气担当的同学,在关键时刻挺身而出。”
因此,我们有必要复盘一下百度 AI 战“疫”的全局。
比 DAU 更重千钧的事
横向来看,以百度地图、飞桨、智能云、百度研究院为代表的部门,纷纷”祭”出自己的技术和产品,并形成一股合力向 C/B/G 端用户输出;
纵向来看,病毒分析、疫情防控、辅助诊断和复工复产,疫情发展的每一个阶段,百度采取了一种近乎“浸入式”的参与方式:
从成立 3 亿元疫情及公共卫生安全攻坚专项基金、提供人工智能技术支持和亿级计算资源配套,到百度地图等人工智能、大数据产品为疫情科学管理提供参考;从免费开放线性时间算法 LinearFold、免费智能外呼平台、AI 测温系统陆续落地使用,到“AI 开发者战疫守护计划”,再到推出多举措多产品支持企业复工生产……
多年来的巨大投入,在这一刻显示出坚实的成色。百度走出了一条科技抗“疫”、AI 抗“疫”之路。
李彦宏在开年内部信中说,“很多用户为百度在抗击疫情中的努力点赞, ‘做有温度的公司,做敢担当的百度’———这样的话,在我心中,比 PV,比 DAU 更重千钧。”
百度地图:大数据防疫的模板
从武汉疫情爆发以来,百度地图的员工就一直在争分夺秒,在第一时间上线疫情相关的各类数据和功能。1 月 21 日起,百度地图员工放弃原本的春节休假,投入到了疫情战斗中。而每一项功能的推出,对于百度地图的全体员工来说都是一次印象深刻的经历。
(百度地图员工们的年夜饭)
以迁徙大数据平台为例,百度地图慧眼在人口与地理大数据服务上有长期积累的成果,它一直围绕着人口与地理大数据服务,向 B 端、G 端提供产品能力,一直得到政府统计部门、国家智库和城市规划院所的认可。
意识到在春节假期和疫情交叠的时期,社会对人群流动数据的需求会更高的情况时,团队就紧锣密鼓地开始了迁徙大数据平台的筹备。
历经 12 个小时的连续开发,平台的第一个版本在 1 月 22 日火速上线。
随着后续政府、媒体的关注度持续增加,用户对于迁徙大数据平台的期待值越来越高,百度地图团队的工作量也越来越大,需要每日持续快速地升级这个平台。
1 月 25 日,百度地图迁徙大数据平台增加了“迁徙趋势图”,展现人口流动变化趋势;1 月 26 日,百度地图上线迁徙规模指数,反映迁入或迁出人口规模;2 月 7 日,百度地图推出城内出行强度功能,可查看城市目前出行状况。
这种以“天”为计算单位的产品迭代速度,在业内人士看来,也非常罕见。
截至 3 月 15 日,百度地图迁徙大数据平台和全国实时路况平台已累计提供超 22.4 亿次服务。
百度 CTO 王海峰表示,“在全国上下齐心抗疫的特殊时期,百度一直发挥着自身在 AI、大数据、搜索、信息服务方面的优势,驰援一线的防疫控疫工作,或帮助前线抗疫工作者提升效率、保障安全,或为政府和研究机构提供科学的数据参考,或为普通大众提供及时有效的服务。这是我们对‘用科技让复杂的世界更简单’这一使命的践行,也是我们的责任和担当。”
与此同时,百度地图陆续推出了发热门诊地图、疫情小区地图、复工地图、公交地铁客流量查询等功能。
这些功能的底层数据来源是百度地图开放平台海量的定位服务数据(为脱敏数据,处理各环节均不涉及个体隐私),每天响应全球位置服务请求超过 1200 亿次,这个庞大的位置请求数据正是此次百度地图及时获取疫情数据信息、快速推出各项功能服务的基础。
百度地图也与不同机构、政府展开合作,打通各类政策信息获取渠道。
例如,与北京市交通委合作,上线公交地铁客流量查询服务;与国家卫生健康委员会官方政务新媒体平台健康中国合作,将发热门诊地图链入健康中国 APP 中。
百度地图正在用大数据洞察时间和空间,描绘出疫情下各城市迁徙、人流、交通的全景图,成为疫情防控不可或缺的一股力量。
智能测温:700 万人次的“检阅”
如果我们注意的话,疫情期间在进出火车站或者地铁的安检通道里,我们都会看到有一个“无接触”式的测温仪,这个测温仪在减少交叉感染方面发挥着无可替代的作用。
北京清河站也不例外。作为北京北部新的综合交通枢纽,清河火车站的 AI 测温系统从部署测试到正式上线,只花了 6 天左右的时间。我们列出了一条时间线:
1 月 23 日(农历二十九),百度积极响应中关村对“红外测温产品”人工智能技术方案征集的“江湖召集令”, 百度安全、企业智能平台、物联网、百度视觉技术部以及飞桨等多个团队共有近百人临危受命,他们放弃了春节原定的安排,迅速投入到了 AI 多人体温快速检测解决方案的开发中。
1 月 26 日(大年初二),中关村科学城管委会正式发函确认采用“百度方案”,并要求百度在两天之内即在清河站完成试点部署。
1 月 28 日(大年初四),百度 AI 测温系统完成了在清河站的部署(高铁西侧出口)并启动试运行。
2 月 2 日,经过数日试运行后,百度 AI 测温系统在清河站(高铁西侧出口)正式投入运行。
百度 AI 测温系统在清河站的落地有效地协助了清河站的体温检测和疫情防控工作,得到了多方肯定。在随后的一周中,百度的技术团队陆续完成了清河站全部 19 处出入口的设备部署。
尽管便利了人群的通行,但是不得不说,这种“无接触”的测温方式存在一个很大的局限性:例如,冬季过道内的温度较低,会不会让体温的测量数据存在误差?
智能云物联网团队负责人坦言,AI 测温系统在实际的部署过程中,确实会面临着众多工程化方面的挑战,包括现场体温检测点的部署条件、被检人员行进路径规划、电力与网络支持、安装地点各部门协同、检测人员培训等诸多问题。
但是就具体的技术而言,最大的挑战主要来自于复杂的外界环境因素对检测精度的影响。由于体温检测点多设置于公共场所的出入口位置,检测设备时常会受到包括气温、风力等外界环境因素影响,极大降低了检测的准确度。
(深夜仍在清河站进行设备调试的百度智能云物联网部同学)
为此,百度使用了一系列深度学习算法和数据集完成高精度线性拟合,针对采集到身体表面温度各区域进行实时精准推测,相较传统热像仪直接针对温度最高点进行跟踪的方法,运算后的结果更加接近于现场实际环境下通行人员体温情况,表现也更为平稳和一致。
同时,针对当前黑体方案成本较高等弱点,百度专门研发了基于低成本实时温度黑体的红外测温校准技术。依托稳定温度参考源配件及环境温度实时校正传感器等硬件实施,这项技术能配合体表温度与身体温度曲线数据精准的实时调校,更好地控制绝对精度,同时以较低的成本实现传统黑体设备才能实现的效果。
截止 2 月底,百度 AI 测温系统已在全国范围内完成超过 700 万人次的快速体温检测。而且,百度还将这套系统进一步做成了整体的解决方案,在百度园区使用,并已经在数字北京大厦等交通枢纽、行政机构、医疗机构、企业办公及居住社区中陆续投入使用。
口罩检测、口罩人脸识别:为复工复产而战
当然,除了测体温,车站、写字楼、社区等场所还需要确保大家都戴好了口罩,甚至需要在大家带着口罩的情况下,认出“是不是你”,而 AI 做到了。这件事情听起来未免有点玄乎,但是百度真的做成了这件事情。
这得益于百度飞桨开源的业内首个“口罩检测及分类模型”,以及戴口罩人脸识别技术的开放。
一般情况下,人脸识别是先提取人脸的 128 维特征点,然后根据不同的算法比较特征点进行人脸识别工作。戴了口罩之后,脸部的特征点就会少很多。这个情况下,对模型提出的要求有多高,我们可以想象的到。
百度是怎么做的?这里要提到 2018 年百度收录于国际顶级计算机视觉会议 ECCV 的一篇论文。
基于论文中提到的 PyramidBox,百度在自研的飞桨开源深度学习平台上进行训练,并通过 PaddleSlim 等模型小型化技术,使得算法能够高效运行在一些算力有限的设备上,在人流密集的公共场景检测海量人脸的同时,将佩戴口罩和未佩戴口罩的人脸快速识别标注。
经过测试,模型的人脸检测算法基于 faceboxes 的主干网络加入了超过 10 万张口罩人脸数据训练,可在准确率 98%的情况下,召回率显著提升 30%。而人脸口罩判断模型能实现对人脸是否佩戴口罩的判定,口罩判别准确率达到 96.5%,满足常规口罩检测需求。
口罩人脸检测及分类模型演示效果(绿色边界框为佩戴口罩人脸,红色为未佩戴)
此外,对于实际场景中的光照、口罩遮挡、表情变化、尺度变化等问题,模型具有鲁棒性,并且能够在多种不同端、边、云设备上实时检测,在落地过程中做到真正实用。
除了在密集人流中对佩戴口罩人脸进行检测及分类。
3 月初,百度大脑还推出“戴口罩人脸识别”技术,当下已落地百度大厦办公区,真正实现了戴着口罩“刷脸”也畅通无阻。
需求倒逼技术实现。此前,我们在进出各大火车站时,都需要摘下口罩配合安检。如果这项技术进入安防“武器库”,那么未来节假日的通勤效率将进一步提高。
智能外呼:未来疾控的常规化武器
不知道你们隔离期间有没有接到过社区居委会的电话,你有没有想过,跟你打这通电话的可能并不是人?智能外呼在这次疫情排查中帮了大忙。
以往,百度的智能外呼服务主要用于对企业的服务,例如意向客户筛选、金融催收、信息通知和客户回访等场景中。
因为疫情突发,百度在过年期间临时组建了项目组,并在极短时间内扩容线路,每个项目都有相应的运营人员全程支持。
部署初期,使用者需要与运营人员进行外呼需求的沟通,由运营人员协助搭建话术流程等过程,随后使用者通过简单的学习操作即可使用外呼平台。
对百度而言,增加的成本包括号线成本、服务器算力资源成本、人力成本等。
目前,百度智能外呼平台已经在北京海淀上地街道办、陕西西安、延安、上海宝山、浙江温州瑞安市等十几个地区投入使用,截止 3 月 1 日,外呼总量已超过 300 万次。
此外,百度表示,从 2020 年 1 月 28 日到疫情结束,会免费给各级机构开发外呼平台。智能外呼的负责人向我们表示,对于使用者来说,外呼平台的部署几乎没有成本。
其实,我们还可以预想一点,百度智能外呼的群控应用,未来将会实现“常态化”。例如,智能外呼可以帮助疾控中心、医疗机构等监控疾病在某个地区的传播范围,利用大数据来辅助监管部门实现更精准的医疗决策和更细致的网格化管理。
LinearFold 算法:从 55 分钟到 27 秒
目前,意大利的确诊病例和死亡病例已经超过了中国。进入 4 月,美国的确诊病例超过 18 万,意大利的死亡病例数超过 12000 人,死亡率达到了恐怖的 11.7%。药和疫苗,成为疫区人民最需要的东西。
在百度地图、智能外呼等疫情防控手段之外,百度研究院宣布对外开放一项名叫 LinearFold 的算法。这套算法,对于加速疫苗和药物研发的价值尤为明显。
百度在计算生物领域一直有研究和探索。2019 年 7 月,这套算法由百度研究院首次提出,使得整序列、整基因组的 RNA 结构预测成为可能,也是 RNA 结构预测领域 40 年来第一次重大提速。这项工作当时发表于生物信息学顶级会议 ISMB 2019 和生物信息学权威杂志 Bioinformatics。
RNA 二级结构预测是 RNA 领域的一个基础课题,在疾病诊断、疫苗研发等领域有广阔的应用前景。
传统上,RNA 二级结构预测需要三次方时间复杂度的算法,也就是说,如果序列长度翻一倍的话,就要付出 8 倍的计算时间,这对于 RNA 病毒基因组这样的超长序列(例如艾滋病毒有约 1 万个碱基,埃博拉病毒有约 2 万个碱基)需要很长的等待时间,同时 RNA 结构很容易变异。
而冠状病毒(包括非典病毒和这次的新冠病毒)的基因组又是所有 RNA 病毒里最长的,长达 3 万个碱基,最快的经典算法也需要 55 分钟。
为此,百度研究院利用了 LinearFold 在新冠病毒 RNA 全序列(约 3 万个碱基)上进行二级结构预测,并与传统算法进行了比较。结果显示,这套算法能将预测时间从 55 分钟缩短到 27 秒,速度提升 120 倍。
1 月 27 日晚,百度研究院即迅速成立新冠 RNA 项目团队,涵盖 AI 算法专家、生物专家、工程专家等。经过 3 天大量准备工作,1 月 30 日,百度研究院宣布对外开放 LinearFold 算法及网站 rna.baidu.com。
如今,LinearFold 算法已为全球 100 多家医疗、生物的研究机构提供技术助力。百度研究院也与海内外科研机构、顶级大学在病毒分析、mRNA 疫苗设计等开展合作,帮助提升设计稳定的新型疫苗。
长远来看,这类技术的意义远不止于此。以往,这些生命科学领域的研究话语权一直旁落国外,主流的声音也会认为中国在互联网、AI 等多次浪潮中“应用有余而技术不足”。
这样一种“逼格”颇高、与病毒直接对话的尖端技术,无疑会打破主流观点对中国 AI 能力的固有印象。
用 AI 唤醒开发者
开放与合作,一直根植在百度的企业基因中。2002 年,百度就建立了“百度联盟”,带领着全国的个人站长一起分享互联网的红利。
因此,从决定投入疫情战斗开始,百度就坚持开放的战略,向广大开发者和企业用户开放 AI 能力。2019 年 7 月,李彦宏在第三次举办的 AI 开发者大会上说,“一生二,二生三,三生万物。AI 虽然不能够产生万物,但是它可以唤醒万物。“
疫情期间,百度发布了基于百度大脑 AI 开放平台和飞桨深度学习平台的“AI 开发者战疫守护计划”,开放 240 项技术能力,帮助开发者应对医疗、卫生、疾控等领域的“战疫”一线需求。截至 3 月,已有 400 多家伙伴免费领用百度大脑 AI 技术能力,超过 4000 家企业、超千万用户通过百度 AI 技术赋能安全防疫。
AI,可以被“看”到的教育
就以乐往科技为例,它与百度合作的项目让人真正感受到科技带来的温暖。
乐往科技是一家专门为听障人士做产品研发与服务的科技公司。
疫情期间,为了响应国家“停课不停学”号召,保障听障特殊学生群体也能流畅上“网课”,乐往科技开发了“慧译听障视频字幕速记系统(百度抗疫特别版)”,百度大脑免费提供语音识别技术,有效解决了疫情下快速增长的用户数量及高并发量带来的视频转字幕出现卡顿问题,帮助乐往科技降低了至少一半以上的成本。
目前这一系统已惠及天津理工大学、北京联合大学、长春大学等多所高校及特殊学校的 2100 多位听障学生,30 多所特殊学校的老师,用户累积超过 2 万多人。
AI,医生的第二双眼睛
武汉市金银潭医院放射科主任樊艳青曾说过,“我时刻提醒自己,告诉自己不要流泪,眼睛要用来看海量的 CT 和 X 光片子。”
面对海量的阅片需求,AI 又一次让民众感知到“自己能干点什么”。
2 月 28 日,连心医疗基于百度飞桨平台开发上线"基于 CT 影像的肺炎筛查与病情预评估 AI 系统",已在湖南郴州湘南学院附属医院投入使用。
该系统基于连心医疗在医学影像领域积累的核心 AI 技术,结合飞桨开源框架和视觉领域技术领先的 PaddleSeg 开发套件研发,可快速检测室别肺炎病灶,为病情诊断提供病灶的数量、体积、肺部占比等定量评估信息。
同时辅以双肺密度分布的直方图和病灶勾画叠加显示等可视化手段,为临床医生筛选和预诊断患者肺炎病情提供定性和定量依据,提升医生诊断和评估效率。
百度飞桨助力连心医疗在业内首次开源上述系统中的肺炎 CT 影像分析 AI 模型,并在百度飞桨平台上开放,为全行业的研究和研发提供一把“利器”,期待更多的医院和算法研究者参与到基于 AI 的医学影像大数据抗疫产品研发中来,为抗疫临床研究和临床产品研发贡献力量。
AI,产业智能化的前夜
“新基建”是疫情后中国提振经济的着眼点之一。而 5G、人工智能、工业互联网、物联网等技术,必须与传统产业相结合,才能迸发出巨大的增长潜力。
就如 2003“非典”时期互联网的高速崛起一样,从推动产业发展的角度来说,与 AI 的结合将成为产业智能化的一种“前兆”。
百度 CTO 王海峰曾多次表达过一个观点:“工业大生产的技术由非常强的通用性,这些技术也呈现出一些显著的特征。所以,我认为一个技术同时拥有标准化、自动化和模块化的特征,可以影响各行各业,就具备了进入工业大生产阶段的一些基本前提。”
百度和微亿智造联合打造的智能自动化检测设备——“表面缺陷视觉检测设备”,可以代替人眼,适用于复杂表面缺陷检测,单台检测设备达到 10 名工人的检测量,1 秒内对零部件 6 个面 30 多种缺陷进行准确的检测,帮助企业解决了疫情期多数工人无法返厂的难题,同时还减少了车间里疫情传染的风险。
为满足防疫需求,帮企业降低成本,百度智能云还为因防疫需要使用百度智能云天工物联网平台的企业提供一年完全免费的服务。
除此之外,百度提供了智能电费优化服务、AI 金融助力小微企业贷款等。这些都是帮助产业降本、增效的“全方位”手段,有力地促进了企业的复工复产。
在智能驾驶方面,百度 Apollo 也已联合新石器、智行者、阿波龙、白犀休、青岛悟牛科技、松灵机器人、博田等合作伙伴 100 多台车辆,覆盖消毒作业、物流运输、物资发放三大场景,落地武汉、北京、上海、深圳、广州等 17 个城市投入战疫。这些奔走在疫区一线的“小精灵”,为医护和患者构筑起了一道安全的防线。
AI 的技术之光
对未来越有信心,对现在越有耐心。
2019 年,中国人工智能专利申请量排名中,百度以 5712 件位列第一,并包揽了深度学习技术、语音识别、自然语言处理、智能驾驶等多个人工智能核心领域第一。
对百度而言,这家公司很早就参与到运用人工智能推动产业与科技革命的进程中,可以说最早进行了布局并建立了领先优势:
百度大脑已经实现了 AI 能力与应用场景融合创新,成为“软硬一体 AI 大生产平台”,打通 AI 产业化的全部流程,实现了 AI 技术的标准化、自动化和模块化;
百度大脑的基础底座———飞桨深度学习开源开放平台,是智能时代构建 AI 生态、加速产业智能化的核心基础;
百度智能云,更好地、软硬一体地、把数据、算法、算力等结合起来,赋能各行各业转型升级。
从产品到解决方案,从解决方案到开放生态,百度一步步地扩大自己的开放口子,把 AI 能力毫无保留的贡献出来。
不久前,《麻省理工科技评论》发表了题为“百度如何运用人工智能抗击疫情”的专题文章,以一个中国企业为典型样本介绍中国 AI 抗疫的经验。
百度交出的这份教科书般的 AI 疫情防控答卷,让人们感受到 AI 给这个行业带来的技术之光。在全球疫情的至暗时刻,AI 企业的抗疫实践和智能化成果,将会成为其他国家和人民的学习样本。
2018 年 11 月的百度世界大会上,在当天演讲的结尾中,李彦宏说出了一句让人印象深刻的话:“AI 会让世界变得更美好吗?百度的回答是,'Yes, AI do'.”