在企业、行业应用AI时,我们一般都会说需要具备三大条件:算力、算法、数据。而企业在获取这三大要素过程中的难题,也被称为AI的“三座大山”。
但可能很多人不知道,除了“三座大山”之外,还有一个困扰企业应用AI的难题,叫做——知识。我们总是说,AI需要与行业Know-How结合,需要与行业特性相融,需要掌握帮助企业降本增效的具体方法。这些提法最终都指向AI需要与行业知识结合,才能在商业世界中产生真正的价值。
或许可以说,知识是企业与AI之间的轴承和连接器,是整个产业智能化系统中必不可少的一部分。
但也正由于“知识”这个概念的特殊性和差异化,AI与行业知识结合是AI产业化命题中最抽象,也最难标准化的一项。可以说,摆在企业应用AI面前的除了“三座大山”,还有一道“知识之墙”。
近两年,AI产业的一大变化就是越来越多的研究力量、产品力量,开始向“知识”这个神秘且复杂的领域进发,尝试在这道AI之墙上打开一扇门。
而如果你对AI感兴趣,应该会知道其中一个代表性方案:2020年9月,在华为全联接2020上,华为云发布了知识计算解决方案,这被称为业界首个全生命周期知识计算解决方案,填补了一片非常重要的产业空白。
时至如今,知识计算的落地案例不断丰富,这个产业方向背后的故事也被更多披露出来。我们希望跟大家一起探索这样一个故事:面对抽象莫测的知识,繁杂多元的行业,知识计算究竟是如何聚沙成塔,完成这个特殊领域的产业落地与标准化方案推出的。
有这么一群人,当他们面向AI产业的“知识之墙”时,没有选择叹息或者回头,而是要打开一扇门。
知识墙:AI落地的巨大挑战
从上世纪70年代专家系统兴起以来,AI的商业化需求始终与行业知识、专业知识紧密相连。但直到今天,行业知识智能化这个根本需求也没有得到很好满足。这也直接导致了AI在传统行业、实体经济中的渗透率始终难以提升。
事实上,AI与行业知识的结合经历了漫长的产业化探索。从逻辑机到专家系统,再到目前依旧盛行的行业知识图谱,种种方案都存在根本性的问题。比如说,传统的企业知识图谱方案缺乏标准化、统一的构建流程。每个方案差异化巨大,耗时漫长,并且缺乏可验证的应用价值检测。企业既缺乏动力去推动,也很难在长期使用中获得持续价值。
另一方面,行业知识图谱主要还是以一个数据集的方式呈现,价值在于查找答案,但缺乏自动化、智能化的能力去解决问题。企业真正需要的往往不是去查询知识,而是让知识系统给出进一步的运算结果。这就需要AI+知识系统拥有“可运行”“可计算”的能力。
因此,真正想要让行业知识与AI结合,成为各行业、企业能够普遍应用的产业底座,就需要一套整体的方法、技术、工具,帮助解决企业从获取知识、转化知识、获得智能化价值的全流程问题。
而这里面就涉及几个方面的技术难点。
首先,行业知识的真正存在形式,是行业技巧、专家经验,以及大量口传耳授的心得。这些内容之间不一定有着紧密关联,也缺乏统一逻辑。但如果想要让AI拥有行业经验,就必须把这些碎片化、非结构化的内容转化为数学语言,变成AI可以听懂、能够践行的数据化路径。
其次,AI应用行业知识来创造价值本身还是新生事物。这里涉及大量实践性挑战,比如模型泛化能力、模型可解释性等问题。想要在知识领域获得突破,还需要一系列AI模型本身的优化与升级。
此外,AI与行业知识的结合落地,还受到行业场景、组织流程、企业生产方式等一系列外在的、非技术因素的条件制约。AI+行业知识能否落地,很大程度上取决于行业生态本身的智能化升级空间与技术获取能力。
知识的挑战、AI的挑战、行业的挑战,三大难题让这道“知识墙”难以突破。而就是面对这样一个现状,华为云的AI人决定试一试。
开门者:推开知识计算的新路
2018年,袁晶博士加入华为云。袁晶博士是一名在AI学术界和产业界的跨界专家,曾在顶级国际期刊会议上发表80余篇论文,并多次获得最佳论文奖项。2020年,袁晶博士获得了ACM SIGSPATIAL十年影响力论文荣誉奖;2021年,他获得了SIGKDD China 时间验证奖(Test of Time Award)。
在云计算产业中,华为云有一个鲜明的标签,就是一手抓新技术,一手抓商业落地。以二者之间的强联接作为一大产业特色,这也是华为云吸引袁晶博士的一个特点。
来到华为云之后,袁晶博士同时负责AI算法、技术研究创新团队和AI面向行业的产品商业化团队,这让他和他的团队有意识地去审视行业真正需要的是什么,从而全流程参与AI技术的落地闭环。
就是这样一个具有突破以往领域限制的自由度,让袁晶博士团队看到了行业知识与AI结合的必要性与紧迫性。相比于传统的行业知识突破、数据获取等碎片化服务,团队认为当务之急是构建整体性的、囊括一系列工具与能力、能够实现全周期行业知识与AI结合的方案。
在这一过程中,袁晶博士与团队在NLP、多模态等领域的前沿技术视野与能力成为关键推力之一,构成了“AI+行业知识”中“AI技术”的那一面。例如在2021年,袁晶博士团队就有多篇论文被ACL 2021,CVPR2021等顶会接收,并且获得CCKS篇章级事件抽取技术评测冠军、国际权威WSDM CUP大赛金牌等。
另一方面,华为云已经在多个行业中实践了超过600个AI项目,从而积累了大量的行业需求、行业经验,这些实践经验构成了“知识”的那一面。
“AI技术”和“知识”二者相遇,让华为云有了推动一个全新方向的可能性。虽然前途依旧充满挑战,但至少有了打破僵局的机会。
一系列的研发、产品化与行业融合实践之后,“知识计算”解决方案终于在2020年正式发布,共包括四个方面的技术能力与产品服务:
首先是知识获取,通过对多模态的行业知识,比如生产系统中的机理模型、专家经验进行解析和处理,完成由现实经验向数学模型转化的第一步。
之后是知识建模,根据业务场景的具体需求,向客户提供方便快捷的知识建模工具,比如流水线式的自动化知识图谱,极大缩短行业知识图谱的构建时间,并且实现图谱的自动更新。
继而是知识管理,让用户获得行业知识的存储和高性能查询能力,并且实现自动化更新、冲突管理等功能。
最后在知识应用层面,华为云可以提供知识搜索、可视化分析、知识推荐等基础能力,以及智能对话、预测分析、知识推理等高级能力。这些能力接口将华为云多元化的技术向企业开放,突破了企业应用知识的最后一公里。
我们可以发现,袁晶博士在华为云推动的全新方向——知识计算,并不是一项单一产品或服务,而是一个关于全生命周期完成AI与行业知识融合的理念、方法,以及由此产生的一系列工具、能力。这些理念、能力、工具与具体行业、具体案例进行结合,获得了各行业客户、合作伙伴的深度共建,最终才凝结出全周期、可生长、具有行业特性的华为云知识计算解决方案。
在知识计算筑造和推广的过程中,相关团队非常重视其在不同行业、不同场景中的差异化表现与能力局限。只有承认行业差异,才能尊重行业知识,逐个攻破行业应用AI的挑战。
或许可以说,知识计算并不是一条捷径,而是一个AI落地趋势下的必经之路。这条路虽然并不好走,但总算是已经有了“开门人”。
冲锋时:面向行业,AI突围
或许,知识计算的价值听起来会感觉有点过分抽象和模糊。这是因为整套解决方案涉及的技术领域众多,总结起来较为理论化。确实,想要理解知识计算的价值,只有进入行业场景中这一个选择。因为知识计算本就是为行业而生,也应该在行业中进行理解。
例如,在石油勘探的一个重要环节“测井”中,地球物理学家需通过对电阻率、自然电位、声波等综合信息的研究进行油气层识别。但要对数千米以下的地下构造和油藏特征进行准确判断还是非常困难的,这需要对大量信息的综合计算,还需要经验丰富的专家准确分析才能做到。
以往时候,可能需要好几个老专家几个月时间完成的测井解释工作,在知识计算帮助下可以在不到一星期内完成,而且油气层识别准确率达到了专家的水平。这就是知识计算的必要性,它将专家的碎片化、经验化知识转化为可计算的模型,并将其迁移到更多工作的智能化处理中。目前,中石油集团已经基于华为云知识计算打造了全球首个油气领域人工智能平台,为我国油气行业的创新发展提供了智能化的驱动引擎和开发生态。
当然,在探索石油测井解释的知识计算解决方案时,团队也经历了不少交流中的磨合期。比如在华为云的AI专家给石油专家讲解知识图谱时,很自然地会举一个在知识图谱领域常用的例子:比如“刘德华”作为一个“实体”、他的妻子是“朱丽倩”、他们建立了“夫妻”的“关系”。但油气领域的专家却对明星的例子非常不解——他们面对的是地层、油井这些数据,娱乐圈的例子好像和油气一点关系都没有。但也正是在这种从不解到了解、相互磨合和沟通的过程中,知识计算逐渐真正与行业结合了起来。
在知识计算的发展历程中,华为云知识计算团队真实意识到了各行业对相关能力的远见和渴求。在一些必然磨合之上,是华为云与行业客户之间对于知识计算的高度认同与惺惺相惜。在疫情爆发之后,袁晶团队与浙江大学计算机学院、浙江大学药学院的师生建立了联系和合作。在第一次线上沟通中就一拍即合,决定围绕病毒、基因、蛋白等已有知识库和科研文献构建新冠科研领域知识图谱,用来帮助相关专家提升病毒家族数据分析、基因蛋白等分析的效率。在疫情疾风暴雨一般袭来时,华为云的AI专家与高校专家第一时间投身到了智能抗疫的前线。这可能是知识计算值得被记忆的另一面。
真正身在一线的企业,对知识计算的价值敏感性往往远超于大众想象。2020年,袁晶博士团队的一位成员在HDC.Cloud大会期间做了一个企业知识图谱的直播内容,同时发布了一篇技术文章。这篇文章被一汽集团董事长看到,马上指示信息技术人员与团队进行深入交流。通过线上、现场的多次沟通,最终孵化了一汽的知识计算智能维修项目,为上千维修技师提供智能化的维修助手,极大提升维修技师在定位问题和解决问题上的效率。通过使用一汽知识计算平台,一汽红旗某4S店的一次性修复率提升了4%,客户维修等待时间下降了23%,厂家支持介入率下降了30%,维修技师的培养时间缩短了30%,为汽车维修带来了全方位的价值提升。
各个行业、各个企业都可以基于华为云知识计算解决方案,打造属于自己的知识计算平台,并将知识计算能力应用于研发、生产、运营、销售、售后服务等企业核心流程。在煤炭行业,河南鑫磊集团采用华为云知识计算解决方案后,炼焦业务实现了“降本提质”的双重效果:生产效率方面,传统方式原料煤质量检测需要1天以上,现在配煤师只需要将配比输入系统就会准确预测焦炭指标,预测准确率都在95%以上;经济效益方面,以河南鑫磊集团每年130万吨的产量来推算,每年至少可节省成本约3000万。
AI赋能千行百业
在交通行业,交通管理部门可以运用知识计算解决方案,完成城市路口和区域的通行优化。目前,该方案已在深圳300多个路口进行了验证,拥堵指数下降了8%。未来,知识计算将进一步运用到道路、机场、地铁等立体化的交通治理。
在政务领域,知识计算解决方案能够协助政府实现事件预警、处置措施推荐等功能。如此前在某城市12345热线感知系统中,A通过热线投诉小区邻居噪音扰民问题,B在同一小区投诉小区垃圾比较多,这看似没有关联的两个问题,用知识计算引擎去分析问题产生的根因,发现其实关键问题是这个区域有典型的群租现象,再通过智能分拨关联相关处理部门,利用机器人引擎推进流程和运转,通过数据分析研判、人机协同处置的闭环全流程,将“问题解决在开口之前”,极大提升政务服务满意度。
石油、汽车、医疗、化纤、煤焦化、钢铁、交通,政务…种种事关国计民生的重点行业,都可以看到知识计算的落地案例、发展趋势与价值突围。在AI与知识的深入融合中,行业可以真正面向AI时代发起冲锋。
而这些可能性的开始,在于知识计算这扇大门的推开。这扇门,并不仅仅是一种技术创新或者产品打造,而是一种方向和衔接。它把广泛存在的行业知识智能化需求与AI执行力联接到一起,不再让行业面对智能化时感觉茫然无措或者与我无关。
袁晶博士一直强调,知识计算是理念,是方法,是一系列像乐高积木一样的工具。这些乐高确实需要企业用户自己拼装,但零件、规则和方法都已具备。企业可以用最大的效率、最简单的方式完成适合自己的组装,把知识变成智能时代的生产力。
对于AI产业来说,知识计算是一扇全新的探索之门;但对于无数行业、无数企业来说,每个知识计算解决方案都是一扇独一无二的门。推开它,也许就是新的时代。
据悉,今年11月11-12日在杭州举办的AIIA产业峰会中,中国人工智能产业发展联盟、华为、中国信息通信研究院三方将联合发布知识计算白皮书。届时学界和产业界大咖将齐聚一堂,共话知识计算如何赋能新一代人工智能与企业生产领域、流程环节深度融合,引领产业向价值链高端迈进,加速推进行业智能化升级。