人工智能在过去两年被谷歌引爆,于是该领域的创业公司如雨后春笋般生长起来,有的做专用芯片,有的做算法,有的做机器人…人工智能到底是什么?是让机器代替人类完成重复的生产线劳动吗?这样理解为免太简单。人工智能绝对不只是让机器完成模仿,从而替代重复性工作,真正的人工智能需要机器经过训练和学习,接近或者超越人类的智能行为。
人工智能训练模型的时候,数据是最重要的因素,只有通过大数据训练,才能让训练的模型更接近于实际需求。比如,自动驾驶的模型训练,现在基本是靠自动驾驶汽车上路测试收集数据训练模型,路上的汽车只有采集到更多可能的场景,才能确保训练出的模型更接近实际路况。在人工智能训练中一般会遇到两个问题:第一,数据量不够如何训练模型?第二,数据量太大如何快速进行标注?
MathWorks产品市场经理赵志宏
通过模型产生数据训练神经网络
如果没有数据能做人工智能吗?这是很多初创公司的困惑。在笔者的概念里,正常的 AI 开发流程是,先采集数据,再训练模型。在最近的 MathWorks EXPO 大会上,MathWorks 产品市场经理赵志宏先生给出了一个不一样的答案,他表示,“数据、输出和模型是整个 AI 开发流程的一个步骤。如果开发者想做人工智能,又无法获取足够的数据,可以采用数字模型来产生数据。”比如:通过人工智能的方式来预测风力发电机的故障需要故障数据,而采集风力发电机的故障数据需要大量的时间和成本,几乎不现实。利用风力发电机在设计时已经建立好的 Simulink 模型,通过校正让这个模型非常接近风力发电机实际运行情况,然后在模型中制造故障,就可以很容易地产生出想要的故障数据,进而训练机器学习或者深度学习的神经网络。
赵志宏先生表示,“基于模型设计的优势是,它是在真正做出产品之前建好一个模型,这个模型与实际产品非常的接近,不管是从数字计算、行为计算产生的结果与真正的结果都非常接近。很多工程师在设计产品的时候已经把这个模型建好了,在这个模型上加入故障情况就很容易产生故障数据,这比在实际设备上产生的故障要容易很多。因此,可以进行故障预测和维护。”
通过深度学习对大数据进行标注
随着传感器的大量采用,数据量进入洪荒时代,给人工智能进行特征标记带来困难,这时候可以采用深度学习进行标记。赵志宏先生解释,“深度学习的特点是不需要人工手动找出特征值,系统可以自动从数据里提取特征值。MATLAB 提供辅助自动标记的工具和功能。著名的汽车配件公司 AUTOLIV 就在 MATLAB 提供的功能上开发了 LiDAR 三维点云语义分割的算法来进行自动数据标注。它对 LiDAR 三维点云的每一点进行自动标注,把这个点聚类成一个目标模型,然后再把目标具体代表的实物辨别出来。”
以膨化食品智能检测为例,研究人员可以在用户咬食品的时候提取特征,用咬合声音和咬合力度衡量食品的松脆度,有了这两个特征,还需要开发一个机器学习的分类器,而 MATLAB 提供了分类学习器。开发者通过这个工具不需要一个一个去试各种分类器的算法,使用 MATLAB 提供的 APP 去一次性尝试所有算法。开始运行 APP 后,用户选好数据和需要训练的分类器,然后进行训练。在训练过程中,用户可以看到每个分类器的整体结果,选择精确度最高的一个,然后进行更多的调查和研究。如果用户没有研究过 AI,可以用 MATLAB 提供的 APP 进行学习,去尝试所有机器学习的算法。
在 MATLAB 里面做深度学习难吗?用赵志宏先生的话说,只需要写 5 行的 MATLAB 代码,用户就可以建出一个能够识别食品的网络。笔者已经多年没接触过 MATLAB 了,所以无从考证,工程师朋友们如果需要可以进行尝试。
和开源代码如何协作?
现在市面上的开源非常热,工程师们可以在开源社区快速获得需要的代码,在人工智能领域也有很多开源资源,作为封闭资源的 MATLAB 和开源代码相比更新速度可能会较慢,而且加上是收费模式,工程师们也担心两者的融合问题。当笔者问到这个问题的时候,赵志宏先生解释,“开源代码背后有很多的开发人员啊,为开源代码做贡献,我们也有自己的开发团队。我们并不把开源代码和 MATLAB 定义为严格的竞争关系,实际上我们各有特点和长处,有时候我们是可以与开源代码共用。有一些开源代码可以在 MATLAB 里面运行或者直接调用,我们在共同为科技进步做贡献。我们虽然是付费软件,但是提供的不仅是工具,还有很多的服务。”
“当用户使用 MATLAB 时遇到问题,我们后面有很强的技术支持团队帮用户解决这些问题。另外,我们的工具不仅是针对某一功能产生正确的结果,我们还考虑把这个功能做得非常的容易使用。比如针对 AI 应用,我们把界面做得非常适合该专业领域,而且兼顾让用户感觉在使用熟悉的 MATLAB 或者 Simulink 的界面。这是我们的优势,如果用户在 MATLAB 或者 Simulink 中增加新功能,学习门槛不会很高,容易上手设计。除了提供工具,我们还给用户提供了很多便利,这是从开源工具中所得不到的东西。”赵志宏先生补充。
与非网原创内容,未经允许,不得转载!