电气化之后智能化,汽车的智能化怎么也脱不开人工智能AI,无 AI 不智能这是大家所有人的共识了。但,到底AI是什么?它在汽车行业应用的发展是怎么样的?大家竞相宣传和讨论的端到端到底什么?它和之前其他AI算法有什么区别?此类问题却常让大家竞相莫名围观吃瓜。
所以,本文将结合AI在汽车行业的应用和发展,总结下
等 AI 人工智能 101概念内容,帮助大家了解AI,以及它在智能汽车中的应用和发展,也方便理解前热门的各类概念和事件。
人工智能(Artificial Intelligence, AI)人工智能是一门在计算机中模拟智能行为的科学。它使计算机能够展现出类似人类的行为特征,包括知识、推理、常识、学习和决策能力。
他们的核心就是多层的神经网络(Neural Networks),神经网络是一种计算机架构,它模拟了人脑的结构,AI/机器学习程序可以在此基础上构建。
神经网络由相互连接的节点组成,这些节点可以解决更复杂的问题并进行学习,类似于人脑中的神经元,每个节点用权重,偏差等参数去计算传导到下一步,产生结果。所以,参数等成了当前模型的一个重要参考指标,理论上参数越多代表模型学习更完善,产生结果更真实,在今年英伟达的 GTC 上,Jensen 透露了一条关于当今最大模型的看似有趣的消息,称“当今最大的模型是 1.8T 参数“。
机器学习(Machine Learning)机器学习是人工智能的一个分支,它使计算机能够在没有明确编程的情况下从数据中学习。例如,计算机可以通过数据学习识别狗或猫等对象。所以智能驾驶最开始的Mobileye就是采用视觉机器学习,让车辆识别前方车辆,行人自行车等VRU,前方道路线,交通标志等,这样实现了AEB,LCC车道保持等功能。
传统的机器学习方法需要大量的人力来训练软件。例如,在自动驾驶施工道路的障碍物识别中,需要做以下操作:
- 手动标记数十万张施工道路以及相关标志的图像。让机器学习算法处理这些图像。用一组未知或者叫泛化的图像上测试这些算法。找出某些结果不准确的原因。通过标注新图像来改进数据集,以提高结果准确性。
这个过程称为有监督学习。在有监督学习中,只有广泛且充分多样化的数据是准确率的前提。例如,该算法可能可以准确识别放置非常正面的施工道路牌,但不能准确识别斜向放置的施工道路牌,因为训练数据集包含更多正面施工道路图像。
在这种情况下,那么就需要标记更多的斜向放置的施工道路牌图像并再次训练机器学习模型。国内汽车智能驾驶大概在2019年左右,都在通过大量的人工数据采集和标注的方式,疯狂通过这种方式训练学习模型,最后在2019年特斯拉推出其算法之后,所有训练数据和算法推倒重来。
深度学习(Deep Learning):深度学习是机器学习的一个子集,深度学习拥有更多的分层的层级结构。例如,在识别施工道路牌的例子中,不同的层可能对应于给定施工道路牌的关键特征。所以,深度学习能够高效处理非结构化数据,发现数据之间隐藏的关系和模式,它能够做到无监督学习Unsupervised learning,强化学习Reinforcement learning (RL)。例如施工道路牌,它能够识别逆光,残缺甚至倒地的施工道路牌。
强化学习(RL),可以训练软件做出决策,以实现最佳结果。它模仿了人类为实现目标所采取的反复试验的学习过程。有助于实现目标的软件操作会得到加强,而偏离目标的操作将被忽略。ChatGPT刚推出那会儿,Open AI就对使用RL做了简单介绍,RL 算法在处理数据时使用奖惩模式。这些算法从每个操作的反馈中学习,并自行发现实现最终结果的最佳处理路径。此类算法还能够实现延迟满足。最好的整体策略可能需要短期的牺牲,因此其发现的最佳方法可能包括一些惩罚,或在过程中有一些迂回。RL 是一种强大的方法,可以帮助人工智能(AI)系统在看不见的环境中实现最佳结果。当人工智能算法可以无监督和自我强化学习,对于人工智能最重要的事情就剩下:
大量高质量的数据,在大量高质量数据上训练深度学习算法时,可以获得更好的效果。输入数据集中的异常值或错误会显著影响深度学习过程。例如,在我们的动物图像示例中,如果数据集中意外引入了非动物图像,深度学习模型可能会将飞机归类为海龟。为避免此类错误,必须先清理和处理大量数据,然后再训练深度学习模型。输入数据预处理需要大量的数据存储容量。
强大的算力芯片中心,深度学习算法是计算密集型的,需要具有足够计算能力的基础设施才能正常运行。否则,它们需要很长的时间来处理结果。
能源,数据存储处理以及计算消耗的能源成为继物理做功之后又一重要消耗,这也是为什么最近Open AI Sam奥特曼多次不同场合表示对核电感兴趣。
在此类人工智能算法的背景下,理想条件下,只需要喂养高质量数据,在强大算力,和丰富能源供给的条件下 AI 可以给人类带来无穷的应用。
端到端方法( End-to-End Approach)在2023年,特斯拉开始宣布端到端的智能驾驶算法,他所谓的端到端方法是一个单一模型,它直接从视觉输入到输出驾驶策略,如转向和制动。这种方法减少了人工编码的需求,并可能有助于解决迄今为止限制自动驾驶进展的边缘情况。
熟悉智能驾驶应该大概都了解,智能驾驶几要素,感知,定位,规划,控制等流程。目前智能驾驶算法组合大概有三种方式:
-
- 感知采用AI神经网络+规则控制
-
- 各个区块都采用神经网络
-
- 端到端融合神经网络
特斯拉算是从第一个走到了第三步。
其实目前大都在第一步和第二步此类的复合解决方案,它可以使用AI处理不同的子系统或输入。然后,这个解决方案可以与组合不同的代码一起使用,或者覆盖其他规则/因素(例如,确保遵守某些交通法规)。尽管有争议,这种复合方法是否会限制AI在难以理解的长尾边缘情况场景中所能达到的程度,但它:
很有效率(例如,ChatGPT不需要使用AI训练来解决基本数学问题,它可以直接查询计算器模块),可能
更容易理解/验证(这在驾驶中尤其重要,因为AI的错误可能是致命的)。
仍然使用高级AI技术,如Transformer,Occupancy等等。
这些概念为理解AI在自动驾驶汽车中的应用提供了基础,并解释了不同AI方法如何影响技术的开发和实施,目前很难说谁好谁不好。
其他汽车人工智能应用
其实,语音算是在智能汽车上应用最广和最快的,毕竟人工智能发展最快的就是语音和文本模型,例如ChatGPT 此类LLM大语言模型激发了智能驾驶端到端,基本 AI 原理雷同,目前没有说主机厂自研语音算法的,主要是这个产业已经发展完备,集中头部供应商提供解决方案。当然,智能驾驶也应该快速走向这个过程,头部供应商提供解决方案,毕竟最终路径和技术趋同统一,大家都没有必要重复造轮子了。
*未经准许严禁转载和摘录-参考资料:
Can new AI technology help accelerate AV deployment?- 高盛