自动驾驶车辆(AV)集成了复杂的感知和定位组件,以创建其周围世界的模型,然后用于安全导航车辆。基于机器学习(ML)的模型被普遍用于这些组件中,以从嘈杂的传感器数据中提取物体信息。对这些组件的要求主要是为了实现尽可能高的准确性。由于现代汽车部署了许多传感器(视觉、雷达和激光雷达),实时处理所有的数据导致工程师做出权衡,这可能导致在某些驾驶情况下产生次优的系统。
由于缺乏对单个组件的精确要求,模块化测试和验证也变得具有挑战性。
目前行业中,有人提出了从顶级驾驶场景仿真中推导出安全AV行为所需的抽象世界模型精度的问题。这在计算上是很昂贵的,因为世界模型可能包含许多具有多个属性的对象,而且在仿真过程中,AV在每个时间步都会提取一个世界模型。
随着传感器和计算技术的发展,自动驾驶领域正在迅速发展。由于自动驾驶汽车必须在各种条件下运行,而且其系统实现的复杂性,建立自动驾驶汽车的安全性是一项具有挑战性的工作。AV中的定位和感知组件吸收了传感器和地图信息,以创建一个世界模型来捕捉AV周围的环境。然后,这个世界模型被传递给规划模块,以根据其目标创建一个安全的轨迹。基于视觉和激光雷达的感知组件越来越多地使用ML模型来实现二维和三维物体检测,很难推理出基于ML的感知的安全要求,因为不清楚不准确的感知是否(以及如何)会违反最高级别的安全目标。
在实践中,不同的AV组件的要求是由自动驾驶行业的专家驱动的,主要是基于经验。此外,这些要求是保守设置的,在不同的驾驶条件和操作设计领域(ODD)中是通用的。比如说,与稀疏的乡村道路相比,在繁忙的十字路口,定位组件应该相对更准确。
同样,感知组件在高速公路上应该有较高的召回率和精确度,但在行人区只需要较高的召回率就可以了。在理想的情况下,人们希望使用许多高分辨率(如2400万像素)的摄像头,以高帧率(如120FPS)运行,并采用多个高精度、复杂的DNN模型,尽可能准确地感知车辆周围的一切。由于AV在资源有限的平台上运行,系统设计者要进行权衡,设计一个足够精确的系统(例如,使用200-800万像素的相机,30FPS,以及优化/量化的DNN模型,精度稍低)。这种基于通用要求的解决方案可能会导致系统在某些情况下不太安全,因为这些情况下需要在视听设备周围的某些区域进行高精度的感知(例如,在十字路口从侧面快速接近的物体可能需要加强跟踪)。
硬件在环(HIL)和软件在环(SIL)仿真为AV系统提供有效的端到端测试方法。HIL测试使用汽车硬件、传感器和可能的执行器进行系统验证和确认。软件在环(SIL)仿真在设计阶段以及单元和集成测试中使用,其中单元或组件的输入是自动生成的或手工制作的,以仿真不同输入参数的有效性。
为了使AV系统的设计能够更好地利用资源以实现更安全的驾驶,行业中提出了一种仿真驱动的方法来计算安全AV行为的世界模型精度要求。