作者 | 章涟漪
今年下半年,图森未来会发布一个“数据集”,至少是百小时级别的、干净的。
如何做负责任的自动驾驶。
7月27日,首届AI DAY上,自动驾驶卡车公司图森未来主要就讲了这一件事。
在图森未来CTO王乃岩看来,过去3至4年里,辅助驾驶系统在乘用车领域飞速发展,功能不断增加,但依然是L2级辅助驾驶产品,无法突破至L3,乃至L4级自动驾驶。
“这其中很大原因在于,L3和L4从功能上来说可能并不比L2更复杂,但可靠性上是质的飞跃,因此辅助驾驶产品开发方法论,不适用于L3级及以上产品”。王乃岩表示,图森未来基于更高阶自动驾驶设计了一整套全冗余架构。
那么,图森未来自动驾驶系统方案具体如何设计?从技术研发到大规模量产落地还需要多久?
01、从车辆到算法,全冗余架构解读
全冗余,这是图森未来L4级自动驾驶系统的最大特点之一。
根据王乃岩介绍,图森未来设计了一套全冗余的架构,包括了最底层车辆,到上层系统、传感器,以及最上层算法模块。
车辆方面,图森未来使用车辆配备了冗余的转向系统和制动系统,来保证出现单路失效状况时,车辆仍然能够在其控制之下。
实现方式是,在系统设计层面,图森未来设定了两套完全独立的系统,即主系统和备系统。其中主系统L4驾驶的“主力”,使用的是高算力平台和全套传感器,可以实现完整的L4驾驶的功能。
与此同时,图森未来还配置了与之完全独立的备系统,其使用了低算力,但可靠性很高的车规级芯片和比较有限的传感器。备系统只需要完成在主系统失效时候的降级功能。
两套系统都实现了完全独立的供电,可减少因为供电导致供电故障的可能,进一步提升了系统的可靠性。
在系统运行模式方面,除了正常的L4级别自动驾驶外,图森未来还设计了两种最小风险状态,分别是车辆侧后方感知及转向系统可用时,可以实现应急车道靠边停车;在一些非常极端情况下,比如说彻底失去了后向和侧向感知时,设计了相应的在当前车道安全刹停等待救援模式。
传感器冗余方面,图森未来设计原则是使用全波段的电磁波感知,使用了相机、激光雷达和毫米波雷达三种传感器,基于他们不同的特点和优劣势,图森未来设计了一套使用全类型传感器、高可靠冗余方案。
算法冗余是图森未来非常关注的领域。王乃岩称,算法设计中最关键的点是如何处理失效问题。图森未来在设计算法架构时最核心的思想是:假设没有一个传感器是永远可靠的,没有一个算法不会犯错。
基于这样的一个想法,图森未来车上运行的算法分成了两大类:Data-Driven算法和Principle-Based算法。前者为数据驱动算法,它的原理是使用大模型驱动AI算法,来实现像物体识别、车辆识别,以及包括动态道路的环境感知等;后者的特点是能够对问题和过程进行精确建模。
王乃岩展开介绍称,算法架构设计的第一个模块是感知模块,这是冗余设计最困难的模块,因为在该模块中,图森未来大量使用了数据驱动算法。
基于此,图森未来在感知模块实现了三重冗余。一方面,其把三种感知方法分为两大类:基于识别的物体感知和基于场景的障碍物感知。由于两者原理不同、假设不同,这就意味着图森未来已经实现了一套冗余。
与此同时,在基于识别的物体感知中,又使用了两套完全独立的系统去分别使用激光雷达和相机在第一阶段生成候选框和候选物体,这两套传感器及算法都是完全独立的。
在基于场景的障碍物感知方面,使用的也是层次化或者说漏斗式设计方案,去逐层提高识别准确率,其中最底层,图森未来基于激光雷达几何性很强的特征,去初筛所有可能存在的通用障碍物,在此之上使用高精度地图和相机,去实现准确率的逐步提升,以满足下游规控算法需求。
这两套系统一起提升了整个感知模块的冗余程度。
除了冗余挑战之外,卡车场景还有一个天然的挑战:远距离感知。由于卡车的载重、车身长度等因素,导致其相比于乘用车需要更长的紧急刹停距离和完整变道距离,这对算法的性能和可靠性都提出了很大的挑战。王乃岩称,根据其经验,卡车的车道感知距离最好是400米至500米,乃至更远距离。
02、从感知到产品,实践经验分享
在王乃岩演讲过程中,不断有图森未来技术专家基于实践,针对感知模块、定位模块、预测规划和控制、端到端仿真、数据自动标注和产品六个方面进行了分享。
感知模块方面,正如前面所言,图森未来L4级自动驾驶方案需要做到感知算法的冗余,这要求视觉能够独立感知周围环境。以3D目标检测为例,其所要做的是,通过环视摄像头来获取物体在3D空间下的大小位置和姿态信息。
目前主流3D目标检测的方式是BEV方法。但如果直接应用到场景中,会遇到两个问题:一是长距离感知需要构建长距离BEV空间,这会消耗大量的计算和空间资源;二是算法设计没有考虑到相机之间互补冗余,如果出现漏检,会造成整个系统消失。
针对上述两大问题,图森未来给出的方法是:基于物体多视觉的3D检测框架,在环视镜头输入后,会对每个相机进行2D检测,并融合各视角信息,最终形成3D检测结果。在实现相对鲁棒的同时,也能保证算法内部的冗余。
定位模块方面,作为无人驾驶汽车模块中非常重要部分,它对于可靠性的要求比感知模块更高。毕竟如果在300米范围内漏检了一辆车,可能不会立即导致事故,但如果定位算法偏差超过半米可能直接冲出车道,碰撞障碍物。
因此,在定位算法里,对于精度和鲁棒性的要求远高于其他模块。基于此,图森未来选择了多传感器融合方案,包括相机、激光雷达和组合导航。
预测规划和控制模块方面,图森未来称,由于卡车不是单体结构,而是由两部分组成,会导致出现非常复杂的动力学和运动学模型;同时,因重量和尺寸原因,卡车只有非常有限的加减速性能。
为应对上述挑战,业界流行做法是,将对其他车辆预测、自车决策、自车控制,以及自车轨迹横向和纵向规划五个部分分别取优化,这样的好处是整个系统比较可控,且每个模块可以独立完成自己目标,但劣势是分块的系统难以去实现统一优化目标服务于一辆车。
业界第二代的做法是实现横纵联合规划,即把整个横向规划和纵向规划耦合在一起,变成同样一个模块。而图森的做法是“一步到位”,实现五个部分的联合优化,实现预测为决策服务。
端到端仿真模块,常见的仿真是做规控的仿真,在规控仿真中只运行规控模块和底层车辆模型,它对于低级别自动驾驶系统可行,但图森未来的感知系统及规控系统间有非常复杂的耦合关系,简单的仿真测试不足以满足。
为此,图森未来在仿真测试中采用到了端到端的仿真测试框架,将整个算法系统作为黑盒进行测试,实现更高级别的集成测试,也是HIL测试的基础。
仿真测试系统是怎么构成的呢?首先,它是一个离线闭环系统,目的是测试我们整套算法系统,同时也支持多场景测试,包括真实场景导入仿真场景库后测试和人工编辑长尾问题测试。
在工程上,端到端仿真系统架构主要分为两部分:有仿真引擎及仿真底层物理世界引擎和车辆动力学模型构成的仿真系统;另一部分是由运行整套算法自驾的域控,以及一些虚拟车辆控制单元组成的测试环境。两套系统通过传感器的输出,以及一些看的消息进行通讯。可以通过回放路测场景和虚拟引擎渲染方案实现,但两者都存有一些弊端。
为此,图森未来采用了神经渲染的方法。即,基于录采数据重建3D场景,并在相机中渲染出来,而对于路上遇到的各种交通参与物,只需要传感器扫到他们,再离线通过一套处理将其加入仿真场景库。
据介绍,图森未来循环运行所有的离线仿真场景只需要不到30分钟,每小时运行成本小于10元。
此外,数据自动标注模块,图森未来的核心思想是在一个序列里面,一旦检测到一帧会使用跟踪算法,把整个序列上的物体关于它的点源全部找到,然后堆叠起来,以保证比较高的效率;产品模块,图森未来的主要工作是用户研究和需求挖掘、需求定义、需求验收和ODD定义。
03、实现自动驾驶数据很重要,下半年会分享数据集
在详细介绍完技术情况后,图森未来还组织了一场圆桌论坛,去谈论从限定区域自动驾驶到全场景L5级别自动驾驶需要多久。
上海人工智能实验室青年科学家李弘扬指出,作为学术界,“如何实现L4、L5级自动驾驶”是他们非常关心的问题。其中,大模型是非常重要的技术。
至于“什么是大模型”,李弘扬也坦言,怎么定义其实大家都没有想得很清楚。但可以换个方式思考,大模型应该是什么样子。在他看来,它应该是个感知、决策相关的,追求自动驾驶稳定、安全、可靠的。从这个角度思考,大模型至少需要有预测环节的能力,这背后需要海量数据的支持。
“每家车企都在说自己有海量数据,但这其实和我们关系不大,我们要的是公开演讲,需要能够爬到的数据”。李弘扬称,但如果没有海量、高质量的数据,无法实现大模型。这意味着,想要实现L4、L5级自动驾驶,需要先建立拥有海量数据的自动驾驶大模型。
对于李弘扬的观点,复旦大学工厂与应用技术研究院青年研究员丁文超部分认同。他也认为,自动驾驶实现需要海量数据。但车企并非不愿意开放数据,而是不知道怎么处理。所以,如何把数据规整出来,比如时间戳标定同步,是当下需要解决的问题,这也是制约真正的自动驾驶大模型建立、实现的因素。
“关于数据,主机厂一直希望能够得到咱们的诉求,或者说一起合作去做一些事情。”福田汽车智能驾驶研究中心副主任金大鹏也表示,愿意支持学界、自动驾驶公司去做更多数据的工作。“我们有大量的需求和数据,能够给到学术界和自动驾驶公司使用,以持续迭代。”
同时,他也就主机厂的需求进行了探讨。他指出,这些年主机厂也有了思想转换,大家更多的不去想L3、L4、L5的问题,而是思考如何满足客户的需求,当然是在符合法规的前提下。比如,用户需要降低长距离行驶疲劳、降低司机成本。作为主机厂就会优先考虑怎么解决这些诉求,而不是局限在级别定义里。
对于上述嘉宾们提到的问题,王乃岩深表认同。他认为,数据问题确实是当下非常大的挑战,特别是在数据清洗这一块,不止学术界,企业内部也面临这样的问题。
不过,在活动最后,王乃岩放出彩蛋表示,今年下半年,图森未来计划发布一个“数据集”,可能没有上千小时那么大,但是至少是百小时级别的,并且很干净,会是完整环视的、多视觉的,包括商用车、甚至乘用车,给学术界使用。
此次AI DAY,是图森未来宣布业务优化后首次对外正式活动。今年5月中旬,图森未来宣布业务重组计划,会减少美国业务,进一步扩招中国团队;6月28日图森未来再发公告,称正在探索美国业务的战略替代方案,包括可能出售美国业务,并更加重视亚太地区和全球其他主要市场。
一直以来,图森未来被认为是自动驾驶卡车领域的“技术”担当,此前因为内外部问题,一度陷入“混乱”。此次在上海举办AI DAY,为再次对外表达回归技术、回归中国的决心。