作者 | 万博
对于全球自动驾驶赛道来说,即将过去的2022年,是极不平凡的一年。在这一年中,行业长久以来在技术路线和量产落地上的争论,终于迎来了答案。
一方面,自动驾驶跨越式路线和渐进式路线之争,胜出之道开始显露,此前坚持L4级高阶自动驾驶路线的玩家,要么如同Argo AI一样陷入裁员危机甚至山穷水尽关门大吉,要么纷纷降维开发L2级量产智能驾驶方案以求早日造血。
另一方面,围绕智能驾驶量产落地上,此前将高精地图视作命门的玩家,在成本、政策等多种因素之下,纷纷开始转向“重感知”策略。
能看到的是,在不断拉扯下,自动驾驶公司的选择开始趋同,“渐进式”、“重感知”的方案,正在成为自动驾驶落地的最优解。
同时,自动驾驶赛道也在今年迎来一个里程碑式的进展:高阶智能辅助驾驶,终于开进城市道路。率先叩门的,是特斯拉、毫末和小鹏。
与其他家相比,毫末智行在城市领航驾驶落地节奏上,显得更有信心,宣布未来将落地百城、搭载数量超百万辆。
宣布这样有信心的目标,毫末智行底气从何而来?
城市NOH落地百城,搭载数量超百万辆
2022年被认为是城市高阶智能驾驶元年,国内第一梯队玩家集中发布城市领航驾驶功能。相比于依靠高精地图在试点城市小规模示范性运营的玩家,毫末智行是唯一提出能快速实现多城市、大规模量产的选手。
在今年8月的成都车展上,毫末智行率先推出城市高阶驾驶辅助功能NOH(Navigation on HPilot),首搭车型是长城魏牌摩卡DHT-PHEV激光雷达版,预计将在今年第四季度上车交付。
具体功能来看,其城市NOH对开放道路的典型行驶场景均有覆盖,例如智能识别红绿灯、主动变道、无保护路口转向、主动躲闪静/动态障碍物等等。
NOH还在不断进化迭代中,毫末智行近期表示,其智慧交通处理功能即将发布。据悉,这项功能可根据转向灯和刹车灯,提前预知前车意图,做出更类似人类驾驶的操作。
城市NOH快速迭代背后,得益于毫末智行较高的研发效率和场景落地能力。
官方信息显示,截至到目前,毫末智行乘用车辅助驾驶解决方案HPilot,自2020年发布以来已经进行6次OTA升级,版本迭代到HPilot3.0,高阶智能驾驶能力已经可以覆盖高速、泊车和城市开放道路三大场景。
在量产落地方面,截至今年10月,HPilot已经在10余款乘用车上实现量产搭载,预计到今年年底,这个数字将上升至34款车型,届时在长城旗下80%的车型中,都会搭载HPilot。值得一提的是,第一批300台摩卡PHEV(Coffee 01)已在上海港整装完毕,将在德国市场交付首批用户。未来,HPilot也将为海外用户带来智能驾驶体验。
毫末智行还披露,用户辅助驾驶行驶里程已经突破2000万公里,这一数字在国内的自动驾驶公司中可以说是遥遥领先。
此外,毫末智行发布的国内首个数据智能体系MANA,已经基本完成了数据的闭环处理,截至今年9月,MANA的学习时常超过31万小时,虚拟驾龄相当于人类司机4万年。
在MANA的加持下,智能驾驶产品工程化开发也成为可能。据了解,毫末智行目前可以做到30个智能驾驶项目的异步并行开发,一套系统在新车型上的复用开发,可以在4个月内达到量产状态。
毫末智行CEO顾维灏曾披露,NOH整个开发周期为10个月,相关功能在发布之前,已经在北京和保定两地进行上路测试。测试数据显示,毫末智行城市NOH的路口通过率超过70%,变道成功率超过90%,交通流处理能力可以达到4级。
在高效、闭环的开发模式下,毫末智行对NOH未来的量产落地节奏,给出了一个看似激进的目标:
“未来,毫末城市NOH导航辅助驾驶落地城市数量100+,搭载乘用车数量达到百万级”。
如果不出意外,按照这个节奏,毫末将有望成为国内首个大规模落地城市NOH的自动驾驶公司。
规模量产自动驾驶,毫末底层技术如何?
毫末智行自动驾驶软件能力的迭代进化,MANA数据智能体系是最核心的一环,也是最底层的技术支撑。
在2021年底的AI DAY上,毫末正式推出MANA数据智能体系。MANA是围绕感知智能、认知智能、标注、仿真、计算等五大能力打造数据智能体系,核心出发点就是推动自动驾驶底层技术快速迭代。
一年时间过去,MANA数据智能体系已经完成底层架构搭建,并基本实现数据的闭环处理,同时在围绕城市开放道路的典型场景挑战,MANA进行了感知、数据使用效率等方面的升级。
具体来看,主要涉及以下六个方面:
其一,解决大规模预训练模型(Foundation Models)难点。顾维灏曾表示,在自动驾驶领域应用大模型,首先要解决的问题是,如何能更高效地将数据规模转化为模型效果。
这里涉及的一个关键技术节点是,数据标注。
大模型意味着大量的参数和数据,在这种情况下,数以10亿计的数据标注需要大量的时间和成本。在此之下,就需要一种能够直接使用大量无标注数据的方法来解决问题。
毫末选择的方法是,自监督学习,也就是采用大量的无标注数据训练感知任务主干网络(backbone),模型其他部分再用标注数据进行训练。通过这种方式,可以将训练效果提升3倍以上,同时精度也有显著提升。
其二,关于长尾场景数据的处理和模型优化。毫末表示,随着数据量越来越大,场景的数据样本也会越来越丰富,但长尾场景数据占比却依旧偏少,因为大部分长尾场景的数据样本都相对匮乏。
例如,在车辆识别中,乘用车样本虽多,但异形车的数据却比较少,类似的情况还有带有特殊图文的交通灯、不同样式的汽车尾灯等。
这种现象造成的结果是,训练出来的模型针对一些长尾场景的处理效果不好,同时在加入新数据的时候,还会导致已有的训练效果迅速衰退。
为了解决这一难题,毫末为MANA构造了一个增量式学习训练平台,平时在对模型进行训练时,放弃优化所有参数,而是有选择地对一些特定参数进行定点优化,同时动态观察模型的拟合能力,并适时扩充模型的拟合能力。这样就可以节省80%以上的算力,收敛时间提升6倍。
搭载毫末智行HPilot 2.0辅助驾驶系统的坦克500
其三,在去高精地图的前提下,使用重感知技术解决空间理解问题。
毫末采取的方式,与特斯拉的方法有相似之处,那就是让系统自己“脑补”。
具体来说,就是使用时间序列预测的Transformer模型在BEV空间做虚拟实时建图,通过这种方式使感知车道线的输出更加准确和稳定,同时对障碍物进行更准确的判断。
据毫末介绍,目前已经可以解决部分道路模糊、复杂路口、环岛等问题。在这个过程中,系统只需要使用普通导航地图里的拓扑信息就行。
其四,利用人类世界的交互接口对交通参与者行为进行预测。
此前,毫末主要通过传感器和算法对交通参与者的行为进行预测,以此来对车辆周围的交通环境做出提前反应,但在复杂性更高的城市开放道路,单纯靠“猜”的方式已经不够用了。
解决这个问题的方法是,识别更多的人类交通语言,比如刹车灯、转向灯,这样算法就能更清楚的判断周围车辆的下一步行动,进而做出决策。
从毫末城市NOH的功能来看,这项能力升级,最终会体现在NOH的智慧交通处理功能上。
其五,关于仿真训练。仿真数据的真实度对算法模型的训练至关重要,而在城市开放道路场景下,复杂性往往更高,尤其是应对路口场景,时效性和微量交通流变化的构建存在问题。
为此,毫末与阿里以及浙江德清县进行合作,利用路端设备将路口的全天候真实交通流记录下来,建立自动驾驶场景库。这种采集方式,相比车辆采集数据更加丰富和真实。
最后,则是解决自动驾驶系统舒适度的问题。简而言之,自动驾驶系统的启停转向,如何能像老司机一样丝滑从容。
关于这一点,毫末借鉴了多模态大模型的方法来解决自动驾驶的认知问题。通过对覆盖全国的大量人类驾驶行为进行深度理解,构建taskpromt,训练一个基于时空注意力机制(Attention)的驾驶决策预训练大模型,使得自动驾驶决策更像人类实际驾驶行为。
以上就是MANA在今年最核心的进展,毫末的整个自动驾驶方法论,到这里也清晰起来,归结起来两大关键词:大数据、大模型。
渐进式+重感知 破题量产自动驾驶
毫末智能驾驶的快速落地,不仅取决于自动驾驶扎实的技术沉淀,也得益于关键趋势的前瞻判断和选择。
今年的自动驾驶赛道有两个值得关注的趋势。
其一,此前坚持跨越式落地的自动驾驶玩家,大部分已经开始降维做量产方案,并寻求与主机厂合作,以获得资金和数据支持。
第二,“重感知”的技术路线,开始被越来越多的业内玩家认可,尤其是一些将量产目标放在城市开放道路上的玩家,几乎将“重感知”方案当作共识。
大趋势背后的原因,业内也有比较一致的看法。
一方面,跨越式的自动驾驶落地不及预期,以Waymo为例,其早在2017年就已经在凤凰城开展Robotaxi服务,时至今日,仍然没有进入真正的商业化落地阶段。与之处境相似的还有通用旗下的Cruise,仅今年上半年的亏损就有9亿美元(约合人民币60亿元)。
巨额的投入之下,商业闭环迟迟不见曙光,也让跨越式自动驾驶的落地前景备受质疑。
另一方面,高精地图采集的成本困境,始终是实现城市开放道路高阶智能驾驶的一道门槛。再加上高精地图涉及数据安全方面的问题,落地审批难度较大。
两大因素共同作用之下,舍弃高精地图,将重头戏放在车端感知上,同时再以量产为目标,大量收集数据,反哺自动驾驶算法的快速迭代,成为当下这个阶段的必然。
毫末智行是国内较早提出“重感知”策略的自动驾驶公司,并对自动驾驶的发展节奏有着清晰的判断。
按照顾维灏判断,经历以硬件驱动的1.0时代、以软件驱动的2.0时代,自动驾驶已经进入以数据驱动的3.0时代,即数据可以自我训练,自动驾驶玩家的重点,转移到高效获取数据,并把数据转化为知识上。
进入自动驾驶3.0时代,特斯拉和毫末智行走在前面。两家企业无论是渐进式的落地模式,还是对高精地图的态度、以及自动驾驶核心技术栈的搭建,都做出了先于行业趋势的判断和选择。
毫末在创立之初,就选择了渐进式自动驾驶路线,并不断积累量产数据;在算法训练上,毫末也是国内最早对transformer大数据模型展开研究的企业;再到自动驾驶超算中心MANA的建设,毫末同样走在了行业前面。
在这样的技术积累和战略铺排之下,毫末取得的成果是显而易见的。单从高阶智能驾驶落地来看,毫末已经成为除特斯拉、小鹏、华为之外,全球第四个拥有城市领航驾驶能力的企业。
算一算,从团队初立到今天的行业地位,毫末仅用了3年时间,这样的速度,不可谓不快。
但也要看到,就整个行业来说,城市高阶智能驾驶落地,今年仅仅是个开端,后续行业竞争依然会非常激烈。
从全球量产自动驾驶赛道来看,以特斯拉、毫末、华为等代表的行业第一梯队玩家,已经完成从软件到硬件,从车端到云端,从数据处理到算法训练,从前瞻技术布局到规模量产落地的技术打通,真正地实现了自动驾驶技术全栈自研,并形成“特毫华”的竞争格局。
毫末对比其他玩家已经有了先发优势,下一步,能否率先在国内大规模铺开城市领航驾驶,持续保持领先行业半个身位,值得期待。