4月11日,第八届 HAOMO AI DAY举办。作为中国聚焦自动驾驶技术的盛会之一,这次AI DAY的行业关注度也很高。
过去在这个会上,毫末智行都会发布最新的一些自动驾驶行业技术动向,比如2021年9月发布的数据智能系统,去年4月份举行AI DAY上发布毫末城市NOH,发布毫末小魔驼2.0等。
今年的AI DAY,有一些特别。
2月17日,毫末智行宣布自动驾驶认知大模升级为DriveGPT,并表示将在AI DAY上公布进展。
DriveGPT的发布,宣告着自动驾驶正在迈进3.0时代,接下来毫末还会有什么动作,其实是外界比较关心的事情。比如,新技术能够产生怎样的影响?接下来行业会发生怎样的变化?
这次AI DAY中也许就有答案。
自动驾驶生成式大模型升级:DriveGPT雪湖·海若
毫末的AI DAY,总是不让人失望,每次都有新体验、新技术、新动态。
三个月一次的举办节奏很有深意,而且每次都有重磅信息披露,科技行业要做到“季更”,其实不太容易,背后需要有充足的技术储备和迭代能力,另外“季更”也能倒逼着企业研发不断迭代。
这次AI DAY上,毫末主要宣布了这么几件事:
发布DriveGPT雪湖·海若,MANA 架构全新升级。
宣布与三大主机厂合作,量产装机争夺战开始。
2024年毫末城市NOH落地百城。
末端物流与商业进一步落地。
信息量很大,但人们关注的焦点很清晰:业内首个自动驾驶生成式大模型——DriveGPT雪湖·海若。
董事长张凯在演讲中提到,毫末其实提前两年就开始布局 AI 大模型,ChatGPT还没有像现在这么人尽皆知。直到ChatGPT火了之后,人们对大模型才开始有所了解。
在打“提前量”这件事上,毫末还是很认真的,毕竟毫末是行业内最早一批坚定做渐进路线的自动驾驶企业,也是最早围绕着商业化、落地去布局的玩家。
与ChatGPT相似的是,雪湖·海若也是通过RLHF(人类反馈学习强化学习)算法,对自动驾驶技术本身进行优化。
不同之处在于,ChatGPT用人们聊天对话输入,然后用文字输出,雪湖·海若(DriveGPT)则是输入驾驶数据,比如驾驶场景、驾驶习惯。输出的是能力更强的自动驾驶技术。
相比技术细节,其实更需要关注的是,雪湖·海若的发布意味着什么?
在谈擎说AI看来,接下来可能会有这么几个变化:
1、重塑了汽车智能化的技术路线。
过去的汽车智能化,更多是产品的智能化,并不是核心技术的智能化。
比如智能座舱,他能带来智能化体验,这个是用户最能感知到的,比如语音交互、情感智能等等,主打智能化概念。做这种类型的智能汽车,需要的是产业整合能力,但缺的是核心技术护城河,这类车企最多,寒冬来了之后也最危险。
真正的智能化技术是能够自我学习,自我生长的,真正的自动驾驶,也应如此。过去的自动驾驶技术,本质上还是需要人去优化算法,调整参数。
雪湖·海若对行业最大影响在于,用技术去“培育”技术,这可能会产生深远影响。自此,自动驾驶技术自身有了自我进化的能力,自动驾驶技术演化的方式就此改变。
2、极大地拓展毫末城市NOH产品的能力,帮助毫末城市NOH进一步量产迭代。
雪湖·海若对行业的影响会更直接。按照毫末的说法是:DriveGPT 可以逐步应用到城市 NOH、并且提升城市辅助驾驶的能力。
ChatGPT之所以强,是因为改变了AI本身演化的方式,更有效率,更成熟。
DriverGPT雪湖·海若则“重新开了一个主线”,人类反馈强化学习(RLHF)算法下,大量的老司机面临的真实的场景数据去训练AI决策。
也就是说,在雪湖·海若的帮助下,将来毫末城市NOH的能力可能会更强,场景感知能力、自动驾驶能力也能快速迭代,搭载毫末城市NOH的车辆也能有“老司机”一样的能力。
只要数据样本够多,那么城市NOH面临的长尾场景问题,可能会更容易被解决,这有助于毫末城市NOH进一步量产迭代。
3、把行业带入“大模型”时代。
发布会上,一个颇为重要的信息是,雪湖·海若的能力对行业来说是开放的。
目前,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等多家企业和机构已经加入。
毫末方面还表示, DriveGPT 会面向公众逐步开放三大应用场景,包括驾驶场景自动标注、驾驶行为验证、困难场景脱困等。
自动驾驶技术发展到现在,硬件性能早已不是天花板,关键是自动驾驶感知决策能力以及数据样本的量级。ChatGPT的成功表明,大模型可能才是行业最终的解决方案。
雪湖·海若的发布只是一个开始,接下来大模型在自动驾驶领域的应用规模会更大。
自动驾驶3.0时代,量产导向、降本、规模化
过去,自动驾驶行业经历过估值高光也经历过寒冬。
整个行业从热到冷再到热,最后经过验证锤炼得出来一个方向:“行泊一体,量产为王”。
当下行业中的玩家们也不再争论L4还是L2,而是都埋下头去做量产方案,去做满足主机厂需求的方案。
原因很简单,前装市场的商业化规模在进一步增长。
毫末智行董事长张凯提到一个数据:2022年中国乘用车市场L2及以上辅助驾驶前装搭载率升至 29.40%,前装标配交付 585.99 万辆,预估2025 年高级别辅助驾驶搭载率超过 70%。
也就是说,行泊一体的解决方案NOA产品,将会在23、24年大规模落地。对于自动驾驶企业来说,这意味着服务主机厂需要的能力也在变化。
在谈擎说AI来看,城市辅助驾驶来到前装量产阶段,技术之外,降本和规模化也是核心竞争力。
量产的1.0时代,需要的是工程化能力,所以一些L4厂商做L2的过程中,也需要补足工程化能力。到了量产的2.0时代,不仅需要工程能力,更需要降本增效能力。
但降本这件事,不仅靠供应链资源整合能力,也靠的是对工程、技术的理解。
在降本上,毫末其实很有一套。
比如,毫末把视觉 BEV 感知框架引入到了车端鱼眼相机,做到了在 15 米范围内达到 30cm 的测量精度,2 米内精度高于 10cm 的视觉精度效果。结果就是,这样的精度下,泊车场景下纯视觉就能替代超声波雷达,从而进一步降低成本。
再比如,海若DriveGPT的帮助下,可实现 4D Clip 数据自动化标注的规模化生产,降低行业使用数据的成本。据悉,单帧图片整体标注成本仅相当于行业的 1/20。
这些技术、工程能力,最终反馈到产业链上,就是终端车型的智能化成本可能会更低。长期来看,汽车终端市场价格内卷是大趋势,能帮助车企降低成本的一级供应商,才是好的供应商。
降本之后,终端价格打下来,城市辅助驾驶、自动驾驶产品才能进一步完成规模化,合作伙伴才能越来越多。
规模化能力上,就是能不能持续打开新的市场,不断地扩充“朋友圈”。
毫末也公布了最新的商业化进展:
DriveGPT 首发车型新摩卡 DHT-PHEV,即将量产上市;搭载毫末NOH车型即将上市;海若大模型进一步升级感知能力。
另外一个重要的消息是,毫末官宣了与三大主机厂合作。
毫末智行表示,目前已经与三家主机厂签署战略合作协议,达成面向 L2+级别智能驾驶领域的全方位战略合作,相关项目已经在交付中。
这个签约,其实很有分量。对于行业来说,意味着打响了量产装机“争夺战”,是商业化的重要节点。
这靠的其实还是技术能力。
比如,技术的前瞻性。
目前,毫末被国际顶会收录的学术论文达到 6 篇 ,最新的两篇分别入选计算机视觉识别领域三大顶会之一的 CVPR 和全球首个智能车专业期刊 IEEE TIV,走在AI算法前沿领域。
技术壁垒够强,就更容易打开商业化空间。
一方面,与三大主机厂达成合作,意味着毫末靠技术优势打破了汽车行业的“门派之见”,接下来商业化空间更大。
另一方面,最能体现技术能力,还是雪湖·海若DriveGPT。
DriveGPT对于自动驾驶公司来说,味着成长性,意味着引领行业的能力。
这就像是比亚迪的“刀片电池”,能够代表行业最顶尖的能力,这让毫末智行城市NOH有更多的信心走出去,成长为参天大树。
谈擎说AI认为,长期来看DriveGPT+前装规模化,会改变自动驾驶行业格局,DriveGPT正在把行业带入一个全新的3.0量产时代。
技术驱动行业中,技术代差能快速改变市场格局。(这也是谷歌这么忌惮OpenAI的原因)
过去,自动驾驶行业中,大家其实技术水平整体差距没有想象中那么大,而DriveGPT的出现,可能意味着一次“技术爆炸”。
从ChatGPT2到ChatGPT4 的变化是明显的,但OPEN AI的创始人透露,这里面其实更多的是数据量级的差异。
DriveGPT也是如此,训练的数据量越大,技术越成熟,越容易拉开与行业其他玩家的差距。
此次AI DAY上,毫末也透露出了自动驾驶数据智能体系 MANA的升级情况。
目前,MANA 计算基础服务针对大模型训练在参数规模、稳定性和效率方面做了专项优化,感知和认知相关大模型能力统一整合到 DriveGPT 中。数据显示,MANA 的学习时长超过 56 万小时,虚拟驾龄相当于人类司机 6.8 万年。现在这些数据仍然在不断增长。
数据量变会不会引发自动驾驶的“质变”?自动驾驶行业中每个人都希望知道答案。
目前来看,这个最重要的问题,可能需要毫末来回答。
结语:
从此次AI DAY来看,DriveGPT很可能正在开启自动驾驶的另一个时代。
自动驾驶未来是确定的,AI的未来也是确定的,问题在于实现的过程需要探索。这么多公司在前仆后继,不断改良,勇攀技术高峰,就是不断探索的过程。
DriveGPT是自动驾驶行业阶段性探索的成果。这个成果对于整个AI的发展也有重要意义,接下来AIGPT能力进一步深化,可能会有更多GPT 出现。
接下来,关于AI的历史会如何书写,值得期待。