作者 | 百日梦想家
编辑 | 王博
智算中心拼什么?
2022年过去,数据驱动成为自动驾驶演进共识。沿着数据驱动这条路线,自动驾驶加速迈入智算时代。
智算中心应运而生。
实际上,将智算引入自动驾驶的开先河者是特斯拉,其率先发布了专用于自动驾驶训练的超级计算中心Dojo,此后,一众玩家如毫末、小鹏等纷纷宣布建立智算中心。
各大智算中心比拼什么?
答案是,如何用低成本且高效的方式实现海量数据的闭环驱动。
“自动驾驶大模型加速降低开发成本,数据更接近人驾环境。基于量产实车数据的仿真技术将与自动驾驶云端超大模型结合,迎来新突破。超算中心成为自动驾驶的入门配置。”毫末智行董事长张凯在2023十大自动驾驶趋势预测中表示。
1月5日,在第七届HAOMO AI DAY上,毫末智行正式发布了由其与字节跳动旗下火山引擎联合打造的智算中心雪湖绿洲(MANA OASIS),这也是中国自动驾驶公司首个设立的智算中心。
“绿洲”登场,为我们揭开了智算时代的战场一角,也让毫末成为对阵特斯拉中最有看点的自动驾驶公司之一。
1、自建智算中心,剑指数据闭环
这应该是目前中国自动驾驶行业最大智算中心了。
每秒浮点运算可达67亿亿次,存储带宽每秒2T,通信带宽每秒800G,毫末官方在介绍MANA OASIS时给出这样一组数据。
基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现了计算、存储、通讯能力,可让数据更快速转化成知识。
有了这一新利器,毫末智行CEO顾维灏宣布,预计2024年上半年,毫末城市NOH落地将达到100城,2025年实现全无人驾驶。
MANA OASIS的出现是有其背景的。
随着感知技术与计算平台的逐渐成熟与趋同,影响高阶自动驾驶落地的关键因素,不再是解决常见的一般案例,而是解决“路口”问题,也即各类不常见,但不断出现的“长尾问题”,
作为一种模仿人类的科学,AI自动驾驶与人类认知世界的逻辑基本一致,想让汽车更好地理解世界,就需要构建更精准的模型。但算法模型的建立并非一劳永逸,自动驾驶车辆在行驶过程中总会遇到各种陌生场景。
因此,如何对新场景数据进行大规模高效处理并快速优化算法模型,即成为自动驾驶技术迭代的关键。换言之,构建基于数据驱动的自动驾驶数据闭环,让数据实现高效流动,是实现高阶自动驾驶的必由之路。
为满足实现数据闭环的所需要的超大算力数据中心,MANA OASIS出现了。
它的直接任务,便是为毫末智行的MANA数据智能体系提供超级算力,帮助MANA的五大模型实现低成本且高效的迭代。
MANA OASIS具备4大核心能力,包括以稳健系统架构保证高效存储和网络通讯、数据管理能力、算力优化能力以及训练加速能力。
顾维灏介绍,基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现的计算、存储、通讯能力,可以让GPU不再等待数据,数据转化成知识的速度也会更快。毫末数据、算力、训练效率也迎来全面提升。
具体来看,在数据管理能力方面,为充分发挥智算中心价值,让GPU持续饱和运行,毫末历经2年研发,建立了全套面向大规模训练的Data Engine,实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500us。
在算力优化方面,毫末与火山引擎合作,部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架。软硬一体,把算力优化到极致。
在训练效率方面,基于Sparse MoE,通过训练平台的持续优化,毫末可实现单机训练百亿参数大模型,以及实现跨机共享expert的方法,完成千亿参数规模大模型训练,训练成本降低到百卡周级别,训练效率提升100倍。
那么,MANA OASIS是怎么提升毫末的数据闭环效率的呢?
2、帮助MANA五大模型升级,更低成本、更高效
基于MANA OASIS智算中心,MANA数据智能体系的五大模型迎来了升级。
这五大模型包括:视频自监督大模型、3D重建大模型、多模态大模型、动态环境大模型以及人驾自监督认知大模型。
其中,视频自监督大模型、3D重建大模型的应用目的是为了降低成本,另外三个大模型的应用是为了提升数据流转效率。
具体来说,毫末智行视频自监督大模型主要做数据标注工作,能够让毫末 4D clip 标注实现 100%自动化,人工标注成本降低 98%。
3D 重建大模型可以实现以低成本获取 normal case,生成各种高成本 corner case,其生成的数据,不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低,增加 NeRF 生成的数据后,还可将感知的错误率降低 30%以上。
多模态互监督大模型,能够精准识别异形障碍物。毫末智行通过引入激光雷达作为视觉监督信号,直接使用视频数据来推理场景的通用结构表达,而通用结构的检测,可以很好地补充已有的语义障碍物检测,有效提升自动驾驶系统在城市复杂工况下的通过率。
动态环境大模型,可以精准预测道路的拓扑关系,让车辆始终行驶在正确的车道中。
毫末智行通过在 BEV(鸟瞰图)的 feature map(特征图)基础上,以标精地图作为引导信息,使用自回归编解码网络,将 BEV 特征,解码为结构化的拓扑点序列,实现车道拓扑预测,从而使毫末智行在感知能力上能够像人类一样在标准地图的导航提示下就可以实现对道路拓扑结构的实时推断。
毫末智行认为,解决了路口问题实际就解决了大部分城市 NOH 问题,目前在保定、北京,毫末对于 85%的路口拓扑推断准确率高达 95%。即便是非常复杂、非常不规则的路口,毫末也能准确预测。
人驾自监督认知大模型,能够掌握高水平司机的开车技法,让驾驶决策更聪明。
在探索“使用大量人驾数据,毫末智行全新引入用户真实的接管数据,同时用 RLHF(从人类反馈中强化学习)思路先训练一个 reward model(奖励模型)来挑选出更好的驾驶决策。通过这种方式,使毫末智行在掉头、环岛等公认的困难场景中,通过率提升 30%以上。
此外,基于绿洲的支持,MANA最新的车端感知架构,从过去分散的多个下游任务都集成到一起,形成一个更加端到端架构,包括红绿灯、局部路网、预测等任务,实现了跨代升级。
以上这些,意味着毫末的感知能力更强,自动驾驶功能有了更大的可挖掘空间。
3、2025年实现全无人驾驶,毫末的底气是什么?
此次AI DAY上,毫末智行正式宣布将在2025年实现全无人驾驶。
毫末智行的底气在是什么?顾维灏给出的答案,是重感知的技术路线、大模型的技术应用。
这里有一个先后顺序,需要先有大量数据,再进行数据的处理和应用。
在智算中心之前,毫末智行率先引入Transform等新技术,确立以数据闭环驱动形式的数据智能体系MANA,其已经成为毫末智行所有产品迭代的核心动力,截止目前,其学习时长已经超过42万小时,虚拟世界驾龄相当于人类司机5.5万年的驾龄。
当前,毫末智行已经完成数十万全要素、多模态CLIPS的标注,在场景库积累方面已经建设完成300万小时中国道路驾驶认知场景库,可以真正做到感知智能和认知智能的有效协同。
之后,怎么更好的处理数据。
智算中心的建立,能够让毫末智行在实现数据高效流转闭环的同时,还能够降低整个研发成本,从而促进自动驾驶系统快速实现量产落地。
值得一提的事,毫末智行自研的AEB算法助力魏牌、欧拉、坦克共计四款车型获得ENCAP、ANCAP五星安全,毫末是中国首个自研AEB算法落地海内外的公司,毫末也成为第一个出海欧洲、澳洲的自动驾驶公司。
在专利方面,截止到2022年12月,毫末拥有专利证书146件,全面覆盖数据融合、智能感知、智能决策、控制执行、模型算力提升等领域。
实际上,毫末还有一重优势,那就是背靠长城的量产优势。
毫末智行能够快速实现量产能力,也是能够反哺其自动驾驶技术快速升级迭代的重要因素之一。
目前正在陆续交付中的车型有摩卡DHT-PHEV激光雷达版、欧拉闪电猫、欧拉芭蕾猫、全新一代长城炮等。
这些车型上市之后,也能够为毫末智行提供越来越多的高质量的自动驾驶数据,助力其自动驾驶系统不断迭代升级。
截止2022年底,毫末HPilot搭载车型近20款,已经搭载上市车型包括魏牌摩卡、魏牌拿铁、魏牌玛奇朵、坦克300、坦克500、哈弗神兽、拿铁DHT-PHEV等。用户辅助驾驶行驶里程突破2500万公里。
城市辅助驾驶上,毫末智行的城市NOH软件达到交付状态,目前已经开启多城路测,毫末城市 NOH 是中国第一个可大规模落地的城市导航辅助驾驶,搭载毫末城市 NOH 的车型将在 2023 年上市。预计在2024年上半年落地城市达到100个。
毫末智行虽然成立仅三年时间,但已经稳居中国量产自动驾驶第一名。凭借此次发布的智算中心绿洲,毫末在自动驾驶领域的身位将持续靠前。
4、技术路线殊途同归,自动驾驶决战2025
自动驾驶行业已经进入以商业化量产为主的下半场竞争。
据不完全统计,除北上广之外,深圳、重庆、长沙等40多个省市,都积极出台相应管理办法或实施细则,从载人测试、道路测试、示范运营到无人化等多个阶段开展探索,大力推进自动化驾驶。
同时,据《中国自动驾驶乘用车市场数据追踪报告》发布的数据显示,2022年1季度国内L2级自动驾驶在乘用车市场的新车渗透率已达23.2%。
汽车之家研究院最新的一组报告预测,到2025年,中国L2级以上智能汽车销量将超过1000万辆,相应的智能汽车渗透率将达到49.3%。
与数据形成对比的,则是国内企业在自动驾驶赛道中激进的态度。
除了毫末外,百度此前宣布将于2023年打造全球最大无人驾驶服务区,华为计划将在2025年成为中国自动驾驶领导者。小马智行则表示2025年无人驾驶讲迎来真正的商业化应用。
与此同时,随着自动驾驶商业化落地竞争的开始,不管是走渐进式路线,还是跨越式路线,亦或者是纯感知路线,或多传感器融合路线,最终大家的目的都在殊途同归,即加速自动驾驶技术的量产落地,抢占自动驾驶决赛入场资格。
有业内人士表示,预计到2025年,自动驾驶行业的入场券将会截止。而作为国内走在自动驾驶量产前列的企业,毫末智行无疑已经获得2025决赛入场资格证。
张凯曾提到,数据是驱动自动驾驶成熟的核心要义,渐进式路线是数据积累的最佳路径。如今,随着智算中心绿洲的出现,毫末对数据和大模型的应用越来越娴熟,自动驾驶再进一步已是顺理成章。