4月24日,地平线在北京正式发布征程6系列芯片,发布会现场我们能看到基于征程6系列芯片的域控制器展示,预示着征程6系列芯片进入量产车辆就在2024年底,可以说这开创了汽车智能驾驶芯片最快上车的先例。
征程6系列不是人们之前猜测的3款芯片,而是6款,足以覆盖智能驾驶的各个场景和价位。发布会上重点介绍了征程6B、6E、6M和6P,笔者认为B应该是Base,L是Light,E是Efficiency,M是Medium,H是High,P是Performance或Premium。地平线没有公开征程6L和6H的参数,预估6H的AI算力是256-300 TOPS,CPU算力是250-300K DMIPS。6L的AI算力是30-40TOPS,CPU算力是40-50K DMIPS。
征程6系列与5系列相比,升级最明显的是CPU算力。征程5的CPU是8核心Cortex-A55,算力大致是25-30K DMIPS,这次除了最低的征程6B,其余CPU算力都大幅度提高。
征程6系列的另一个升级是BPU架构,所谓BPU就是地平线对AI加速器的另一种称呼,B代表Brain,可以称为类脑处理器,第一代BPU,地平线致敬数学家伯努利,伯努利分布是最简单的离散型概率分布模型。第二代BPU,地平线致敬英国数学家贝叶斯,他推导出贝叶斯定理,贝叶斯定理是一个由结果倒推原因的概率算法,当年默默无闻,在人工智能的今天大放异彩。
征程6的第三代BPU架构则致敬博弈论创始人纳什,称之为纳什架构。约翰·纳什,生于1928年6月13日,著名经济学家、博弈论创始人、《美丽心灵》男主角原型,并且还是前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家(经济学家,约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。
博弈论主要针对智能车与智能车,智能车与非智能车之间决策交互产生的影响,目前大部分智能驾驶都是基于单车的,未考虑其他车辆对智能车决策的影响,这使得智能车有时候看起来不十分灵活,比如对向车主动让道让智能车先走,但智能车无法理解对向车的意图,还是傻傻地等对向车先走。也就是智能驾驶的策略,大多都有强化学习的影子,强化学习(Reinforcement Learning,RL)旨在通过与环境(可以是虚拟的也可以是真实的)的交互来使智能体(我们的「模型」)学习。RL 一开始是根据 Markov 过程提出的,我们让智能体处于不确定的固定环境中,并试图通过奖励/惩罚机制来学习到一个最优策略。在单智能体的情况下,这种方法被证明是收敛的。
但是,如果是将多个智能体放置在同一环境中(多智能体强化学习,MARL),情况就复杂多了。
假设我们正在试着用智能车来改善城市的交通情况,这时每辆车的决策都会影响其他车的决策与表现,比如智能车与智能车之间很可能会发生冲突,因为可能对于两辆智能车而言,沿着某条路线行驶都是最方便的(获得最多的奖励)。博弈论有个RL算法,它使用深度神经网络进行函数逼近,迭代计算子游戏的收益矩阵(Gt)。这个子游戏就是上文提到的 stage games。在每个时间 t 处(每个 stage game),都会计算出符合 NE 的回应(σ),并得到最优策略(π),然后添加新的策略来扩展 Gt 为 Gt + 1,继续重复上述过程。这是最高明的智能驾驶决策算法。
征程6全系列的AI加速都是纳什架构。征程6B主打极致性价比,CPU可能是6核心的Cortex-A55,制造工艺可能是14或28纳米,征程6B的国际意向客户是博世和电装,国内意向客户是四维图新、福瑞泰克和Minieye。主要对手可能是Mobileye的EyeQ5M/H和EyeQ6L。
征程6系列主打产品是E/M。
征程6系列将于2024年内开启首个前装量产车型交付,并预计于2025年实现超10款车型量产交付。面向中阶智驾市场,地平线推出普惠城区性价比方案最优解——征程6M,以及极致体验高速NOA最优解——征程6E,并提供符合AEC-Q104车规标准的SiP模组和Matrix 6域控参考设计,以超高集成度实现更低的功耗和更优的系统成本。发布会上,地平线官宣与多家Tier1、软硬件合作伙伴达成征程6E/M的合作,并公布到2024年第二季度将有超过50家生态伙伴推出基于征程6E/M的准量产级产品。
图片来源:地平线
大家最关注的还是征程6系列的旗舰征程6P。
征程6P的AI算力是560TOPS,地平线谨慎地做了标注,560TOPS是在1/2稀疏网络下的等效算力,地平线未提及精度,应该还是INT8位。这个算力实际远超4片Orin合并的算力,再强调一次,以目前车载领域用的最顶级车载以太网交换机带宽不超过1.25GB/s,典型的PCIe 4.0交换机,带宽不超过32GB/s,即便是价格远超Orin 的PCIe 6.0交换机,带宽也不超过120GB/s。想要像服务器行业那样是用4个H100就让算力增加4倍,带宽至少要做到900GB/s,而这根本做不到,用最顶级的车载以太网交换机连接4个Orin,算力顶多是1.2倍单个Orin算力,也就是300TOPS。这也是英伟达要花十几亿美元开发NVLINK的原因,也是NVLINK被美国管制严禁出口的原因。
CPU是18核心的ARM Cortex-A78AE,算力是410K DMIPS,英伟达Orin-X是12核心,内核也是ARM Cortex-A78AE,算力是227K DMIPS,因为Orin的GPU发热量比较大,所以其CPU的频率较低,而地平线的GPU算力只有200GFLOPS,发热量很低,所以CPU频率可以高点,算力几乎是英伟达的两倍,华为的昇腾610的CPU则是16核心,算力是200K DMIPS。
征程6P里面添加了一个微型GPU,算力很低,只有200GFLOPS,主要是为了将智能驾驶领域的图像输出到仪表或中控屏上。
为了降低成本,更好管理供应链,也为了减少软件复杂度,征程6P内部添加了一个达到ASIL-D级的MCU岛,算力是10K DMIPS,目前大家都是使用单独的安全MCU来控制车辆底盘,通常是英飞凌的TC397,TC397价格比较高,且价格波动大,供应状况不稳定,最高算力是4K DMIPS,典型算力是2.7K DMIPS。地平线没有公布详细信息,应该是和高通SA8650/SA8255/SA8775那样的4核心ARM Cortex-R52内核,运行频率估计是800-1000MHz。
存储带宽方面,升级到了LPDDR5,带宽达205GB/s,与英伟达Orin相同。前视感知支持1800万像素,图像带宽5.3Gpixel/s。
内部采用TB/s级高性能总线,访存延时低至130纳秒。
为应对新一代大模型Transformer较多的矢量运算,特别添加了VPU,即矢量浮点运算加速单元。
地平线征程P6的晶体管数量高达370亿,英伟达Orin只有170亿,Xavier只有90亿。
与征程6系列一同发布的还有全场景智能驾驶解决方案SuperDrive,它聚焦拟人化体验突破,打造好用的智驾系统2.0。凭借动态、静态、OCC(Occupancy占用网络)三网合一的端到端感知架构,数据驱动的交互式博弈算法,SuperDrive在任何道路环境下都能兼顾场景通过率、通行效率和行为拟人,在拥堵汇流、路口交互-动态Driveline、礼让骑行人、拥堵换道、城市环岛通行等城区复杂场景下,均能够为用户带来优雅不怂、从容笃定的智能驾驶体验。
动态、静态、Occupancy三网合一的感知端到端架构是精准还原客观物理世界的有效手段。在此架构下遮挡准召率提升70%,动态代码行数降低90%,网络负载降低50%,有效解决当前行业感知架构时延高、规则多、负载重的问题。数据驱动的交互博弈可带来更拟人的最优解,使得SuperDrive像老司机一样灵活处理复杂交通流,在拥堵场景下变道成功率提升50%,路口通过率提升67%。
随着美国对中国高科技领域的敌意持续升级,英伟达Thor大概率不会允许出口到中国,芯片领域的国产替代大潮即将到来。
免责说明:本文观点和数据仅供参考,和实际情况可能存在偏差。本文不构成投资建议,文中所有观点、数据仅代表笔者立场,不具有任何指导、投资和决策意见。