地平线征程J6系列芯片深度分析

4月24日，地平线在北京正式发布征程6系列芯片，发布会现场我们能看到基于征程6系列芯片的域控制器展示，预示着征程6系列芯片进入量产车辆就在2024年底，可以说这开创了汽车智能驾驶芯片最快上车的先例。

征程6系列不是人们之前猜测的3款芯片，而是6款，足以覆盖智能驾驶的各个场景和价位。发布会上重点介绍了征程6B、6E、6M和6P，笔者认为B应该是Base，L是Light，E是Efficiency，M是Medium，H是High，P是Performance或Premium。地平线没有公开征程6L和6H的参数，预估6H的AI算力是256-300 TOPS，CPU算力是250-300K DMIPS。6L的AI算力是30-40TOPS，CPU算力是40-50K DMIPS。

征程6系列与5系列相比，升级最明显的是CPU算力。征程5的CPU是8核心Cortex-A55，算力大致是25-30K DMIPS，这次除了最低的征程6B，其余CPU算力都大幅度提高。

征程6系列的另一个升级是BPU架构，所谓BPU就是地平线对AI加速器的另一种称呼，B代表Brain，可以称为类脑处理器，第一代BPU，地平线致敬数学家伯努利，伯努利分布是最简单的离散型概率分布模型。第二代BPU，地平线致敬英国数学家贝叶斯，他推导出贝叶斯定理，贝叶斯定理是一个由结果倒推原因的概率算法，当年默默无闻，在人工智能的今天大放异彩。

征程6的第三代BPU架构则致敬博弈论创始人纳什，称之为纳什架构。约翰·纳什，生于1928年6月13日，著名经济学家、博弈论创始人、《美丽心灵》男主角原型，并且还是前麻省理工学院助教，后任普林斯顿大学数学系教授，主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家（经济学家，约翰·C·海萨尼和莱因哈德·泽尔腾）在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了重大影响，而获得1994年诺贝尔经济学奖。

博弈论主要针对智能车与智能车，智能车与非智能车之间决策交互产生的影响，目前大部分智能驾驶都是基于单车的，未考虑其他车辆对智能车决策的影响，这使得智能车有时候看起来不十分灵活，比如对向车主动让道让智能车先走，但智能车无法理解对向车的意图，还是傻傻地等对向车先走。也就是智能驾驶的策略，大多都有强化学习的影子，强化学习（Reinforcement Learning，RL）旨在通过与环境（可以是虚拟的也可以是真实的）的交互来使智能体（我们的「模型」）学习。RL 一开始是根据 Markov 过程提出的，我们让智能体处于不确定的固定环境中，并试图通过奖励/惩罚机制来学习到一个最优策略。在单智能体的情况下，这种方法被证明是收敛的。

但是，如果是将多个智能体放置在同一环境中（多智能体强化学习，MARL），情况就复杂多了。

假设我们正在试着用智能车来改善城市的交通情况，这时每辆车的决策都会影响其他车的决策与表现，比如智能车与智能车之间很可能会发生冲突，因为可能对于两辆智能车而言，沿着某条路线行驶都是最方便的（获得最多的奖励）。博弈论有个RL算法，它使用深度神经网络进行函数逼近，迭代计算子游戏的收益矩阵（Gt）。这个子游戏就是上文提到的 stage games。在每个时间 t 处（每个 stage game），都会计算出符合 NE 的回应（σ），并得到最优策略（π），然后添加新的策略来扩展 Gt 为 Gt + 1，继续重复上述过程。这是最高明的智能驾驶决策算法。

征程6全系列的AI加速都是纳什架构。征程6B主打极致性价比，CPU可能是6核心的Cortex-A55，制造工艺可能是14或28纳米，征程6B的国际意向客户是博世和电装，国内意向客户是四维图新、福瑞泰克和Minieye。主要对手可能是Mobileye的EyeQ5M/H和EyeQ6L。

征程6系列主打产品是E/M。

征程6系列将于2024年内开启首个前装量产车型交付，并预计于2025年实现超10款车型量产交付。面向中阶智驾市场，地平线推出普惠城区性价比方案最优解——征程6M，以及极致体验高速NOA最优解——征程6E，并提供符合AEC-Q104车规标准的SiP模组和Matrix 6域控参考设计，以超高集成度实现更低的功耗和更优的系统成本。发布会上，地平线官宣与多家Tier1、软硬件合作伙伴达成征程6E/M的合作，并公布到2024年第二季度将有超过50家生态伙伴推出基于征程6E/M的准量产级产品。

图片来源：地平线

大家最关注的还是征程6系列的旗舰征程6P。

征程6P的AI算力是560TOPS，地平线谨慎地做了标注，560TOPS是在1/2稀疏网络下的等效算力，地平线未提及精度，应该还是INT8位。这个算力实际远超4片Orin合并的算力，再强调一次，以目前车载领域用的最顶级车载以太网交换机带宽不超过1.25GB/s，典型的PCIe 4.0交换机，带宽不超过32GB/s，即便是价格远超Orin 的PCIe 6.0交换机，带宽也不超过120GB/s。想要像服务器行业那样是用4个H100就让算力增加4倍，带宽至少要做到900GB/s，而这根本做不到，用最顶级的车载以太网交换机连接4个Orin，算力顶多是1.2倍单个Orin算力，也就是300TOPS。这也是英伟达要花十几亿美元开发NVLINK的原因，也是NVLINK被美国管制严禁出口的原因。

CPU是18核心的ARM Cortex-A78AE，算力是410K DMIPS，英伟达Orin-X是12核心，内核也是ARM Cortex-A78AE，算力是227K DMIPS，因为Orin的GPU发热量比较大，所以其CPU的频率较低，而地平线的GPU算力只有200GFLOPS，发热量很低，所以CPU频率可以高点，算力几乎是英伟达的两倍，华为的昇腾610的CPU则是16核心，算力是200K DMIPS。

征程6P里面添加了一个微型GPU，算力很低，只有200GFLOPS，主要是为了将智能驾驶领域的图像输出到仪表或中控屏上。

为了降低成本，更好管理供应链，也为了减少软件复杂度，征程6P内部添加了一个达到ASIL-D级的MCU岛，算力是10K DMIPS，目前大家都是使用单独的安全MCU来控制车辆底盘，通常是英飞凌的TC397，TC397价格比较高，且价格波动大，供应状况不稳定，最高算力是4K DMIPS，典型算力是2.7K DMIPS。地平线没有公布详细信息，应该是和高通SA8650/SA8255/SA8775那样的4核心ARM Cortex-R52内核，运行频率估计是800-1000MHz。

存储带宽方面，升级到了LPDDR5，带宽达205GB/s，与英伟达Orin相同。前视感知支持1800万像素，图像带宽5.3Gpixel/s。

内部采用TB/s级高性能总线，访存延时低至130纳秒。

为应对新一代大模型Transformer较多的矢量运算，特别添加了VPU，即矢量浮点运算加速单元。

地平线征程P6的晶体管数量高达370亿，英伟达Orin只有170亿，Xavier只有90亿。

与征程6系列一同发布的还有全场景智能驾驶解决方案SuperDrive，它聚焦拟人化体验突破，打造好用的智驾系统2.0。凭借动态、静态、OCC（Occupancy占用网络）三网合一的端到端感知架构，数据驱动的交互式博弈算法，SuperDrive在任何道路环境下都能兼顾场景通过率、通行效率和行为拟人，在拥堵汇流、路口交互-动态Driveline、礼让骑行人、拥堵换道、城市环岛通行等城区复杂场景下，均能够为用户带来优雅不怂、从容笃定的智能驾驶体验。

动态、静态、Occupancy三网合一的感知端到端架构是精准还原客观物理世界的有效手段。在此架构下遮挡准召率提升70%，动态代码行数降低90%，网络负载降低50%，有效解决当前行业感知架构时延高、规则多、负载重的问题。数据驱动的交互博弈可带来更拟人的最优解，使得SuperDrive像老司机一样灵活处理复杂交通流，在拥堵场景下变道成功率提升50%，路口通过率提升67%。

随着美国对中国高科技领域的敌意持续升级，英伟达Thor大概率不会允许出口到中国，芯片领域的国产替代大潮即将到来。

免责说明：本文观点和数据仅供参考，和实际情况可能存在偏差。本文不构成投资建议，文中所有观点、数据仅代表笔者立场，不具有任何指导、投资和决策意见。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
ADG706BRUZ-REEL7	1	Rochester Electronics LLC	16-CHANNEL, SGL POLE SGL THROW SWITCH, PDSO28, TSSOP-28		$7.27	查看
VEML6030	1	Vishay Intertechnologies	Analog Circuit,	ECAD模型下载ECAD模型	$3.01	查看
L6234PD013TR	1	STMicroelectronics	Three phase motor driver	ECAD模型下载ECAD模型	$11.17	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

ADG706BRUZ-REEL7

Rochester Electronics LLC

16-CHANNEL, SGL POLE SGL THROW SWITCH, PDSO28, TSSOP-28