2023年4月18日,联发科车载领域宣布两项重大举动。一项是联发科将车载领域芯片系列重新命名为天玑Auto,之前代号是黄山,天玑系列也是联发科手机的高端系列;另一项是联发科将推出旗舰车载芯片,舱驾合一,并且采用最先进的3纳米工艺制造。
联发科的3纳米车载旗舰芯片还将包含完整的5G连接能力,这是联发科与高通和英伟达最大不同,虽然高通也有这个能力,但高通没这么做。联发科的5G包括NTN即非地面网络,这是3GPP R17的一项,也就是直接连通卫星通讯。非地面网络(NTN)技术能由低轨道卫星透过上行(Uplink)与下行(Downlink)传输方式让终端使用者在偏远地区用卫星通讯方式进行信息双向传输,弥补5G基础建设在偏远地区覆盖率不足状况。联发科与英国手机制造商Bullitt Group合作将双向信息传输卫星通讯芯片搭载在手机中,未来联发科车载芯片也将具备这个功能。联发科5G还包括RedCap,可以看做是物联网的轻量化5G,成本比较低,有可能推动V2X的发展,当然标准的5G V2X也有。除此之外,最先进的WiFi7和蓝牙6.0也少不了。
与英伟达的Thor及高通的SA8795一样,联发科的旗舰车载芯片也是基于中央服务器Zonal架构设计,即依托车载以太网做骨干,所有的运算都集中在一个或两个中央服务器芯片上处理。
Zonal架构实际上就是车辆计算系统进化为PC架构,即所有的运算都由一颗或两颗CPU完成,所有的应用都由CPU来执行,或许再加一片GPU/AI加速器。外设与接口基本固定,底层软件系统也固定,底层系统对程序员来说几乎完全透明,程序员只需要开发具体应用,就像现在的PC都是基于Windows系统+CPU一样,真正的软件定义汽车。
Zonal架构是汽车电子架构的终极形态,就像电脑自2000年后就已经完全定型。进入Zonal时代,这些电脑或服务器代工厂可以无缝切入车载运算系统代工,没有任何障碍,二者的技术需求完全一致,并且PC厂家更擅长大算力系统,算力越大,PC厂家优势越明显,因为它们早已掌握了服务器的技术,水冷更加擅长。
联发科车机客户主要有长安汽车、吉利汽车、上汽大通、东风汽车、上汽通用五菱、亿咖通、滴滴出行和顺丰。联发科有一个特别强的合作伙伴,深圳掌锐。掌锐助力吉利E01(MT8665)平台,研发两班倒,项目从KO到量产半年以内完成;也助力长安iCAR平台,全新平台项目从KO到量产一年以内完成。目前,联发科主推MT8666和MT8675。
更先进的是MT2715,估计也采用了7纳米工艺,有三个版本:高配版4x A78 @1.6G,4x A55 cores @1.4G;中配3x A78 @ 1.4G, 4x A55 @ 1.2G;低配2x A78 @ 1.4G,4x A55 @ 1.2G。
GPU还是不花太多成本,Mali-G57 MC5,仅有281G FLOPS (FP32) 。AI算力未知。
联发科的黄山系列出货量已超千万片,自2022年伊始,联发科开始对车载领域越来越重视,并且联发科延续手机领域对抗高通的办法,就是比高通在制造工艺上领先,例如联发科在天玑9000上首次使用4纳米工艺,一段时间内超越了高通旗舰性能。车载领域也如法炮制,联发科2023年将推出两款4纳米工艺车载芯片,这也是全球首个4纳米车规芯片,高端型号是MT8676,低端型号为MT8673。
联发科与高通相比,最大的差距在GPU和AI上,高通SA8155P的GPU算力是1142GFLOPs,SA8295P是3000GFLOPs。这是因为GPU最耗费成本,联发科主打的就是高性价比,因此GPU算力一向不高。AI算力提升较容易,联发科天玑9200使用的APU 690有30TOPS@INT8的算力,SA8295P也是30TOPS@INT8,不过SA8295P的30TOPS是包含了CPU、GPU、DSP和HTP的。联发科未公布MT8676的任何信息,只能大概推测,MT8676挑战目标可能是SA8295P,MT8676很大可能是联发科天玑9000的车载版。
MT8676可能采用4个Cortex-x2加4个Cortex-A510,这样在CPU算力上可以超越SA8295P;GPU方面,联发科一向节约,估计会是MALI-G710 MC10或MC16,频率可能会比手机高一些,估计是800-900MHz,算力大约1200-1500GFLOPs之间;APU或者说NPU用5代,算力估计是18-22TOPS之间,5G Modem、WiFi、蓝牙、GPS都会集成进去,性价比较SA8295P要高不少。
车载与手机最大区别是手机更看重单核性能,而车载更看重多核性能。早期手机也是看重多核性能,随着短视频和手机游戏的爆发,大部分人都是抱着手机划来划去几个小时,这时候单核性能重要性就凸显了,手机从4大核加4小核改变为今天的1个超大核 + 3个大核 + 4个小核。手机领域的设计在车载领域显得有些不合时宜了。高通从第四代起手机和车载基本分家,车载和笔记本电脑用CPU高度重合,电脑也是更看重多核性能。
未来联发科的3纳米芯片会是怎样的设计,不妨做个大胆的推测。ARM的超大核不太适合车载,性价比偏低,并且ARM依仗自己的霸主地位,持续挤牙膏,留了足够的升级空间。联发科可能会和英伟达一样选择ARM的服务器系列Neoverse,服务器领域ARM要挑战x86,必须全力以赴,不能挤牙膏。
Neoverse系列分V、N和E三条产品线。其中,V主打高性能,N注重平衡效率与性能,E为高效率。英伟达的Thor选择V2平台做CPU。
执行端关键的参数是发射宽度Issue Width,目前最宽的是ARM的V1,多达15位,宽度越宽,ALU和FPU数量可以越多。通常ALU是4个,整数运算单元4个就够。V1有4个ALU,4个针对浮点的NEON,其中包含两个SVE。还有3个Load加载,2个写入Store。还有两个分支针对特定计算类型。影响CPU算力最关键的参数是Decode Wide译码宽度,译码宽度可简单等同于每周期指令数量即IPC,即每个周期完成多少个指令。
最新的Cortex-X3则是6位。
这里也能看出X2相对X1提升很少。
GPU方面,联发科可能采用和天玑9200一样的MALI G715。
Immortalis-G715、Mali-G715和Mali-G615都采用第四代Valhall体系结构,它们之间的差异只是着色器的配置和计算单元数量不同。其中Immortalis-G715定位旗舰,也是家族唯一硬件支持光线追踪技术的GPU IP,最多可以搭配16个RTU,可选10~16个计算单元。
天玑9200用了11个Immortalis-G715,650MHz下达到2000 GFLOPS的算力,如果16个Immortalis-G715,再配合750MHz的频率,GPU算力可达3.2TFLOPS,这个算力足以超过SA8295P和SA8795P,当然和英伟达的GPU算力还是没法比。
联发科的第六代APU,和高通的DSP一样,支持混合精度计算,也支持定点和浮点运算。
NPU或者说AI是门槛最低的,对联发科来说易如反掌,联发科只需要将APU 690的数量增加一个,整体AI算力就能超过60TOPS,这个数值足以超过高通的SA8795P,和英伟达的2000TOPS当然是没法比,不过解决办法很简单,外挂一个单独的AI加速器即可,AI加速器门槛很低。
鹿死谁手,让我们拭目以待吧!