争论源于这个话题:复杂的Occupancy Network可以在10毫秒中计算完毕,也就是说Tesla Occupancy Network的输出可以达到跟相机同样的36Hz,而目前绝大多数Lidar的采集频率只有10Hz————这个结论对吗?fsd视觉处理能超过30hz?
于是讨论开始了:
ZHOU:吹牛呗,某些人就是特粉,认为特斯拉天下无敌。LIDAR频率可调,5-30Hz都有。某些FLASH LIDAR,频率可轻松做到1000Hz。特斯拉HW3.0那个DRAM才16GB,带宽63.5GB/s,一个OCC模型至少20GB,根本装不下,以这个带宽,3Hz都做不到。要跑大模型,必须HBM,带宽至少TB/s级。
YU:大模型是否上车这事,严重不同意老周观点。我认为已经上车了,采用压缩处理方式。
ZHOU:这个大小是相对的,比如早期CNN模型参数只有几百万,那么几千万参数也可以说是大模型。但真正的大模型或者说主流的,参数都至少是1000亿起。
ZHU:基于AIday 的介绍,这一系列复杂计算可以在10ms内完成,意味着完全能跟上车载摄像头36帧的拍摄频率。
业界激光雷达的普遍水平为10Hz的扫描频率,而问界M9激光雷达的扫描频率高达20Hz,这意味着其能够更快地更新环境信息,提供更实时、更准确的感知数据。这有助于提升问界M9在智能驾驶中的表现,提高行驶的安全性和舒适性。
ZHOU:所谓知识蒸馏并不能压缩大模型,它只是训练方面无需太多的硬标签。超过100亿参数的大模型永远上不了车。因为必须用HBM,HBM太贵了,做HBM必须台积电2.5d或3D工艺,芯片价格不低于5000美元。多看几篇顶尖论文就知道了。
ZHU:千亿参数涌现智力,这个智力是人的较全面的智力。但如果处理专业方面的智力,的确是可以通过剪枝、知识蒸馏、量化等很多方法实现;现在三星、苹果已实现百亿模型压缩后在手机上流畅运行,今年有望实现千亿模型压缩后,在终端运行,带来很好的体验。
ZHOU:transformer和大模型一样,永远无法做骨干网,车载领域骨干网还是CNN。手机可以运行百亿参数,那个是语言模型,不需要实时性,人可以等1-3秒,就算流畅。车不一样,车要30Hz,高速60Hz,换句话说性能要是手机的100倍。
ZHU:其实驾驶并不需要多高的智力,也就是并不需要太复杂的信息处理,一个普通智力的人也能开好车,从宏观的角度看,基于transformer的FSD大概率已经实现了全自动驾驶了。我不是特粉,但客观地觉得特斯拉做到了。
ZHOU:特斯拉芯片远不如顶尖手机,像高通的gen 3
ZHU:在核心算法上,之前和几位业内人士沟通过,国内确实落后5-10年,甚至更大
ZHOU:不仅是算力,关键还是存储;核心算法,特斯拉也就是中等偏下。
ZHU:马斯克本来就是OPEN AI的股东,而且还有很强大的人形机器人业务;英伟达最早的AI服务器就是给了马斯克的。
ZHOU:特斯拉没有任何原创东西,骨干网regnet是facebook的,neck是谷歌的bi-fpn,head是谷歌的ViT-B做Bev transformer,至于OCC,它就没有。这可都是AI DAY写出来的。OCC只是个预测头,硬要说特斯拉有,那就是15年前就有的mlp。
YU:转一张图片:
ZHOU:特斯拉自己的图,大大方方承认自己不原创任何东西,偏偏有人认为特斯拉啥都是原创。特斯拉愿意公开算法,让我有东西可写,这一点要大力赞扬,希望人人都公开。那个NeRF主要也是谷歌的;端到端、vision transformer都源自2019年Facebook那篇DETR的论文。
YUAN:不过卷来卷去,智驾未必是客户的必要条件,最多是充分条件。否则小鹏、阿维塔的车型应该在国内成为市场主流。特斯拉开放fsd也就那样吧,不认为对他国内的竞争力有本质影响,何况目前开发的还是带高辅地图的产品,估计未必是美国那套算法,可能在国内重新做适配和路况算法迭代。
其实小米对特斯拉冲击更大,特斯拉以前客户很多就是女性,现在特斯拉没啥流量和网红效应了。所以估计特斯拉在国内还会不断拉垮,主要他车实在是太简陋了,竞争力只能越来越弱。fsd顶多对少部分极客有吸引力,何况还要额外收费。
ZHOU:顺便说一句,META的羊驼3可以秒杀微软的ChatGPT3.5。就是META非要注册,不像微博或X,不注册也能看内容,居然还有人给META投上千亿广告,真是想不通。
ZHU:假如FSD实现全自动驾驶,进入中国后,对国内汽车产业链有哪些影响(特别是出行服务)?对传统主机厂、新造车势力、Tier1等等,这个问题应深入讨论。
我们以为汽车行业的竞争,是在汽车内,但从技术、产业发展史来看,行业内的颠覆性变革,基本来自业外。比如汽车替代了马车夫、互联网干掉了零售,本轮自动驾驶的竞争从来不是汽车业内的竞争,而是AI的竞争,当我们在搞新能源的时候,人家在搞AI。
汽车的确有驾驶乐趣、身份象征等价值,但本质属性是出行工具,安全、舒适、便捷,还是核心价值,就像手机替代了家用照像机后,专业相机、个性化的胶卷娱乐相机,也还是有一定的空间。
YU:这个对比的结论就是,非自动驾驶车辆会沦落为与专业相机一样的小众市场(笑)
ZHU:我觉得没这么极端,而且需要很长的过程吧。二三十年前全国抓计划生育时,谁能想象现在的年青轻人不想结婚,不想生孩子;同样,再过二三十年,有多少年轻人愿意开一辆不能自动驾驶的汽车?特别是在长途中,高速上。
YUAN:这个演变趋势就很难看清了,不过RoboTaxi确实是一个潜在的大变局,不过把生命交给机器,感觉未必有那么快。城市里还可以,毕竟速度慢一些。
ZHU:这个问题我也想过很多遍,但有次清华的一个老师一句点醒我,他说那你觉得你现在坐在车上,飞机上,难道生命掌握在自己手上?
YUAN:人性潜在的保守,从汽车的发展也能看到,智能车在中国发展那么好,实际上卖的最好的是不带(高级)自动驾驶的比亚迪、吉利、广汽的车型。
ZHU:其实,本质还是对技术的认识和技术的成熟度。
YUAN:理想汽车也算是偏传统走法,产品力第一位,而不是智驾,所以理想汽车更加成功。
高阶自动驾驶功能肯定也很重要,是一个重要选项。比如小米爆款了,是因为他的智驾?我感觉也不是。
YU:外形设计依然是购车第一选项。
YUAN:智驾当然小米也是一个卖点,比如客户可能更倾向于高阶版本的小米。外观,内饰,体验,目前依然是胜负手。其实特斯拉在欧美也卖不动了,车不是手机那么简单的东西。fsd在美国的选装率从最初的60%跌到现在不到20%。逼得特斯拉不得不降低选装价格。在中国感觉他卷不过国内车企。特斯拉最该做的是做本土化开发,重定义产品。
ZHU:去年和硅谷一个人线上沟通,他说特斯拉从2018年开始,战略重点已转向AI、人形机器人,汽车方面的事在马斯克眼里已做得差不多了,从Dojo的布局和利用来看,也确实主要支撑人形机器人业务。
YUAN:人形机器人确实是,消费级机器人更加标准化,比做汽车靠谱。人形机器人确实可能才是未来的真正杀手锏。
ZHU:对人工智能的技术判断,当时(2016)是这样的:
那时候transformer还没有出现。
YUAN:人形机器人可能是人工智能的关键载体。汽车虽然也是,但汽车确实性命攸关,虽然有些人真的不管那么多开智驾,但绝大部分人是不敢的。城区的RoboTaxi也是载体,毕竟速度慢一些,所以小马一直在这里下注,始终在乘用车L2上犹豫不决。
ZHU:但是对于人工智能预测研究,去年年底我的结论发生了质的变化:
LUO:这是我对AI行业发展的一个总结:
YUAN:赞同。人形机器人才是AI的终极,汽车太多元化了,个性化了。
ZHU:基本赞同。