雷军的机器狗名曰“铁蛋”,马斯克发布的Tesla Bot,干脆就叫它“铁头”吧。
正被美国国家公路交通安全管理局(NHTSA)搞到焦头烂额的伊隆·马斯克,仍旧不失为一代营销宗匠。
就在几天前的Tesla AI Day上,马斯克凭借一位演员加上几页PPT组成的所谓“彩蛋”,硬是将媒体的注意力从一系列负面新闻中拽了出来。所以这次,就专门和大家聊聊最近颇受关注的Tesla Bot。
从Dojo谈起
要谈Tesla Bot,就不能不从Dojo谈起。因为这台超算所运用到的技术,被马斯克信誓旦旦地宣称:将运用到Tesla Bot的控制中去。
说起Dojo,这就牵扯到伊隆·马斯克一年前吹的那个“牛皮”了。
2020年8月,马斯克曾在其推特上宣称,“特斯拉正在研发一款名为‘Dojo’的神经网络训练超级计算机,目的是用来训练包括Autopilot在内的整个自动驾驶系统”。
▲目前世界第一超算“富岳”,FP32精度下算力442 Pflops/s
当时,马斯克首次披露了特斯拉Dojo超算计划的目标——FP32精度下可以达到1Eflops/s算力,是已投入使用的超级计算机中排在第一的日本富岳(442 Pflops/s)的2.5倍。不过:考虑到研发芯片的难度,以及部署一台超级计算机(能耗和冷却方面)的难度,“估计还需要一年时间”。
在6月的2021年计算机视觉和模式识别会议(CVPR2021)上,特斯拉的人工智能与自动驾驶视觉高级总监安德烈·卡帕西(Andrej Karpathy)更是“剧透”称:DOJO的总算力将达到1.8Eflops/s,读写速度为1.6TBps。至于架构方案么,计划采用当时性能最强的英伟达的A100 GPU,由8张一组构成节点,总计720个节点(合计5760张)组成Dojo。
▲英伟达A100 GPU,算得上是皮衣老黄的一款“神作”
鉴于A100的性能,若Dojo以此架构,那么总算力将会达到富岳的4倍以上。而又鉴于伊隆·马斯克“放卫星”的传统,那么特斯拉方面的这一宣称,反而有些不足为奇。所以,当时的各方,普遍“微笑以对”。
但不同的是,随着Dojo在本次Tesla AI DAY上的“真相大白”,Dojo的基础芯片又被换成了特斯拉“自研”的第一款AI训练芯片:D1。
根据会上公布的数据,D1基于7nm工艺,在FP32精度下算力为22.6 Tflops/s,BF16精度下算力则为362 Tflops/s。
那么,很多人肯定感觉心急了——说了这么多,Dojo呢?
▲是不是一直以为Dojo是这样的?想多了……
在这次AI DAY上,特斯拉方面特别宣布:目前他们已经完成了首个集合了25块D1芯片的训练模块……
是的,你没听错:首!个!训!练!模!块!
▲实际上这才是Dojo现阶段的形象
为了方便理解,这里姑且不靠谱地简单将25块D1芯片的算力进行简单叠加——25*22.6 Tflop/s=565 Tflops/s。嗯,差不多是一年半前,被马斯克吹上天的特斯拉HW3.0算力(144Tflops/s)的3.92倍……
哦,合着用一个略显“古早味”的词来描述,所谓Dojo原来就是一“小型机”啊?
当然咯,要不你以为呢?但凡马斯克会的,“画饼”必须是个永恒的主题啊!
当然,有些“饼”画了也就画了。但另外一些“饼”,只是提前一年甚至数年先吹起来,最后还是会以一个还算靠谱的姿态落地的,比如这个Dojo。虽然等到完成那一年,很可能已经不再顶尖。
曾效力于AMD,现为Dojo项目的负责人的甘尼什·文卡塔拉马南(Ganesh Venkataramanan),在会上这样宣称:下一阶段的集成120个训练模块、包含3000个D1芯片、超过1百万个训练节点、算力达到1.1EFLOPS的ExaPOD。
当然,目前的状况么——“我们很快就会组装我们的第一个机柜……”
Tesla Bot真相
实在是没想到,立志要成为“雷斯克”的“雷布斯”,这次居然走在了马斯克的前面!
不久之前,小米的“雷布斯”曾在年度报告以及秋季发布会的最后,以“彩蛋”方式公布了一款被戏称为“铁蛋”的“米狗”。而这一次,马斯克的“彩蛋”则是被称为Tesla Bot的仿生机器人。
而Tesla Bot的“登场”,是通过一段“尬舞”。
自从2020年1月,上海超级工厂交付仪式上伊隆·马斯克本人的“尬舞”开始,这似乎已成为了特斯拉的一个标志。这不,随着Tesla Bot的名称和效果图亮起,一位打扮成Tesla Bot的演员从幕后走出,现场来了一段确实很尬的机器人版“尬舞”。
在“尬舞”之后,就是“正常”的发布阶段,通过几张PPT,马斯克描绘出了Tesla Bot的基本情况:
和人类一样有着四肢、躯干和头部构造;机器人面部有一个状态显示面板,能够以图形和数据反应器状况,显示屏后隐藏有多个Autopilot系统的同款摄像头;机器人的手部将达到人类水平(Human-level hands),可以提起20kg重物,硬举能力达到68kg;双腿能够和人类下肢一样行动,最大步行速度可达8km/h;
总而言之,根据PPT上的内容,特斯拉已有的多摄像头神经网络、规划能力、标记能力都会应用到Tesla Bot中。
换而言之,在马斯克的这个“饼”中,Tesla Bot不但有着不亚于波士顿动力人形机的运动性能,更强的抓握和负荷能力,甚至可以准确识别目标并完成特定任务。
▲《I,Robot》中的“家政”机器人大军
马斯克甚至摆出了一副要进军智能机器人产业的架势,宣称Tesla Bot的主要任务是处理各类“无聊、重复和危险的工作”。比如和《I,Robot》一片中类似的,让机器人打杂帮忙取落在家里的东西、帮忙遛狗、从事家政工作,亦或是从事其他那些“危险工作”。
在特斯拉相关部门的工作计划中,Tesla bot将会达到和人类的尺寸以及重量相近的物理特性,并且会具有用于自动驾驶的相机系统和计算单元,能识别人、能认路、能自主行动。
简而言之,这不是一个人形机器,而是一台搭载了强AI且货真价实的机器人。
然而我们都知道的是,自从FSD V9.0的测试版本上线后,这个纯视觉“自动”驾驶的真实能力,早就已经露了怯。所以在这里也真心建议一下,如果这个Tesla Bot不久之后真能造出原型机的话,一定要加强头部的左侧的结构,整出一个“铁头”。
毕竟向左转一直是自动驾驶的重大挑战之一,FSD V9.0系列的测试视频中,令车主汗毛直竖的左转场景,也是比比皆是。
总而言之,Tesla bot的价值更多的是——营销价值。
到目前为止,特斯拉在整个仿生机器人方面,无论是基本构造、伺服装置、动力系统,还是对应的平衡、运动控制上,都是一片空白。试问如何在短时间内来个“一步登天”?
更何况,就算造出来这么一个和演员演绎形象足够像的Tesla bot又能如何。君不见,波士顿动力迄今为止已经卖身了多少次?而且波士顿不仅能拿出相对完善的产品线,而且还尝试了两年多的商业化,但最后又到底搞成了什么?
不过,咋呼以及画饼,毕竟已经是马斯克带给特斯拉这家公司的深刻烙印。而北美资本市场的规矩,亦是如此。所以,大家也就图个乐吧。反正在AI Day上,特斯拉的视觉识别技术以及混合规划系统,还是足够有料的。
至于那个Dojo,只要下力气认真去搞,不必那么牛逼的性能,它仍旧是一个对特斯拉训练辅助驾驶能力大有裨益的利器。
微信号|汽车公社 C次元
作者:林登万