vivo也要做机器人了。
这个消息上周由一家科技媒体曝出,紧接着就是本周的博鳌亚洲论坛,由vivo执行副总裁、首席运营官、中央研究院负责人胡柏山正式官宣。
早前流出的两张岗位招聘截图显示,vivo已开始招聘机器人技术规划专家,最高年薪超120万元。而机器人产品的孵化与预研工作,则是由vivo新成立的机器人实验室负责。
实际上,去年年初vivo就在自家的活动上向外界吹过风,称未来的技术投入方向主要为机器人和MR两块。结合此前胡柏山在今年vivo会客厅公布的MR动态,今天官宣机器人项目也就没什么意外。
vivo这家公司习惯“埋头种因”,所以官方公开披露的信息往往很少,就比如这次博鳌论坛胡柏山的发言,关于机器人只有寥寥数语,但仍能捕捉到一些关键信息。
首先是对机器人赛道的选择,vivo认为与其深耕手机行业的能力积累高度匹配;其次,vivo不是什么都做,只做机器人的“大脑”和“眼睛”,让机器人可以“看得懂场景,听得懂需求,给得了回应”;最后,vivo瞄准的具体场景是家庭机器人。
前两点非常符合vivo一贯秉承的产业共荣文化,而且胡柏山也清楚表达了“与机械系统领域产学研伙伴探索合作”的强烈意愿。最后一点则有点给机器人赛道指路的意味,毕竟一家有着三十年消费电子资历的科技公司,不会盲目的选择一条细分赛道。
但对于机器人产业来说,vivo的确算是一个新人。不论是春晚上的机器人跳舞,还是GTC大会上的小机器人Blue,亦或是成名更早的波士顿动力,机器人已经不是一个纯实验室产品,这个时候vivo官宣进入,底气在哪优势是什么,又能给整个产业带来哪些影响,这是外界想知道也是vivo需要回答的核心问题。
1、做机器人,vivo凭什么?
2023年7月,在一张放着狮子、鲸鱼与恐龙的桌子前,一个基于RT-2模型的机器人接到“捡起灭绝的动物”的指令后,准确地拿起了恐龙。
对于人类而言这可能是一个基础动作,但对于机器人而言这堪称一个重要飞跃——之前机器人经常无法操纵自己从未见过的东西,也难以实现从“灭绝的动物”到“塑料恐龙”的逻辑飞跃。
这样的智能涌现,背后实际上是机器人的一个底层逻辑,“思考”是核心,“视觉”是必要条件,最后才是“行为动作”。换到隔壁大模型赛道,就是“感知-决策-执行”,顺序虽然不同,但道理相通。
而“思考”是核心的底层逻辑,是波士顿动力用三次易主都没换来的宝贵经验。这家公司用了20年的时间试图教会机器人如何“运动”,但实际上,机器人应该先学会“思考”,像Tesla Bot一样。
Tesla Bot于2021年PPT首发,发布会上的皮套人模仿Tesla Bot尬舞一度为马斯克赢得了群嘲。但经过几次迭代,尤其是特斯拉的自动驾驶突飞猛进之后,外界才明白马斯克只用了一招就“杀死”了波士顿动力,即先让机器人学会“思考”。
而自动驾驶更像是机器人的前置产业,毕竟二者的核心都是基于人工智能,走的都是感知-决策-执行路线,且按照马斯克的说法:特斯拉已经打通了自动驾驶芯片FSD和机器人的底层模块,实现了一定程度的算法复用。
如今这条道路的两旁已经站满了参赛选手,特斯拉等这些车企的人形机器人项目不是已经下线就是在冲刺最后一公里。现在,又多了一位选手。
vivo做机器人的底层逻辑与特斯拉等车企基本一致,在基于AI算法+感知的链条下热启动:
AI算法模块是依托手机业务积累的蓝心大模型,感知模块则是影像空间感知技术(MR视觉)。
而且按照胡柏山的说法,在AI算法模块因为机器人的物理特性,决定其拥有比智能手机更好的硬件条件,他用了轻薄本和台式机的例子,形象的解释了手机和机器人提供的算力差别。
同时vivo在MR视觉上的进展也比较顺利,目前有近500人团队,探索版已经在博鳌亮相,原型机预计最早今年9月就能问世。
从这两点就可以看出,vivo在构思进军机器人赛道时的考量,是依托现有资源和能力,做技术的复利。这也是在回答vivo为何不做汽车时,胡柏山说看一个产业或者一个新的赛道,不会看是不是风口,也不会单纯的看市场规模,而是去看与vivo的核心能力是否匹配,以及能不能进去给用户创造价值。
这最后一句还能再提炼一下,实际上这与vivo做机器人选择的家庭场景有关。
胡柏山有一个观点,他认为以deepseek为代表的数字世界,和以机器人为代表的纯物理世界,当前是割裂的状态。换言之,大家处在同一起跑线的机器人赛道,下一个高地就是谁能将数字世界和物理世界无缝连接到一起。
从这个大的目标和愿景来说,智能手机和电动汽车厂商都是非常有动力和能力的。因为长久以来,手机就是在帮人们把数字世界与物理世界连接起来,汽车则是在新能源爆发之后才有。
2、场景化落地背后
有了总的实施纲领和具体路线,vivo想做好机器人还需要三个关键支撑:数据、场景和供应链,其中场景又是重中之重。
Tesla Bot的数据来自自动驾驶的视频收集,以及马斯克旗下的其它AI公司,比如X、Neuralink、Grok等。在AI领域,语料的不同决定了AI能力的去向。马斯克给Tesla Bot规划的去处是代替人类“从事重复性/无聊的工作”。
这是一个无比宽泛的概念,或许是他自己也没有想好,但核心是先用自动驾驶的数据让Tesla Bot能像人类一样活动。
在这一点上vivo有些不同,它官宣切入的场景就明确指向了家庭,甚至在形态上也没有拘泥于一定是人形,可以是双足、四足、轮足甚至履带,因为按照胡柏山的说法,这是由用户场景去决定的。
通过这个再去发散思维,就能发现vivo决定由家庭场景出发,也是因为智能手机用户的核心场景就是家庭。vivo在这个场景上积累了足够的规模化数据和应用场景经验,可快速适配机器人需求。
这也正契合机器人算法训练所需要的仿真数据。和GPT等大模型爬取互联网数据不同,机器人会和真实世界产生交互,因此需要遵循物理规则的真实数据来训练算法,而手机恰好是物理世界与数字世界的连接枢纽,毕竟vivo由全球5亿智能设备用户为机器人场景落地提供试验场。
再者是供应链。国泰君安最近在一篇研报中提出,机器人规模量产后有望复制3C“零部件-模组-整机”代工模式,因为其供应链与3C重叠度较高。
3C终端具备快速迭代且大批生产特征,供应链呈现“零部件-模组整机”的专业化分工模式。而人形机器人若成为大众消费品,势必呈现快速迭代态势,这与3C供应链也非常契合。
此外,人形机器人各组成部分与手机协同性高叠加不少3C企业(vivo、小米、苹果、三星等)切入人形机器人本体,为3C供应链企业切入人形机器人赛道提供了基础。
vivo有30年的手机供应链经验,这可以确保其在启动初期有足够的下游厂商为其供应零部件,甚至对于特殊零部件的研发也可以采用更加灵活的方式。而在这个过程中,一方面vivo能通过自己的技术和能力为供应链输出新的机器人标准,另一方面也能在成本上做到最优解。
中国通过过去几十年积累的制造业经验,对关键人才的培养、产业环境、市场环境的培育,逐渐形成了一种能力:即尽管很多创新技术优先诞生于海外,但国内可在短时间内追平差距,并使之大规模落地。
这其中,成本摊薄就是一个隐形武器。
而之所以能形成这种能力,有两方面原因,一是丰富的消费场景;二是优秀的供应链。
消费场景决定了上游厂商的开发意愿,当前对于机器人赛道,矿山、医疗、物流都已经是明确有机器人进驻的行业,而vivo主攻的家庭机器人也被视为C端未来最大的市场。
供应链则是打破机器人“成本魔咒”的关键。
一方面,得益于国内成熟的3C和汽车供应链,在复用度上能够给机器人产业带来成本优势;另一方面,按照vivo的表述,只做大脑+眼睛,意味着全身硬件需要与供应链合作。
这种做法类似于苹果做iPhone,将系统和芯片等核心功能掐在自己手中,其余硬件则由供应商提供,好处就是能够极大的降低重资产投入,节约成本。
有了消费场景和供应链两个武器,就从实际层面解决了机器人场景化落地的难题。
理论上来说,任何消费电子产品都是反向设计的,也就是从需求出发设计产品功能,再去搭配实现该功能的零部件。依托这个角度,如果把手机比作二维,那么机器人就是将手机升到了三维甚至四维,而手机厂商进入机器人领域是非常顺滑的。
3、尾声
不久前刚刚结束的GTC大会,英伟达一口气发布了Cosmos、Newton等多款软件和模型,其目标都指向一处:机器人赛道。
在具体思路上,英伟达不仅提供芯片,还会开发对应的软件工具箱和配套服务。换句话说,英伟达为机器人准备好了所有东西,就差亲自下场了。
但英伟达绝对不会下场做机器人,就像它做图形芯片不会下场造PC一样。一个产业的繁荣永远不可能是一家通吃,而是生态共建。
这一点也十分契合vivo做机器人的思路,不是以竞争者的姿态入场,而是携手产业链共建生态。正如胡柏山在博鳌论坛的发言,vivo提倡相互成就的“共生智慧”,共建共享“繁茂的科技生态雨林”。
结合今年胡柏山在vivo会客厅透露的信息以及本次博鳌论坛的发言,vivo起码对家庭机器人赛道有超过十年的长期规划,核心理念是“让技术走出实验室,走进用户的真实生活”,而实现路径则是“渐进突围、沿途下蛋”,总的纲领就是聚焦消费级市场的个人和家庭场景机器人产品。
vivo的优势在于通过移动终端更了解用户应用场景,通过影像和端测AI的技术积累具备领先性。并且能将这些优势实打实的用于机械产业和AI产业在机器人赛道的融合。
免责声明:本文基于已公开的资料信息或受访人提供的信息撰写,但解码Decode及文章作者不保证该等信息资料的完整性、准确性。在任何情况下, 本文中的信息或所表述的意见均不构成对任何人的投资建议。