拉斯维加斯CES上,英伟达最新发布了一系列机器人基础模型、数据管线和仿真框架,以加速下一代人形机器人的开发进程。
随着Isaac GR00T Blueprint及相关技术的推出,人形机器人的开发进程会大大加速,这将为该市场注入强劲动力。开发者能够更高效地开发出性能更优、功能更丰富的人形机器人,满足工业和制造业等领域的巨大需求,推动相关行业的智能化升级和生产力提升。
三大突破,加速人形机器人开发训练过程
英伟达创始人兼首席执行官黄仁勋在CES上宣布了用于合成运动生成的 NVIDIA Isaac GR00T Blueprint,可帮助开发者生成海量的合成运动数据,以便通过模仿学习来训练人形机器人。预计未来二十年,人形机器人市场将达到 380 亿美元。英伟达最新突破主要体现在以下三大方面:
首先是合成运动生成。
Isaac GR00T Blueprint通过合成运动生成技术,极大地降低了人形机器人训练数据的获取成本和难度。
传统的数据收集方式需要在真实世界中进行大量繁琐的人类动作捕捉,在真实世界中收集这些广泛、高质量的数据集既繁琐又耗时,而且成本往往高得令人却步。而该技术只需少量人类示范,就能生成海量的合成运动数据集。这不仅提高了数据获取的效率,还使得开发者能够快速扩充数据集,涵盖更丰富的动作和场景,为人形机器人的训练提供了更充分的数据支持。
其次是模仿学习的高效应用。
模仿学习作为机器人学习的一个重要子集,能够让人形机器人通过观察和模仿人类专家的示范来获取新技能。Isaac GR00T Blueprint将模仿学习与合成运动生成相结合,使得机器人在仿真环境中能够更高效地学习和掌握复杂的动作和任务。这种学习方式不仅能够提高机器人的学习效率,还能使其更好地适应多样化的应用场景.
第三是仿真与现实的无缝衔接。
最新推出的NVIDIA Cosmos平台,进一步缩小了仿真与现实之间的差距。该平台拥有一系列开放的预训练世界基础模型,专为生成具有物理感知的视频和物理AI开发所需的世界状态而设计。它包含自回归模型和扩散模型,有各种模型尺寸并适用于多种输入数据格式。这些模型基于1800万亿个数据单元进行训练,其中包括 200 万小时的自动驾驶、机器人、无人机拍摄的视频以及合成数据。
除了帮助生成大型数据集外,Cosmos 还能通过将图像从3D扩展到真实场景,使得仿真环境中的数据更加接近现实世界,从而提高了机器人在现实世界中的应用效果。结合Omniverse的高度可控、物理精确的仿真能力,能够最大限度地减少世界模型常见的幻觉问题,确保机器人在现实世界中的行为和决策更加准确可靠。
Isaac GR00T Blueprint加速人形机器人训练全流程
下图是NVIDIA Isaac GR00T Blueprint的合成运动生成流程,通过一系列用于加速人形机器人开发的工具和框架,英伟达实现了从动作捕捉到机器人策略训练的整个过程的加速。
首先通过 GR00T-Teleop 工作流,用户可以借助 Apple Vision Pro 在数字孪生环境中捕捉人类动作。这些人类动作会被记录下来作为金标准,并在仿真环境中由机器人模仿学习,这也是机器人学习的基础。
然后,GR00T-Mimic 工作流会将捕捉到的人类示范扩展成更大的合成运动数据集。通过Motion Annotator和Isaac Lab,机器人开始模仿人类的动作,这个过程涉及到轨迹生成(Trajectory Generation)、加速物理引擎(Accelerated Physics Engine)和轨迹评估器(Trajectory Evaluator)。
最后,基于 NVIDIA Omniverse 和 NVIDIA Cosmos 平台构建的 GR00T-Gen 工作流,会通过域随机化和 3D 提升技术,指数级扩增这个数据集。
之后,该数据集可作为机器人策略的输入,在 NVIDIA Isaac Lab(一个用于机器人学习的开源模块化框架)中,教会机器人如何在其环境中高效且安全地移动和互动。
人形机器人将成为主流,英伟达打造强大生态系统
对人形机器人的未来,黄仁勋持有非常乐观的态度。他认为,人形机器人的时代即将到来,这标志着通用机器人技术的重大进步。预计人形机器人将成为主流,并且售价可能降至1-2万美元。
人形机器人领域,英伟达一直致力于构建一个强大的生态系统,涵盖从基础模型开发、数据生成与处理、仿真训练到实际应用的各个环节,为开发者提供了全方位的技术支持和服务。目前,包括波士顿动力、Figure等在内的主要机器人公司已经开始采用Isaac GR00T,并展示了相关成果。
下一步,这将吸引更多的企业和开发者加入到这个生态系统中,共同推动人形机器人技术的发展和应用。特别是跨领域的合作,将会大大加速人形机器人的开发与创新。例如,软件开发商可以利用Isaac GR00T Blueprint生成的合成数据集,开发出更加智能和高效的人形机器人控制软件;硬件制造商可以结合NVIDIA的硬件平台和工具,设计和制造出性能更优的人形机器人硬件;科研机构可以借助这些技术进行人形机器人相关的研究和探索,推动人工智能和机器人技术的前沿发展。
正如黄仁勋强调,英伟达在机器人领域的三机协同方案:DGX系统负责基础训练,搭载Cosmos的Omniverse处理优化和强化学习,最后由AGX在现实环境中执行推理任务。这一系列平台,不仅提供了开发方案的闭环实现,也进一步为机器人未来的加速创新奠定了坚实基础。