“全球超5000万的劳动力缺口”与“三分之二人口无法获得基础医疗影像服务”的现实,揭示了AI的发力方向。
近期,NVIDIA在GTC 2025的两大发布——全球首个开源人形机器人基础模型Isaac GR00T N1,以及联合GE医疗推出的医疗AI仿真平台——给出了一个回应:物理AI(Physical AI)。通过将物理规律嵌入AI训练、用合成数据替代稀缺的人类经验,NVIDIA正在证明:机器人不仅能看得懂世界,更能理解世界如何运转。
GR00T N1基础模型,赋予人形机器人通用技能与推理技能
NVIDIA Isaac GR00T N1是一个开源且可定制的基础模型,可支持通用人形机器人实现推理及各项技能,有助于加速行业转型。据了解,它是一系列可完全定制模型中的首个模型,NVIDIA将对该系列模型进行预训练,并面向全球机器人开发者发布。同时推出的新技术还包括仿真框架和蓝图:如用于生成合成数据的NVIDIA Isaac GR00T Blueprint,以及和Google DeepMind及Disney Research共同开发的、专为机器人开发而构建的开源物理引擎Newton。
黄仁勋指出,通用机器人的时代已经到来,借助NVIDIA Isaac GR00T N1以及新的数据生成和机器人学习框架,全球机器人开发者将开启 AI 时代的全新篇章。
据介绍,GR00T N1 基础模型采用双系统架构,这是受到人类认知原理的启发。“系统1”是一个快速思考的动作模型,反映人类的本能反应或直觉。“系统2”是慢思考模型,用于进行经过深度思考的决策制定。
其中,系统2由视觉语言模型提供支持,它会对所处环境和接收到的指令进行推理,从而规划行动。系统1随后将这些规划转化为精确、连续的机器人运动。系统1基于人类演示数据和 NVIDIA Omniverse平台生成的海量合成数据进行训练。
根据演示来看,GR00T N1可轻松适应并完成通用任务,如单手或双手抓取、移动物体,将物体从一只手臂转移到另一只手臂,或执行需要长语境和通用技能组合的多步骤任务。这些功能可应用于物品搬运、包装和检查等各种使用场景中。值得一提的是,开发者和研究人员可使用真实数据或合成数据针对特定人形机器人或任务对GR00T N1进行后训练。
在GTC主题演讲中,黄仁勋展示了1X的人形机器人自主执行室内清理任务的过程,该过程就是基于GR00T N1的后训练策略。
据了解,这款机器人自主能力是1X与NVIDIA AI协作训练的成果。1X Technologies首席执行官Bernt Børnich认为,人形机器人未来的开发重点在于适应能力和学习能力。由于GR00T N1模型在机器人推理和技能方面实现突破,因此仅需最少量的后训练数据,就能在 NEO Gamma上全面部署。全球其他优先使用 GR00T N1 的领先机器人公司还包括 Agility Robotics、波士顿动力、Mentee Robotics 和 NEURA Robotics。
为了让机器人学习如何以更高精度处理复杂任务,NVIDIA 还与Google DeepMind、Disney Research展开合作,共同开发开源物理引擎Newton。
据介绍,Newton基于NVIDIA Warp框架而构建,将针对机器人学习进行优化,并与Google DeepMind MuJoCo和NVIDIA Isaac Lab等仿真框架兼容。此外,三家公司还计划让Newton能够利用迪士尼的物理引擎。
Disney Research将成为首批使用Newton以推动其机器人角色平台发展的公司之一,该平台为下一代娱乐机器人提供支持,比如此次 GTC 主题演讲中和黄仁勋一起登台、以星球大战为灵感设计的富有表现力的 BDX 机器人,就是该平台的成果。
此外,应对机器人后训练发展的数据问题,NVIDIA宣布了用于合成运动生成的 NVIDIA Isaac GR00T Blueprint。它基于Omniverse 和 NVIDIA Cosmos Transfer 世界基础模型构建,让开发者可以通过少量的人工演示生成大量合成运动数据,以用于操作任务。
利用为蓝图提供的首批组件,NVIDIA 能够在11小时内生成780,000个合成轨迹,相当于 6,500 小时或连续九个月的人类演示数据。然后,通过将合成数据与真实数据相结合,与仅使用真实数据相比,NVIDIA将GR00T N1性能提高了40%。
据介绍,为进一步为开发者社区提供有价值的训练数据,NVIDIA 将发布 GR00T N1 数据集,作为更大的开源物理 AI 数据集的一部分,现在可通过 Hugging Face 下载。
此外,NVIDIA还宣布推出了个人AI超级计算机NVIDIA DGX Spark,为开发者提供一站式系统,可将GR00T N1功能扩展到新机器人、任务和环境中,而无需进行大量自定义编程。
NVIDIA与GE医疗合作,引入物理AI推进自主诊断成像开发
医疗AI方面,则传来NVIDIA与GE医疗合作的消息,双方将共同推进自主成像技术创新,重点开发自主X射线技术与超声应用。GE医疗采用了全新的 NVIDIA Isaac for HealthCare 医疗设备仿真平台,该平台包含预训练模型及基于物理的传感器、解剖结构与环境仿真,可加速研发流程,使GE医疗能够在部署前通过虚拟环境训练、测试与验证自主成像系统能力。
医疗行业作为AI重要的应用领域之一,其实当前医疗服务需求远超供给。超声与X射线作是最常见且广泛使用的诊断成像系统,然而全球仍有近三分之二人口无法获得这类检查服务。通过为成像系统增加机器人能力,有助于扩大医疗服务覆盖范围。
NVIDIA将通过Isaac for Healthcare支持更多客户构建仿真环境用例。仿真环境使机器人系统能够在物理精确的虚拟环境中安全学习技能,以应对手术等现实场景,这些场景通常难以复现。
Isaac for Healthcare 是基于NVIDIA三大机器人计算平台(NVIDIA DGX,NVIDIA Omniverse以及 NVIDIA Holoscan)构建的物理 AI 平台,包含专为医疗机器人优化的AI模型,可通过增强视觉与语言处理能力实现理解、行动与观察功能。平台还提供仿真框架,供开发者精确仿真医疗环境,并通过边缘AI计算平台NVIDIA Holoscan实现实时机器人决策。
借助 Isaac for Healthcare,医疗传感器仿真选项有限的问题有望得到解决。开发者可访问基于物理的医疗环境数字孪生,导入定制传感器、器械甚至解剖结构,训练机器人应对多样化场景。此类虚拟环境有助于缩小仿真与现实的差距,支持快速数字原型设计。
据介绍,该平台支持从微观结构、手术室到完整医院设施的多尺度仿真。通过仿真策略训练,机器人系统可学习如何在手术室的各种医疗场景中做出反应,以及如何以最佳方式辅助医生做出决策和为患者提供护理服务。
Isaac for Healthcare 将会通过仿真复杂医疗场景、训练AI模型及优化手术、内窥镜与心血管介入等机器人应用,加速医疗机器人解决方案开发。目前,Moon Surgical、Neptune Medical 以及Xcath等机构已经提前开始使用这一平台。这些合作伙伴可以将其仿真工具、传感器、机器人系统与医疗探针无缝集成至专用仿真环境。Ansys、Franka、ImFusion、Kinova 与 Kuka 在内的生态合作伙伴已经提前开始部署这一功能。
NVIDIA机器人布局:打通全链条能力
NVIDIA在机器人领域的布局已经展现了一条清晰的战略路径:通过底层技术堆栈的垂直整合,正在打通从数据生成到硬件落地的全链条能力,同时以开源协作加速生态建设。
用于合成数据生成的全新 Omniverse Blueprint和开源数据集,正在快速开启物理AI的数据飞轮。通过将Omniverse与合成数据生成的深度结合,解决了机器人训练中数据稀缺与多样性的核心痛点。特别是对于人形机器人这类需要高度动态适应的领域,为算法优化提供了更大的试错空间。
并且,GR00T N1模型、Newton引擎等开源举措,将有助于吸引开发者与合作伙伴共建生态。通过开放物理仿真核心能力,开发者可以低成本接入高精度仿真环境,同时社区贡献的插件与扩展,将反哺工具链的完善。这种开放协作的模式,不仅降低了中小企业的创新门槛,还有望催生跨行业应用(如工业机器人与医疗机器人的技术迁移),形成良性循环的创新生态。
另一方面,NVIDIA面向医疗领域推出的Isaac for Healthcare 医疗设备仿真平台,作为基于NVIDIA三大机器人计算平台(NVIDIA DGX,NVIDIA Omniverse以及 NVIDIA Holoscan)构建的物理 AI 平台,通过引入物理AI推进自主诊断成像开发,体现了对行业需求的精准洞察。这种“通用+垂直”的并行策略,既保证了技术底座的可扩展性,又能在细分市场快速建立竞争优势。
有望重新定义机器人技术边界
NVIDIA正在通过AI与物理仿真为核心,重构机器人开发范式。从数据生成、算法训练到硬件部署,其技术堆栈覆盖了机器人开发全生命周期,而开源策略则打破了传统封闭系统的局限性,推动行业向协作式创新迈进。
在AI与机器人深度融合的当下,这一战略不仅加速了从实验室到工厂、医疗场景的落地进程,更预示着一个更广阔的未来:机器人将不再是被动执行指令的工具,而是具备自主感知、学习和适应能力的“智能体”。这一进化,或将重新定义机器人的技术边界,开启新一轮创新变革。