机器人3.0时代 黄仁勋出招
从GTC2024的人形机器人军团,到GTC2025年的迪士尼萌宠Blue,机器人成为了黄仁勋演讲的压轴节目。
压轴出场往往指向未来趋势,机器人无疑是英伟达瞄准的下一个标的。今年的GTC大会不仅展示了英伟达在AI推理计算上的最新成果,更揭开了其在机器人领域的战略蓝图。
“通用机器人的时代已经到来。”英伟达创始人兼CEO黄仁勋在演讲中表示,劳动力需求与AI技术的高速发展正在推动通用机器人加速走向产业化。
此次GTC中,英伟达通过发布全球首个开源人形机器人基础模型Isaac GR00T N1,以及一系列配套的仿真框架和物理引擎,为通用机器人的发展提供了完整的“英伟达方案”。从基础模型到工业制造和医疗服务,英伟达正在构建一个全方位的机器人开发生态系统,推动机器人技术向各种实际应用场景深度渗透。
而英伟达对于机器人产业的重视,还体现在更多行动细节中。在2025年伊始,英伟达在北京的迎春会上,邀请了一众机器人企业参加晚宴,宇树科技、银河通用等明星公司的创始人就和黄仁勋同桌交谈。作为下一个AI的重要场景,机器人的盛宴正在启动,英伟达正在开拓更智能、更开放的新生态圈。
GR00T N1:通用机器人的新篇章
当前的英伟达,已经不仅仅是芯片厂商,它的产品线已经覆盖到AI基建的多个层面。黄仁勋就谈道,英伟达在AI基础设施方面有三个核心重点,分别是云数据中心、企业IT和机器人系统。
机器人在英伟达业务中的重要性可见一斑,但在黄仁勋看来,这个赛道的商业机遇远远早于机器人本身。
他说道:“在拥有机器人之前,必须先为机器人打造AI。在拥有聊天机器人之前,必须先创建聊天机器人的AI。聊天机器人只是最后的一环,是终端的呈现。因此,要推动全球机器人产业的发展,其上游需要大量的AI基础设施。我们必须打造这些基础设施,以教会机器人如何成为真正的机器人。”
因此,英伟达要做的是上游的铺路者,而教会机器人比训练聊天机器人要困难得多。“机器人不仅要操控物理世界中的物体,还要能够理解现实世界的物理属性,”黄仁勋进一步谈道,“因此,我们必须为其发明新的技术。而训练它们所需的数据量是巨大的,不仅仅是文本,而是视频数据、物理规律等更复杂的多模态信息。”
而英伟达已经投入多年,并提炼出了“Physical AI”(物理AI)的概念,这也是今年黄仁勋演讲中的核心关键词之一。他认为生成式AI(Gen-AI)、代理式AI(Agentic AI)之后,物理AI将是终极阶段,物理AI又主要面向自动驾驶和机器人。
对于机器人而言,很重要的就是AI大脑,而大模型为机器人安装了大脑,甚至小脑。
英伟达酝酿已久,GTC上最新发布的Isaac GR00T N1,是全球首个开源且完全可定制的人形机器人基础模型,能够赋予机器人通用技能与推理能力。这个模型的设计灵感或许受到经济学家、心理学家丹尼尔·卡尼曼对人类思维模式研究的影响,结合了直觉与逻辑的优势。
汇正财经资深研究员张轩在接受媒体采访时谈道:“GR00T N1为机器人具身智能时代的到来奠定了坚实的基础。”他格外强调开源策略可能释放的巨大协同创新潜力,“模型的开源会降低开发的门槛,促进技术的普及和应用的多样化,同时也将促进机器人产业链的整合,推动创新生态的建立。”
不止模型:英伟达的“三台计算机”
英伟达在通用机器人领域展示的“组合拳”远不止GR00T N1。事实上,黄仁勋提出的架构是,每家机器人公司最终都必须构建三台计算机。换言之,为了开发人形机器人,需要三个加速计算机系统来分别处理机器人的训练、仿真和运行时(Run time,计算机程序从开始执行到终止执行的运作、执行的时期)。
首先,前述提到的GR00T N1大模型,就属于训练模型的环节。开发者可以在英伟达平台上使用NVIDIA NeMo来训练和微调强大的基础和生成式AI模型,也可以直接使用GR00T N1模型。
其次,英伟达的数字孪生平台Omniverse结合Cosmos平台,能够为测试和优化机器人提供开发平台和仿真环境。简单来说,就是在虚拟数字世界中先构建出机器人,并进行“线上”测验。
比如,借助Omniverse和Issac Sim,开发者能够在更逼真的虚拟环境中对机器人进行训练、测试和验证,同时借助Replicator SDK生成仿真数据。从而有效克服传统机器人训练中真实数据缺失的痛点,大幅降低数据采集成本并加速模型的训练进程。
从实用案例上看,智元机器人利用Isaac Sim、GR00T-Teleop和GR00T-Mimic框架打造出一套高效的仿真数据采集方案,大幅提升了数据生成效率。银河通用团队则借助Isaac Sim上的Isaac Lab组件搭建了一个大规模数据集DexGraspNet,其中包含132万个ShadowHand对5355个物体的抓握动作,数据的质量和多样性都得到提高。
英伟达上周还发布了全新的Omniverse Blueprint以及一款与Google DeepMind和Disney Research联合开发的Newton物理引擎。Newton物理引擎基于英伟达Warp框架构建,不仅能够生成高质量的仿真数据,还能模拟真实世界中的物理环境。
Cosmos平台也是为了达到同样的目的,Cosmos平台依托“世界基础模型”(World Foundation Models),企业可以在虚拟环境中模拟多种场景,开发适用于机器人和自动驾驶汽车的软件,而无需依赖昂贵的机器人设备或在现实中进行道路测试。这大幅降低了开发成本,并加快了技术迭代。
最后,训练好的AI模型会被部署到运行时计算机上,这就是第三台计算机。英伟达已经推出了小巧的Jetson Thor机器人计算机,搭载上Jetson Thor这款硬件产品,就可以快速开发中小型机器人。
可以看出,英伟达正在构建一个完整的机器人开发生态系统,为开发者提供从数据生成、模型训练、仿真环境到实际部署的全流程支持。这种“全栈式方案”降低了开发门槛,加速机器人技术的创新与应用。
TrendForce集邦咨询分析师曾伯楷向21世纪经济报道记者表示,尽管GR00T N1采用开源模式,但训练模型得出的参数往往与机器人硬件配置有一定程度的绑定。这意味着,使用GR00T N1的开发者可能需要依靠英伟达的硬件解决方案,才能实现效益最大化。
例如,专为紧凑型版载计算需求而设计的Jetson Thor机器人计算机,正是英伟达为人形机器人打造的硬件平台。通过这种软硬件一体化的模式,英伟达能够在开源中构建起竞争壁垒。
这一策略与英伟达通过CUDA技术和GPU芯片建立AI产业领先地位的路径高度相似。通过提供全面的软件工具链和硬件支持,英伟达不仅巩固了其市场地位,还为竞争对手设置了很高的进入门槛。
机器人3.0:从车到机器人
麻省理工学院物理学教授泰格马克在《生命3.0:人工智能时代,人类的进化与重生》中提出,人类通过技术进化的三个阶段。
生命1.0,软件不能换,硬件也不能换,全部由DNA决定,相当于早期人类。
生命2.0,软件能换,硬件不能换,可以学习新的思想、语言,相当于现代人类。
生命3.0,软件能换,硬件也能换,包括对数字生命技术,摆脱基因对人类的束缚。
这种总结对于理解新的技术发展是方便法门,事实上,技术的发生并不完全是简单线性分段的,而更像是进化、像基因一样夺命狂奔后的机缘巧合。
借用以上的分类方法,洗衣机、空调、冰箱、电饭锅可以称为第一代机器人(1.0阶段),它们是只为干一种固定的任务而被创造的机器。
汽车、电脑、手机则属于第二代机器人(2.0阶段),虽然他们的作用依然高度聚集在某一领域,但能够承接的任务却高度多样化,并且其上开始搭载可升级的软件系统。
汽车工业,特别是新能源和智能汽车是通向第三代机器人,即人形机器人的康庄大道。他们的制造能力基础极其接近,所以变形金刚又叫做“汽车人”。
事实上,英伟达对于机器人的分类就颇有深度,黄仁勋在CES的演讲中曾指出三种机器人,第一是代理机器人(agentic robots)和代理AI(agentic AI),第二是自动驾驶汽车,第三是人形机器人。从中也能看到英伟达在机器人领域的野心,在AI触及的泛机器人地带,英伟达都要延伸到。
一位AI资深人士向21世纪经济报道记者分析道,人形机器人的三个核心基础构成,分别是机械控制、续航动力和智能软件,而这三个要素在智能汽车领域都完全具备。其在生产过程中使用的大量自动化机械臂、智能驾驶的训练场景、电池动力及安全管控都为机器人生产提供基础。
所以,可以看到,越是造车新势力的汽车厂商,越是更积极地发布自己的机器人产品,只是多开一条生产线的问题。雷军在发布汽车前先发布CyberOne人形机器人,不是和手机业务联动,而是和汽车业务呼应。小鹏推出PX5,特斯拉汽车推出擎天柱也是如此。
借用生物进化的视角,有的物种虽然长相差距很大,却有着高度相似的基因,智能汽车和人形机器人,在工业上堪称亲戚。
对于不同的任务而言,人类不再需要为单个任务研发不同的机器人了,机器人进入3.0阶段。如果说AGI是通用人工智能,处理全部智力类的任务,那么人形机器人则是通用机器人,处理全部物理类的任务。
通用机器人时代要来了吗?
不止一次,黄仁勋在发言中谈及人形机器人的光明未来。在ITF World 2023半导体大会上,黄仁勋就曾表示,人工智能的下一个浪潮将是具身智能(Embodied AI)。
所谓具身智能,核心是与物理世界进行互动,就是要AI要具备“身体力行、躬身入局”的身体。与其说人工智能助力了人形机器人的发展,不如更深刻地说,人形机器人是人工智能发展的重要机会。
到了2024年,黄仁勋更加看好机器人赛道,他说:“在重工业和制造业,对机器人的投资正在激增,是被物理AI的新突破引发的,认知智能基础模型的快速发展,物理智能基础模型快速进步,机器人时代即将到来。”
2025年初,黄仁勋进一步做出判断:“通用机器人的ChatGPT时刻即将到来。”回顾英伟达的加速计算之路,几乎每一次都能精准地踏在AI浪潮的节奏上。从游戏PC市场,到深度学习的崛起,到云计算的普及,再到生成式AI的降临,英伟达的技术所向披靡。眼下,机器人成为了英伟达瞄准的下一个空间。
在人形机器人领域,海外的人形机器人玩家以美国为主,包括Figure AI、Agility Robotics、波士顿动力、特斯拉等,知名的仅1x Technologies在挪威。国内的玩家主要包括优必选、达阀科技、宇树科技、银河通用、傅里叶智能、智元机器人等。随着大语言模型这一核心基础的持续发展,人形机器人开始进入快速发展期,并逐步进入商业化阶段。
根据曾伯楷的分析,在GR00T N1达到大幅优化机器人AI训练的前提下,预期该领域产品将提前放量,推升全球人形机器人市场产值于2028年接近40亿美元。高盛在最新的分析中同样给予人形机器人很高的期待,据高盛预测,到2035年全球人形机器人市场的规模将达到380亿美元,较其两年前约60亿美元的预测值增长了六倍多,可见行业发展速度远超预期态势。
尽管前景广阔,但人形机器人行业的竞争格局依然复杂,市场发展也面临诸多挑战。除了英伟达,Google和Figure AI等企业也正在加速布局机器人领域。Google DeepMind在今年3月推出的Gemini Robotics同样整合了动作模型与推理模型,能够胜任复杂的物理任务。
Figure AI的Helix则采用了与N1相类似的双系统架构,既能做出快速反应,又可以深入理解命令,聚焦于提高机器人的高频、精细控制能力。不过,据曾伯楷分析,目前英伟达在数据完备性与部署灵活性上有一定优势,使其在当下的机器人竞争格局中略胜一筹。
当然,通用人形机器人的商业化进程仍然受到硬件成本、算法优化以及市场接受度等多重因素的制约。从软硬件角度看,虽然AI模型能力不断提升,但人形机器人的机械结构、传感器系统和动力系统仍需突破,成本高昂且较难规模化生产。
尽管面临挑战,但是英伟达对未来高度乐观,将通用机器人视为AI算力的下一个重要出口。