机器人何时迎来ChatGPT时刻:具身智能的三大关键难题

行业洞察 · 实践沉淀 · 持续进化

机器人何时迎来ChatGPT时刻:具身智能的三大关键难题

2026-03-18 01:12
lianghaoze

具身智能正处于临界点前夜,未来1至3年将成为决定能否实现突破的关键窗口期。这是宇树科技创始人王兴兴在英伟达GTC大会演讲中传达的核心判断。面对"机器人何时迎来属于自己的ChatGPT时刻"这一行业终极命题,王兴兴给出了明确标准:如果机器人能够在80%的陌生场景中,仅通过语言指令完成80%的任务,即可视为具身智能迈入"确定性时刻"。这一节点将推动行业从展示走向规模化应用,成为具有历史意义的产业转折时刻。

产业现状:从炫技到实用的跨越前夕

产业现状:从炫技到实用的跨越前夕

产业现状:从炫技到实用的跨越前夕

尽管市场热度持续攀升,但真正具备强泛化能力、能够在陌生环境中稳定执行任务的通用具身智能模型仍未出现。王兴兴直言,目前行业整体仍停留在"临界点之前",未来1至3年将成为决定能否实现突破的关键窗口期。快则一两年、慢则两三年,谁能率先突破,谁就有可能真正点燃全球具身智能大规模应用的前夜。

宇树科技在过去一年交出了令人瞩目的成绩单:G1人形机器人成为全球经典机型,长跑1500米仅需6分多钟,已超过一般普通人;A2中型工业级机器狗性能指标突出;H2大尺寸人形机器人身高1.8米,适合承担体力类工作。这些产品覆盖了从消费级到工业级的多层次需求,但更重要的是,它们背后代表的技术路径正在从单点突破走向系统整合。

三大核心挑战:横亘在突破路上的三座大山

三大核心挑战:横亘在突破路上的三座大山

三大核心挑战:横亘在突破路上的三座大山

王兴兴系统总结了当前具身智能面临的三大核心挑战,这些挑战也是阻碍产业跨越临界点的关键瓶颈:

首先是模型表达能力不足。目前很多模型只能完成基础动作,无法实时生成、表达各类复杂、非常规动作。如果模型连动作都无法有效表达和生成,就更谈不上高质量执行。这意味着,即使拥有强大的硬件基础,如果没有相应的软件模型支撑,机器人仍然无法真正"干活"。

其次是数据稀缺问题。机器人领域的数据与语言模型完全不同,真实机器人数据非常稀缺。如果必须依赖海量真机数据才能训练出可用模型,整体效率太低。因此必须提高对视频数据、仿真数据的利用效率,降低对真机数据的依赖。互联网视频数据体量极大,如果能高效利用,将极大降低对真机采集的压力。

最后是强化学习缺乏规模化复用机制。目前行业普遍存在一个严重问题:训练完一个新动作,相关数据就被丢弃,新任务要重新训练。这种"一次性使用"模式无法形成规模效应。如果能将多场景、多任务的数据整合到统一大模型里,实现二次复用、持续迭代,就会形成更强的规模效应与指数级进步。

技术路径选择:世界模型与视频生成的优势与困境

技术路径选择:世界模型与视频生成的优势与困境

技术路径选择:世界模型与视频生成的优势与困境

在技术路径上,王兴兴更看好基于世界模型与视频生成模型的方向。他认为这一路径上限更高、数据来源更广,更有可能成为主流方向。宇树科技在2024到2025年开源了自研的基于视频生成的世界模型:机器人可以先"想象"未来动作,再与实际机器人运动对齐执行,视频生成效果非常好。

然而,这一路径也面临着一个全球性难题:仿真与真实世界难以精准对齐。视频里可以做到几乎零误差,但在真实机器人上,哪怕只差1毫米,效果也可能天差地别。这就像是在虚拟世界中画出一个完美的舞蹈,但在真实舞台上却因为微小的偏差而摔倒。如何将视频生成模型与强化学习结合,实现从想象到执行的精准转化,将是未来技术突破的关键方向。

相比之下,传统VR模型的天花板相对更低,尤其在泛化能力上仍存在明显瓶颈。这也是为什么越来越多的研究者开始转向世界模型和视频生成这条道路。

确定性时刻定义:80/80法则与全球协同

确定性时刻定义:80/80法则与全球协同

确定性时刻定义:80/80法则与全球协同

王兴兴给出了他对具身智能确定性时刻的明确定义:机器人能够在80%的陌生场景中,只通过语言或文字指令,不需要预先训练、不需要采集地图、不需要额外部署,就能完成约80%的任务,并且任务成功率达到较高水平。一旦实现这个目标,就真正跨过了具身智能的临界点。

这个"80/80法则"不仅是技术指标,更是产业标准。它标志着机器人从"能表演"进化到"能干活"的质变。当机器人能够在大多数陌生环境中,通过简单的语言指令就能完成大部分任务时,具身智能将真正进入实用化阶段,开始大规模替代人类在危险、重复、繁重工作场景中的劳动。

王兴兴强调,具身智能的发展不是单一公司或国家可以完成的工程,而需要全球协同推进。宇树科技一直坚持开源,基本每隔一个月就会开源算法、数据集等相关成果,建立了技术社区,分享前沿论文、研究观点和相关项目链接。这种开放态度反映了整个行业的共识:机器人、AI、具身智能领域,不是一家公司、一两个国家的事情,而是需要全球共同合作、共同推进的事业。

无论谁先实现突破,对整个行业都是重大利好。对于一个新兴行业,大家好,才是真的好。王兴兴的这句话道出了具身智能发展的真谛:这不仅是技术竞赛,更是人类共同的事业。当那一天真正到来时,将不仅仅是一家公司的胜利,而是整个人类科技史上的历史性一刻,会真正点燃整个行业的热情,开启智能机器人时代的全新篇章。

感谢您的阅读

欢迎与我们探讨更多行业落地方式,共同推动技术创新与实践。