如何定义具身智能“ChatGPT时刻”？宇树科技王兴兴：机器人能在陌生场景中完成80%的任务

2025-11-05 21:13:35

每经记者｜朱成祥每经编辑｜黄博文

11月5日，在第八届虹桥国际经济论坛“人形机器人创新发展合作”分论坛上，宇树科技创始人兼首席执行官王兴兴发表了主题演讲。

王兴兴认为，今年机器人产业非常火热。不过，他也指出，机器人大模型进展比想象中缓慢，还没有达到临界值。王兴兴表示，具身智能大模型、端到端技术的进步，总体上非常快，但是比他想象的稍微慢一点点。

对于什么才是具身智能发展的临界点，即具身智能“ChatGPT时刻”，王兴兴认为，在陌生的场景中，给机器人发送语音或文字，若机器人能够完成80%左右的任务。这便是突破性技术，基本可以达到“ChatGPT时刻”。

那么，为了早日实现“ChatGPT时刻”，更应该研究模型，还是收集更多的数据？王兴兴表示，目前在模型结构上大家做了很多尝试，发现泛化能力不够，还需要创新。大家也需要收集更大规模的数据、质量更好的数据。但目前，对数据的采集、对数据质量的评判还非常困难。

王兴兴提出，模型和数据需要相辅相成，而不是一股脑采集大量数据，或者一股脑把模型做大。

目前，具身智能主流模型有VLA（视频语言动作）+RL（强化学习）模型和基于视频生成的世界模型。王兴兴表示，前者可以用仿真环境做训练，或者用真实场景做训练，但泛化能力相对来说不是特别够。因此，他更喜欢基于视频生成的世界模型。

然而，王兴兴也认为，该模型面临比较大的挑战。因为基于视频生成的世界模型对算力的需求非常大，需要的算力卡比较多，所以中小型人形机器人公司往往“跑不动”，反而是一些大型AI公司、互联网公司视频模型的资源更加丰富，做出该模型的概率更大。

如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权，严禁转载或镜像，违者必究。

读者热线：4008890008

特别提醒：如果我们使用了您的图片，请作者与本站联系索取稿酬。如您不希望作品出现在本站，可联系我们要求撤下您的作品。

上一篇文章

华仁药业：公司实际控制人变更事项目前尚处于筹划过程中

下一篇文章

美国10月ADP就业人数增加4.2万人，预期增加3万人，前值减少3.2万人

热文精选

点击排行

欢迎关注每日经济新闻APP