具身智能如何突破「遥操作」的数据桎梏?商汤联合创始人王晓刚领衔的大晓机器人,交出颠覆性答卷——发布全球首个开源商业落地世界模型「开悟3.0」。
在通往AGI的狂欢中,图灵奖得主Yann LeCun却一直像个执着的「反叛者」。
他不止一次给大语言模型(LLM)泼冷水,直言靠预测下一个字符的概率游戏,永远无法触及真正的智能。
他眼中的未来,属于「世界模型」。
直到李飞飞团队World Labs发布的Marble,当大家亲眼看到那个可以生成、互动且符合逻辑的3D虚拟世界时,LeCun描绘的图景才终于具象化了。
为什么实现AGI需要世界模型
为什么我们如此迫切地需要世界模型?
因为基于大语言模型的AI在物理世界里,是个严重的「偏科生」。
现实数据的采集太苦、太慢了!
教会机器人认识一件红衣服,换成绿色的它可能就「懵」了;
更别提那些极端场景——我们总不能为了训练自动驾驶,真去撞毁一千辆车吧?(还有更多低概率的corner case)
于是,一场围绕物理世界的「数字重构」悄然打响,并分化出三大战场:
游戏VR虚拟世界生成:以李飞飞的Marble为代表;
自动驾驶:以特斯拉FSD为代表;
具身智能:这是当下最火的方向,也是下个十年的AI的重心。
而第三个战场——具身智能,则是目前最难啃的「硬骨头」。
这个领域正撞上一堵看似不可逾越的「数据墙」。
长期以来,行业被迫依赖「遥操作」——让人类穿戴设备手把手教机器人。