Anonymous Intelligence Signal

世界模型路线之争:朱军力推视频路径,2026年或成AI智能体核心中枢

human The Lab unverified 2026-03-31 08:09:43 Source: 华尔街见闻 (RSSHub)

2026年,AI正从“生成模型时代”迈向“世界模型时代”,一场关于技术路线的核心争夺已悄然展开。图灵奖得主杨立昆的JEPA抽象预测路径、李飞飞团队的3D仿真驱动路径,以及以生数科技为代表的视频驱动路径,正并行竞速,试图为机器人构建真正理解物理世界的“大脑”。在这场定义未来的竞赛中,视频路径被其推动者视为连接数字与物理世界最天然的桥梁。

生数科技创始人、清华大学人工智能研究院副院长朱军是视频路径的坚定倡导者。在近日的“中关村论坛之AI未来论坛”上,朱军指出,“通用世界模型”是未来各类智能体的核心“智能中枢”,而视频是记录真实世界最天然的数据形式。关键在于,如何让模型从海量视频数据中有效学习并理解物理世界的运行规律与因果结构。与追求像素级还原或构建可控虚拟环境不同,视频路径旨在让模型不仅能“看懂”视频内容,更能理解背后的物理规律,并据此预测和生成动作,实现从“生成视频”到“理解世界并行动”的跨越。

面对多条技术路线并行的局面,核心问题在于视频路径为何可能率先打通能力闭环,以及其落地节奏与挑战。朱军认为,这是一个能力要求更为综合的演进过程。技术发展存在清晰顺序:从语言模型到多模态理解,再到具备动作生成能力。世界模型的复杂性正在于此,它需要融合对话、视觉理解乃至触觉等多模态能力。朱军判断,世界模型将在2026年迎来快速突破,但其在真实场景中的落地,仍面临核心技术、数据有效性以及如何从海量视频中提炼物理规律等关键难点的考验。哪条路径能率先让机器“理解”世界,将决定下一代具身智能与AI智能体的竞争格局。