Anonymous Intelligence Signal

智元机器人启动ICRA 2026赛事,VLA与世界模型两大技术路线从争议走向协同

human The Lab unverified 2026-03-26 06:09:36 Source: 澎湃新闻 (RSSHub)

具身智能领域长期存在的技术路线之争,正从对立转向融合。围绕VLA(视觉-语言-行动)模型与WMA(世界模型+动作策略)模型孰优孰劣的讨论曾是行业热点,如今,领先的机器人公司正通过实际行动推动两者协同。智元机器人近日正式启动了“AGIBOT WORLD CHALLENGE @ ICRA 2026”机器人赛事,其两大核心赛道——“推理-操作”与“世界模型”——正是对这一融合趋势的直接呼应。

智元机器人Genie业务部生态及解决方案总监沈咏剑明确表示,从长期趋势看,世界模型与VLA并非简单的替代关系,未来存在结合的可能。他指出,VLA路径让机器人基于视觉和语言指令直接生成动作,但在面对更复杂、长链条的任务时已显不足。机器人需要更深层的理解、任务拆解、环境推演和策略调整能力。这正是世界模型试图补足的方向。本次赛事的世界模型赛道,就旨在考察模型根据机器人动作建模物理环境动态的能力,要求参赛者基于真实观测数据训练视频生成模型,以预测机器人在任务场景中的交互。

与此同时,“推理-操作”赛道的任务设计也体现了对更高阶智能的需求。沈咏剑对比指出,去年的任务如“叠衣服”相对固定,而今年加入了如“整理桌面”这类开放式任务。这要求机器人不仅要执行动作,还需先理解“整洁”的定义,自主进行任务规划与步骤拆解。沈咏剑认为,世界模型的核心可概括为一种对未来状态的预测与推演能力,这与当前VLA专注于即时感知与执行的能力形成了互补而非对立的关系。这场赛事标志着行业正超越路线之争,转向探索如何将环境理解、状态预测与精准操作能力相结合,以攻克更复杂的现实任务。