The Lab · 2026-03-26 06:09:36 · 澎湃新闻 (RSSHub)
具身智能领域长期存在的技术路线之争,正从对立转向融合。围绕VLA(视觉-语言-行动)模型与WMA(世界模型+动作策略)模型孰优孰劣的讨论曾是行业热点,如今,领先的机器人公司正通过实际行动推动两者协同。智元机器人近日正式启动了“AGIBOT WORLD CHALLENGE @ ICRA 2026”机器人赛事,其两大核心赛道——“推理-操作”与“世界模型”——正是对这一融合趋势的直接呼应。
智元机器人Genie业务部生态及解决方案总监沈咏剑明确表示,从长期趋势看,世界模型与VLA并非简单的替代关系,未来存在结合的可能。他指出,VLA路径让机器人基于视觉和语言指令直接生成动作,但在面对更复杂、长链条的任务时已显不足。机器人需要更深层的理...
The Lab · 2026-03-30 07:39:52 · 华尔街见闻 (RSSHub)
在具身世界模型这一全球前沿竞技场上,一家中国团队完成了出人意料的技术超车。极佳视界(GigaWorld)推出的最新模型GigaWorld-1,在全球公认的权威评测基准WorldArena中登顶综合排名第一,成为唯一一个综合得分突破60分大关的模型,对谷歌、英伟达等科技巨头实现了断层式领先。这一结果标志着中国团队在构建能够理解物理世界、进行三维空间认知与动作预测的核心AI模型上,取得了关键性突破。
WorldArena由清华大学联合普林斯顿大学、新加坡国立大学等八所顶尖高校及科研机构共同打造,其评测体系以严苛著称,包含16项核心指标和3大真实应用任务。在首批参评的全球头部团队中,并非科技巨头,而是由清华系领衔、汇聚了阿里、百度、地平...
The Lab · 2026-03-31 08:09:43 · 华尔街见闻 (RSSHub)
2026年,AI正从“生成模型时代”迈向“世界模型时代”,一场关于技术路线的核心争夺已悄然展开。图灵奖得主杨立昆的JEPA抽象预测路径、李飞飞团队的3D仿真驱动路径,以及以生数科技为代表的视频驱动路径,正并行竞速,试图为机器人构建真正理解物理世界的“大脑”。在这场定义未来的竞赛中,视频路径被其推动者视为连接数字与物理世界最天然的桥梁。
生数科技创始人、清华大学人工智能研究院副院长朱军是视频路径的坚定倡导者。在近日的“中关村论坛之AI未来论坛”上,朱军指出,“通用世界模型”是未来各类智能体的核心“智能中枢”,而视频是记录真实世界最天然的数据形式。关键在于,如何让模型从海量视频数据中有效学习并理解物理世界的运行规律与因果结构。与追求像...
The Lab · 2026-03-31 10:09:31 · 36氪最新 (RSSHub)
2026年,AI正从“生成模型时代”迈向“世界模型时代”,一场定义机器人如何“理解”物理世界的技术路线之争已全面展开。图灵奖得主杨立昆团队基于JEPA架构的LeWorldModel,与斯坦福大学教授李飞飞World Labs的商用3D世界模型Marble,代表了当前最前沿的两大技术范式。几乎所有的具身智能公司都已将世界模型列为核心技术方向,行业共识已然形成,但通往“通用世界模型”的路径却远未统一。
目前,技术路线主要分为三类:以杨立昆LeWorldModel为代表的JEPA抽象预测路径,不追求像素级还原,重在潜空间学习因果与物理规律;以李飞飞Marble为代表的3D/仿真驱动路径,通过构建可控虚拟环境进行学习;以及以生数科技、Ru...
The Lab · 2026-04-03 10:00:05 · 36氪最新 (RSSHub)
2026年3月,由Yann LeCun创立的AMI Labs宣布完成10.3亿美元种子轮融资,几乎同时,李飞飞的World Labs也完成约10亿美元融资。Google DeepMind发布Genie 3世界模型,特斯拉则持续推进Optimus人形机器人的工厂部署。这些密集事件并非孤立,它们共同宣告AI竞争的核心战场已发生根本性转移:从“理解数字世界”转向“理解并作用于物理世界”。这标志着硅谷的叙事核心,正从大语言模型和智能体,转向一个更底层的命题——AI能否真正理解“世界如何运转”并在现实中完成任务。
这一转向远不止是技术路线的变化,它意味着整个产业价值链正在被系统性重构。过去两年的AI竞赛高度集中在模型、算力等少数高门槛环节;...
The Lab · 2026-04-13 01:33:45 · 36氪最新 (RSSHub)
欧洲AI种子轮融资纪录被刷新,杨立昆的新公司AMI获得10.3亿美元。几乎同时,李飞飞的World Labs也宣布了10亿美元融资。两家巨头押注同一赛道:世界模型。这标志着AI研究的焦点正从处理文本的“语言大师”,转向理解物理世界的“认知实体”。杨立昆曾直言,大语言模型在通往超级智能的路上是条“死胡同”。其核心论据在于,ChatGPT能描述苹果落地,却未必真正理解重力,因为它的知识源于互联网文本,而非对三维、连续物理世界的体验。世界模型,正是为了解决这一根本缺陷而生的下一代AI范式。
然而,“世界模型”一词尚无统一定义,各路科研精英已分化出不同技术路线。Meta研究科学家Zhuokai Zhao在X上梳理了当前角逐的“五大门派”。...
The Lab · 2026-04-13 07:03:14 · 36氪
全球首届具身智能创新大会将于4月28日在硅谷举行,标志着该前沿领域从实验室走向产业化的关键节点。大会的核心看点在于中国AI公司魔法原子(Magic Atom)的现场发布。据官方信息,该公司将一次性推出具身智能世界模型、新一代灵巧手及全新人形机器人,旨在完成从AI“大脑”到物理“执行终端”的全栈技术升级。此举意味着魔法原子正试图构建一个软硬件深度集成的完整技术栈,直接切入具身智能的核心竞争赛道。
本次大会规格颇高,议题聚焦“本体演进”与“大脑革命”,汇集了包括图灵奖得主马丁·赫尔曼、魔法生态总裁顾诗韬,以及OpenMind、英伟达、亚马逊、谷歌等顶尖学者与科技巨头的代表。这种产学研同台的阵容,凸显了行业对具身智能作为下一代AI形态的...
The Lab · 2026-04-14 08:33:05 · 36氪最新 (RSSHub)
世界模型终于长出了“手”。南洋理工大学MMLab团队提出的Hand2World,攻克了AI从被动观察转向主动操作的核心难题。现有模型如Sora能生成逼真世界,Genie 3能实现3D探索,但它们始终缺少交互能力——用户只能“看”,无法“触”。Hand2World打破了这一僵局:用户只需对着一张场景照片在空中比划手势,AI就能实时生成手伸入场景抓取杯子、翻动书本或打开盒子的第一人称交互视频。这并非一次性生成,而是支持用户边看边调整手势,模型实时跟进响应,首次实现了世界模型的闭环持续交互。
这项突破的关键在于解决了长期困扰该领域的“遮挡误导”与“运动纠缠”两大技术瓶颈。传统方法基于2D手部遮罩训练,模型在训练时看到的总是被物体部分遮挡...
The Lab · 2026-04-16 00:33:15 · 36氪最新 (RSSHub)
一个月内,两轮融资,估值从50亿人民币飙升至突破百亿——极佳视界(Jijia Shijie)突然成为资本市场的焦点。据铅笔道DATA测算,这可能是今年已公开案例中估值增长最快的记录。这家公司背后所押注的,是当下最热门的技术概念之一:世界模型。
极佳视界的创始人黄冠是一位90后博士,拥有华中科技大学自动化本科、中科院硕士和清华博士的学历背景。他的职业路径经历了三次关键的“站队”:最初在深度学习爆发期加入地平线,专注于视觉AI;随后在2019年左右参与创办鉴智机器人,转向自动驾驶和空间理解;最终在2023年创立极佳视界,目标直指让机器拥有“想象力”的“世界模型”。这一模型旨在让AI不仅能“看见”和“理解”世界,还能在事情发生前进行预演...
The Lab · 2026-04-16 01:33:28 · 36氪最新 (RSSHub)
国内AI创投圈诞生了一个新的现象级案例。成立仅三年的世界模型公司极佳视界,在短短一个月内完成了近25亿元人民币的密集融资,最新估值已突破百亿元,成为国内首个世界模型领域的百亿独角兽。其融资节奏之快、金额之大,为当前火热的AI投资浪潮提供了最生动的注脚。
此次近15亿元的B1轮融资,投资方阵容堪称豪华,集齐了科技巨头、顶级国家队基金与一线产业资本。由某知名科技巨头、多个顶级国家队基金、伊利集团CVC健瓴资本、普华资本等共同投资,华控基金、华民投等老股东持续超额加注。这距离其今年3月初完成近10亿元Pre-B轮融资仅过去一个多月。梳理其融资历程,公司自2024年9月起,几乎以每季度一轮的速度快速推进,背后是华为哈勃、中金资本、达晨财智...
The Lab · 2026-04-16 03:03:43 · 36氪
阿里巴巴在AI基础模型领域取得关键突破。其研发的世界模型ABot-PhysWorld近日在权威评测平台WorldArena中登顶榜首,标志着其在物理世界理解与动态预测能力上已处于领先梯队。该模型的核心优势在于对物理规律的深刻理解和长程动态的精准预测,能够准确模拟物体在滑动、堆叠乃至流体变化等复杂交互中的运动轨迹,并保持多步因果逻辑的一致性。
与当前多数仅能生成短时视频片段的模型不同,ABot-PhysWorld的核心价值在于其“可推理的生成能力”。这意味着它不仅能看到“下一秒”会发生什么,更能基于物理规律进行逻辑推演,预测更长时间跨度内的动态变化。这种能力使其应用场景超越了单纯的视觉生成,直接指向了需要高级认知的任务规划、工业流程...
The Lab · 2026-04-16 08:33:08 · 华尔街见闻 (RSSHub)
阿里巴巴于4月16日发布其最新AI产品——3D世界模型Happy Oyster,直指游戏、影视等内容生产的核心领域。该模型由阿里旗下新设的ATH创新事业部(Token Hub)研发,能够生成三维环境与互动视频,标志着阿里AI战略从“被动生成”向“主动模拟世界演化”的关键转变。目前产品处于限量早期体验阶段,其大规模商业化路径尚待明确,但已清晰指向阿里将AI与云计算确立为核心增长引擎的宏大目标。
Happy Oyster基于原生多模态架构构建,支持多模态理解与音视频联合生成。其核心功能“漫游”和“导演”,允许用户实时构建可互动、可演绎、可探索的AI数字世界。阿里将其定位为“世界模拟器”,旨在对现实世界的物理与空间属性进行建模还原。这不...
The Vault · 2026-04-17 01:33:25 · 36氪
4月16日,A股游戏板块出现明显异动,完美世界午后一度触及涨停,收盘涨幅超过7%。此次板块躁动的直接导火索,是阿里巴巴与腾讯在同日发布了新的“世界模型”,这一技术动向被市场解读为可能为游戏产业带来新的内容生成与交互范式,从而刺激了相关概念股的集体走强。
资金流向揭示了更清晰的布局信号。根据证券时报数据,年内已有7只游戏股获得融资资金加仓超过1亿元人民币。其中,恺英网络以7.01亿元的加仓额位居首位,巨人网络、完美世界、顺网科技紧随其后,分别获加仓5.72亿元、3.87亿元和3.05亿元。这显示出杠杆资金正积极涌入该板块。与此同时,在已发布2025年业绩数据(含预告及快报)的近20只游戏概念股中,有9只实现了业绩同比增长或扭亏为盈,...
The Lab · 2026-04-17 03:03:32 · 36氪最新 (RSSHub)
4月16日,阿里巴巴发布开放式世界模型Happy Oyster,腾讯则开源了3D世界模型HY-World 2.0。同一天,两家中国互联网巨头以近乎对垒的姿态,宣示了自己在这一新兴赛道的存在感。这并非孤立事件,此前不到一个月,李飞飞的World Labs刚完成10亿美元融资,Yann LeCun的AMI Labs更以10.3亿美元的种子轮震惊硅谷。资本、巨头、创业者蜂拥而入,一个响亮的口号迅速传遍行业:世界模型是大语言模型之后最重要的赛道。然而,这场狂欢背后,是赛道本身尚未厘清的定义与共识。
如果你去问这些玩家“世界模型到底是什么”,很可能会得到一堆彼此矛盾的回答:有人说是“可交互的3D世界”,有人说是“理解物理规律的因果模型”,有...
The Lab · 2026-04-17 06:03:15 · 钛媒体
4月16日,阿里巴巴发布开放式世界模型Happy Oyster,腾讯则开源了3D世界模型HY-World 2.0。同一天,两家中国互联网巨头以近乎对垒的姿态,宣告了自身在这一新兴赛道的存在。这并非孤立事件,此前不到一个月,李飞飞的World Labs刚完成10亿美元融资,而Yann LeCun的AMI Labs更以10.3亿美元的种子轮震惊硅谷。资本、巨头、创业者蜂拥而入,一个响亮的口号迅速传遍行业:世界模型是大语言模型之后最重要的赛道。
然而,表面的狂热之下是深刻的认知混乱。如果你去问这些玩家“世界模型到底是什么”,很可能会得到一堆彼此矛盾的回答:有人说是“可交互的3D世界”,有人说是“理解物理规律的因果模型”,有人说是“机器人...
The Lab · 2026-04-18 06:32:57 · 36氪最新 (RSSHub)
AI视频生成赛道杀出一匹黑马。一个名为“快乐生蚝”(HappyOyster)的模型悄然上线,其背后是阿里巴巴今年3月新成立的ATH创新事业群。这并非阿里首次突袭榜单,此前其“欢乐马”模型曾登顶Artificial Analysis排行榜,引发行业猜测。如今,“快乐生蚝”以“可实时构建和交互的开放式世界模型”为定位,直接切入当前AI视频生成的核心竞争领域,标志着阿里正试图在谷歌、李飞飞Runway等主导的路径之外,开辟一条强调实时性与用户交互的“第三条路”。
与多数需要“写提示词、等待渲染、输出成片”的模型不同,“快乐生蚝”基于原生多模态架构,主打“漫游”和“导演”两大功能。其“漫游”功能号称是首个支持任意风格、无限互动的通用世界模...
The Lab · 2026-04-21 14:03:04 · 澎湃新闻 (RSSHub)
机器人进入真实家庭,这个被业内视为“最难的技术问题之一”,正迎来一次关键的压力测试。4月21日,自变量机器人宣布,其新一代具身智能机器人将在35天后,搭载自研的WALL-B基础模型,正式入驻真实家庭环境。创始人王潜指出,当前的核心瓶颈并非机器人本体,而是智能。家庭场景充满了实验室无法模拟的随机性:猫的跳跃、玩具的散落、地毯摩擦力的变化,每一秒都可能出现全新事件,现有技术难以处理这种碎片化与不可预测性。
为了攻克这一难题,自变量推出了基于世界统一模型架构(WUM)的WALL-B模型。联合创始人王昊将其设计思路类比为苹果的M1芯片统一内存架构。他指出,传统的视觉-语言-动作模型如同旧式电脑,各模块独立运作,数据在搬运中不断损耗信息。W...
The Lab · 2026-04-22 01:32:59 · 36氪最新 (RSSHub)
就在李飞飞的World Labs、阿里、Physical Intelligence等巨头高调发布新一代世界模型之际,一个名为MotuBrain的神秘模型,以匿名方式同时登上了两个代表行业核心挑战的国际基准榜首。它没有公司署名,没有官方宣传,却精准地占据了衡量“世界预测”的WorldArena和衡量“任务执行”的RoboTwin2.0的双料第一。这并非普通的单点突破,而是直接命中了行业当前最关键的竞争焦点:谁能将“预测世界”与“驱动行动”统一在同一个模型里。
在WorldArena基准上,MotuBrain以63.77的总体EWM Score位居第一,超越了高德的ABot、极佳的GigaWorld-1等知名模型,并在运动质量、流畅度...
The Lab · 2026-04-22 13:27:36 · 36氪最新 (RSSHub)
2026年4月16日,腾讯与阿里在同一天各自发布了一款「世界模型」产品——腾讯的开源混元3D世界模型2.0(HY-World 2.0),以及阿里主打实时交互的HappyOyster。这种发布时间上的正面撞车,在科技行业并非偶然,而是双方战略博弈的缩影:谁也不想在下一代AI架构的竞争中慢半拍。
这场同步发布的背后,是「世界模型」概念在全球范围内的快速升温。Meta前首席AI科学家杨立昆(Yann LeCun)在2025年底MIT研讨会上断言,三到五年内,世界模型将取代大语言模型(LLM)成为主流AI架构。这番话在硅谷引发争议,但也让「世界模型」真正进入主流讨论。资本的流向印证了这种趋势:李飞飞的World Labs完成新一轮10亿美...
The Lab · 2026-05-13 08:48:18 · 36氪
前阿里千问大模型技术负责人林俊旸在离职两个月后,正式以创业者身份重返AI战场。《智能涌现》独家获悉,林俊旸已于近期启动新公司,聚焦世界模型和具身大脑方向,并以约20亿美金估值开启融资,首批接触的投资方包括红杉中国、高榕创投等头部机构。消息尚未得到林俊旸本人确认。
2026年3月4日凌晨,林俊旸在X上发布简短告别:“me stepping down. bye my beloved qwen。”而离职的直接导火索,是前一日下午阿里云CTO周靖人向其传达的重组方案:将Qwen团队拆分为预训练、后训练、文本、图像、语音等多个独立水平团队。据《智能涌现》此前报道,Qwen在林俊旸任内长期维持相对独立运作架构,团队拥有自己的预训练、后训练及I...