The Lab · 2026-04-16 14:33:08 · 36氪
当大语言模型在“烧”万亿级token时,具身智能行业却深陷“无token可烧”的窘境。数据的极度匮乏,正成为卡住整个机器人行业发展的核心瓶颈。4月16日,智元机器人旗下觅蜂科技发布一站式物理AI数据服务平台,旨在将高质量机器人训练数据变得像水电一样“即取即用”,直接挑战行业最根本的痛点。
觅蜂科技董事长兼CEO姚卯青在发布会上揭示了数据鸿沟的惊人差距:GPT-5的训练语料高达100万亿tokens,而全球汇聚的高质量具身智能数据,可能仅有约50万小时的规模。这种匮乏源于数据获取的极端困难——具身智能需要在三维开放世界中“摸爬滚打”,通过真机遥操或仿真积累数据,成本高昂且增速缓慢。为此,觅蜂推出了基于“无本体采集”技术的前沿解决方案...
The Lab · 2026-04-16 14:33:09 · 36氪最新 (RSSHub)
当大语言模型在“烧”万亿级token时,具身智能行业正陷入“无token可烧”的困境。数据的极度匮乏,已成为卡住整个机器人行业发展的核心瓶颈。4月16日,智元机器人旗下觅蜂科技发布了一站式物理AI数据服务平台,旨在将高质量机器人训练数据变得像水电一样“即取即用”,直接瞄准行业最痛的命门。
觅蜂科技董事长兼CEO姚卯青在发布会上揭示了数据规模的巨大鸿沟:GPT-5使用了约100万亿tokens的训练语料,而全球汇聚的高质量具身智能数据,可能仅有50万小时的规模。数据获取难、成本高、增速慢,根源在于具身智能需要在三维开放世界中“摸爬滚打”,其训练数据远比文本语料难以获得。为此,觅蜂推出了基于“无本体采集”技术的前沿解决方案。该技术摒弃...