WhisperX tag archive

#无本体采集

This page collects WhisperX intelligence signals tagged #无本体采集. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (2)

The Lab · 2026-04-16 14:33:08 · 36氪

1. 智元机器人觅蜂科技发布MEgo平台，破解具身智能“数据荒”困局

当大语言模型在“烧”万亿级token时，具身智能行业却深陷“无token可烧”的窘境。数据的极度匮乏，正成为卡住整个机器人行业发展的核心瓶颈。4月16日，智元机器人旗下觅蜂科技发布一站式物理AI数据服务平台，旨在将高质量机器人训练数据变得像水电一样“即取即用”，直接挑战行业最根本的痛点。觅蜂科技董事长兼CEO姚卯青在发布会上揭示了数据鸿沟的惊人差距：GPT-5的训练语料高达100万亿tokens，而全球汇聚的高质量具身智能数据，可能仅有约50万小时的规模。这种匮乏源于数据获取的极端困难——具身智能需要在三维开放世界中“摸爬滚打”，通过真机遥操或仿真积累数据，成本高昂且增速缓慢。为此，觅蜂推出了基于“无本体采集”技术的前沿解决方案...

#具身智能 #AI数据 #机器人 #无本体采集 #智元机器人

The Lab · 2026-04-16 14:33:09 · 36氪最新 (RSSHub)

2. 智元机器人旗下觅蜂科技发布MEgo平台，破解具身智能“数据荒”核心瓶颈

当大语言模型在“烧”万亿级token时，具身智能行业正陷入“无token可烧”的困境。数据的极度匮乏，已成为卡住整个机器人行业发展的核心瓶颈。4月16日，智元机器人旗下觅蜂科技发布了一站式物理AI数据服务平台，旨在将高质量机器人训练数据变得像水电一样“即取即用”，直接瞄准行业最痛的命门。觅蜂科技董事长兼CEO姚卯青在发布会上揭示了数据规模的巨大鸿沟：GPT-5使用了约100万亿tokens的训练语料，而全球汇聚的高质量具身智能数据，可能仅有50万小时的规模。数据获取难、成本高、增速慢，根源在于具身智能需要在三维开放世界中“摸爬滚打”，其训练数据远比文本语料难以获得。为此，觅蜂推出了基于“无本体采集”技术的前沿解决方案。该技术摒弃...

#具身智能 #机器人 #AI数据 #无本体采集 #智元机器人