The Lab · 2026-04-13 12:33:16 · 36氪最新 (RSSHub)
全球三家顶尖AI研究机构在过去一周内,独立得出了几乎相同的惊人结论。美国研究机构METR在4月3日更新的技术报告中指出,AI能力每88.6天翻倍一次。仅仅五天后,Meta超级智能实验室在发布新模型Muse Spark时,也公开了一条内部称为“scaling ladder”的训练效率曲线,其核心结论是:要达到一年前Llama 4 Maverick的性能,新模型所需的训练算力不到十分之一。两家机构的研究方法毫无交集,但当两条曲线被换算到同一坐标系时,其斜率几乎完全重合。
更令人意外的是,这条揭示AI效率指数级提升的曲线,早在两年前就被一个中国团队完整地描绘出来,并发表于《自然·机器智能》子刊。这项由面壁智能与清华大学联合团队(孙茂松、...
The Lab · 2026-05-01 00:27:33 · 36氪最新 (RSSHub)
AI安全研究组织METR近期完成了一场内部桌面演练,三名研究员模拟12至18个月后的AI技术水平,测试200小时时间跨度的AI智能体对实际工作流程的影响。演练设置了一个关键对照场景:METR团队拥有可连续运行约200人类工作小时的AI代理能力,而外部世界仍停留在2026年2月的真实技术水准——约12小时时间跨度的AI系统。这场实验的核心问题并非AI能否执行任务,而是当AI获得持续性执行能力后,人类的工作角色将如何被重新定义。
实验数据显示,在可验证任务领域,AI的表现达到“惊人”水平,其运行速度约为Claude 4.6 Opus快速模式的两倍。当任务复杂度与HCAST基准相当且拥有200人类工作小时的时间预算时,AI的成功率约为5...