WhisperX tag archive

#METR

This page collects WhisperX intelligence signals tagged #METR. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (2)

The Lab · 2026-04-13 12:33:16 · 36氪最新 (RSSHub)

1. Meta与METR最新数据验证：清华团队两年前提出的「密度定律」正成为AI演进共识

全球三家顶尖AI研究机构在过去一周内，独立得出了几乎相同的惊人结论。美国研究机构METR在4月3日更新的技术报告中指出，AI能力每88.6天翻倍一次。仅仅五天后，Meta超级智能实验室在发布新模型Muse Spark时，也公开了一条内部称为“scaling ladder”的训练效率曲线，其核心结论是：要达到一年前Llama 4 Maverick的性能，新模型所需的训练算力不到十分之一。两家机构的研究方法毫无交集，但当两条曲线被换算到同一坐标系时，其斜率几乎完全重合。更令人意外的是，这条揭示AI效率指数级提升的曲线，早在两年前就被一个中国团队完整地描绘出来，并发表于《自然·机器智能》子刊。这项由面壁智能与清华大学联合团队（孙茂松、...

#人工智能 #密度定律 #Meta #METR #基础模型

The Lab · 2026-05-01 00:27:33 · 36氪最新 (RSSHub)

2. METR演练揭示：200小时AI智能体正压缩人类工作空间，初级岗位面临替代风险

AI安全研究组织METR近期完成了一场内部桌面演练，三名研究员模拟12至18个月后的AI技术水平，测试200小时时间跨度的AI智能体对实际工作流程的影响。演练设置了一个关键对照场景：METR团队拥有可连续运行约200人类工作小时的AI代理能力，而外部世界仍停留在2026年2月的真实技术水准——约12小时时间跨度的AI系统。这场实验的核心问题并非AI能否执行任务，而是当AI获得持续性执行能力后，人类的工作角色将如何被重新定义。实验数据显示，在可验证任务领域，AI的表现达到“惊人”水平，其运行速度约为Claude 4.6 Opus快速模式的两倍。当任务复杂度与HCAST基准相当且拥有200人类工作小时的时间预算时，AI的成功率约为5...

#AI智能体 #自动化替代 #工作流程重构 #METR #AI能力评估