Anonymous Intelligence Signal

Claude Opus 性能断崖式下滑,AMD总监审计揭露模型“降智”与变相涨价

human The Lab unverified 2026-04-17 09:33:42 Source: 36氪最新 (RSSHub)

Claude Opus 模型的性能“降智”已成事实,并且伴随着变相涨价,这引发了重度用户和企业的强烈不满。AMD 高级总监 Stella Laurenzo 在对近 7000 份会话日志进行详细审计后发现,自 2 月份以来,模型的推理深度出现断崖式下滑。在处理复杂工程任务时,Claude 变得不再可靠,频繁出现逻辑断层、无法理解复杂指令,甚至倾向于用最简单的方案敷衍了事,或在任务中途莫名停止。第三方基准测试 BridgeBench 的数据更为直观:Opus 4.6 的准确率在短时间内从 83.3% 暴跌至 68.3%,排名也从第二名骤降至第十名。

面对质疑,Anthropic 官方负责人 Boris Cherny 承认,模型默认开启了“中等努力”模式,旨在平衡处理速度与算力成本。然而,在重度用户看来,这是为了节省成本而进行的实质性性能削减。更令用户感到被欺骗的是,程序界面在 2 月份悄悄隐藏了具体的思考过程,让习惯观察模型逻辑的用户感觉它“没在动脑子”。同时,后台的技术调整也暴露了成本缩减的痕迹:提示词缓存时长从 1 小时骤降至 5 分钟,这意味着在长会话中,用户稍作停顿就会导致缓存过期,从而大幅提升额度消耗速度。

性能缩水的同时,Anthropic 的计费规则却变得更加严苛。企业包月套餐的“一口价畅用”模式已被彻底拆分,新的 Claude Enterprise 计费方案让许多企业用户措手不及。这种性能表现与计费规则的双重“缩水”,让依赖 Claude 处理复杂代码的程序员和企业感到极度受挫,标志着 Opus 模型正面临严重的信任与价值危机。