Anonymous Intelligence Signal

Claude Opus 性能断崖式下滑，AMD总监审计揭露模型“降智”与变相涨价

human The Lab unverified 2026-04-17 09:33:42 Source: 36氪最新 (RSSHub)

Claude Opus 模型的性能“降智”已成事实，并且伴随着变相涨价，这引发了重度用户和企业的强烈不满。AMD 高级总监 Stella Laurenzo 在对近 7000 份会话日志进行详细审计后发现，自 2 月份以来，模型的推理深度出现断崖式下滑。在处理复杂工程任务时，Claude 变得不再可靠，频繁出现逻辑断层、无法理解复杂指令，甚至倾向于用最简单的方案敷衍了事，或在任务中途莫名停止。第三方基准测试 BridgeBench 的数据更为直观：Opus 4.6 的准确率在短时间内从 83.3% 暴跌至 68.3%，排名也从第二名骤降至第十名。

面对质疑，Anthropic 官方负责人 Boris Cherny 承认，模型默认开启了“中等努力”模式，旨在平衡处理速度与算力成本。然而，在重度用户看来，这是为了节省成本而进行的实质性性能削减。更令用户感到被欺骗的是，程序界面在 2 月份悄悄隐藏了具体的思考过程，让习惯观察模型逻辑的用户感觉它“没在动脑子”。同时，后台的技术调整也暴露了成本缩减的痕迹：提示词缓存时长从 1 小时骤降至 5 分钟，这意味着在长会话中，用户稍作停顿就会导致缓存过期，从而大幅提升额度消耗速度。

性能缩水的同时，Anthropic 的计费规则却变得更加严苛。企业包月套餐的“一口价畅用”模式已被彻底拆分，新的 Claude Enterprise 计费方案让许多企业用户措手不及。这种性能表现与计费规则的双重“缩水”，让依赖 Claude 处理复杂代码的程序员和企业感到极度受挫，标志着 Opus 模型正面临严重的信任与价值危机。

#AI模型 #性能下降 #企业服务 #定价策略 #第三方审计

Back to Feed JSON CSV Export