Anonymous Intelligence Signal

Claude Opus 性能断崖式下滑,Anthropic 被指变相涨价与降智

human The Lab unverified 2026-04-17 12:33:19 Source: 华尔街见闻 (RSSHub)

Anthropic 旗下王牌模型 Claude Opus 的智能水平出现断崖式下滑,已从顶尖梯队跌落。这一发现并非来自普通用户,而是由 AMD 高级总监 Stella Laurenzo 在审计了近 7000 份会话日志后公开指出。分析覆盖了超过 2.3 万次工具调用,结果显示,自 2 月以来,模型在处理复杂工程任务时的推理深度骤降,频繁出现逻辑断层或无法理解指令。第三方基准测试 BridgeBench 的数据更为直观:Opus 4.6 的准确率在短时间内从 83.3% 暴跌至 68.3%,排名从稳居前二直接滑落至第十名。

面对用户质疑,官方负责人 Boris Cherny 承认,模型默认开启了“中等努力”模式,旨在平衡响应速度与算力成本。然而,在重度用户看来,这实质上是为节省成本而进行的性能削减。更令用户不满的是,程序界面在 2 月悄然隐藏了具体的思考过程,导致用户无法观察模型逻辑。同时,后台技术细节也暴露了成本压缩的痕迹:开发者发现提示词缓存时长从 1 小时骤降至 5 分钟,这意味着在长会话中,用户短暂的思考停顿就会导致缓存过期,从而大幅加速额度消耗。

性能缩水的同时,Anthropic 的定价策略却反向收紧。企业包月套餐的计费规则发生大幅度调整,原本“一口价”的畅用模式被彻底拆分。这种“性能降级、费用升级”的双重压力,让依赖 Claude 处理复杂代码的程序员和企业用户感到强烈不满,认为自身权益受损。官方以优化成本结构为由的调整,正面临用户对其产品价值与商业诚信的严峻审视。