#BridgeBench

The Lab · 2026-04-13 12:33:02 · 36氪最新 (RSSHub)

1. Claude Opus 4.6 性能断崖式下跌：全球排名从第2暴跌至第10，用户信任危机爆发

Anthropic的旗舰模型Claude Opus 4.6正面临一场严重的信任危机。最新的BridgeBench评测报告给出了冰冷的数据：该模型的全球排名从第2名垂直坠落至第10名。其准确率从83.3%断崖式跌至68.3%，而幻觉率则几乎翻倍，增加了98%。这一实锤证据终结了所有用户的疑问——Claude Opus 4.6确实变差了，并非用户自身的问题。AMD的AI总监也证实了Claude Code在复杂任务上已“不可用”。对于依赖该模型处理关键任务的用户而言，这种未经告知的性能降级无异于一场背叛，引发了“这怎么可能合法？”的广泛质疑。就在全网群嘲、用户感觉上当受骗之际，Anthropic的动向却指向了另一个战场。疑似内部工具界...

#Claude #AI模型 #性能下降 #BridgeBench #全栈开发

Latest Signals (1)

1. Claude Opus 4.6 性能断崖式下跌：全球排名从第2暴跌至第10，用户信任危机爆发