1. Claude Opus 4.6 性能断崖式下跌:全球排名从第2暴跌至第10,用户信任危机爆发
Anthropic的旗舰模型Claude Opus 4.6正面临一场严重的信任危机。最新的BridgeBench评测报告给出了冰冷的数据:该模型的全球排名从第2名垂直坠落至第10名。其准确率从83.3%断崖式跌至68.3%,而幻觉率则几乎翻倍,增加了98%。这一实锤证据终结了所有用户的疑问——Claude Opus 4.6确实变差了,并非用户自身的问题。AMD的AI总监也证实了Claude Code在复杂任务上已“不可用”。对于依赖该模型处理关键任务的用户而言,这种未经告知的性能降级无异于一场背叛,引发了“这怎么可能合法?”的广泛质疑。 就在全网群嘲、用户感觉上当受骗之际,Anthropic的动向却指向了另一个战场。疑似内部工具界...