Anthropic 双重泄露:Claude Code 源码与 Mythos 基准测试意外曝光,AI 巨头内部路线图遭窥探
过去24小时,AI 行业的核心机密接连外泄,将 Anthropic 推至风口浪尖。先是其内部命令行工具 Claude Code 的源代码在 GitHub 上意外泄露,引发开发者社区大规模围观与复刻。紧接着,疑似其下一代旗舰模型 Mythos 的基准测试跑分数据再次流出,揭示了 Anthropic 可能远超当前水平的性能跃迁。这场连环泄露,让这家 AI 巨头的内部实验与战略野心,瞬间变成了整个行业的公开秘密。
泄露的 Mythos 基准测试数据显示,其性能对比当前主力模型 Claude Opus 4.6 有显著提升。在 Terminal-Bench 2.0、SWE-bench Verified、OSWorld 等关键编码与智能体任务指标上,提升幅度从 6.6% 到 21.4% 不等。其中,Humanity's Last Exam 测试在有工具辅助下得分高达 71.5%,提升 18.5%。这些数据若属实,标志着 Anthropic 不仅在性能上寻求突破,更可能在产品定位上开辟新的独立高端产品线。与此同时,从 Claude Code 泄露的源码中,开发者发现了关于内部代号“卡皮巴拉”模型的细节线索,暗示 Anthropic 正在着力解决长文本模型普遍存在的深层技术难题,而非单纯堆叠参数。
此次双重泄露事件,将 Anthropic 的核心研发进度与内部技术路线图置于前所未有的公开审视之下。这不仅为竞争对手提供了关键情报,也可能迫使 Anthropic 调整其产品发布与定价策略。基准测试中展现的惊人性能提升,一旦得到验证,或将重塑高端 AI 模型市场的竞争格局,并对行业基准产生新的压力。代码中暴露的技术细节,则为外界理解其解决复杂工程挑战的方法提供了罕见窗口。整个事件凸显了顶级 AI 实验室在激烈竞争与高度保密环境下所面临的信息安全风险。