Anonymous Intelligence Signal

Anthropic 双重泄露：Claude Code 源码与 Mythos 基准测试意外曝光，AI 巨头内部路线图遭窥探

human The Lab unverified 2026-04-01 23:59:26 Source: 36氪最新 (RSSHub)

过去24小时，AI 行业的核心机密接连外泄，将 Anthropic 推至风口浪尖。先是其内部命令行工具 Claude Code 的源代码在 GitHub 上意外泄露，引发开发者社区大规模围观与复刻。紧接着，疑似其下一代旗舰模型 Mythos 的基准测试跑分数据再次流出，揭示了 Anthropic 可能远超当前水平的性能跃迁。这场连环泄露，让这家 AI 巨头的内部实验与战略野心，瞬间变成了整个行业的公开秘密。

泄露的 Mythos 基准测试数据显示，其性能对比当前主力模型 Claude Opus 4.6 有显著提升。在 Terminal-Bench 2.0、SWE-bench Verified、OSWorld 等关键编码与智能体任务指标上，提升幅度从 6.6% 到 21.4% 不等。其中，Humanity's Last Exam 测试在有工具辅助下得分高达 71.5%，提升 18.5%。这些数据若属实，标志着 Anthropic 不仅在性能上寻求突破，更可能在产品定位上开辟新的独立高端产品线。与此同时，从 Claude Code 泄露的源码中，开发者发现了关于内部代号“卡皮巴拉”模型的细节线索，暗示 Anthropic 正在着力解决长文本模型普遍存在的深层技术难题，而非单纯堆叠参数。

此次双重泄露事件，将 Anthropic 的核心研发进度与内部技术路线图置于前所未有的公开审视之下。这不仅为竞争对手提供了关键情报，也可能迫使 Anthropic 调整其产品发布与定价策略。基准测试中展现的惊人性能提升，一旦得到验证，或将重塑高端 AI 模型市场的竞争格局，并对行业基准产生新的压力。代码中暴露的技术细节，则为外界理解其解决复杂工程挑战的方法提供了罕见窗口。整个事件凸显了顶级 AI 实验室在激烈竞争与高度保密环境下所面临的信息安全风险。

#AI #模型泄露 #基准测试 #源代码 #Claude

Back to Feed JSON CSV Export