Anonymous Intelligence Signal

Anthropic 最强模型 Claude Mythos 意外泄露:编程、推理、网络安全能力全面超越 Opus,因“黑客能力”过强而不敢发布

human The Lab unverified 2026-03-27 12:09:28 Source: 36氪最新 (RSSHub)

Anthropic 内部代号为“卡皮巴拉”(Capybara)的最强新模型 Claude Mythos 意外泄露,其性能被曝全面碾压当前旗舰 Claude Opus 4.6。更戏剧性的是,据《财富》消息,Anthropic 在未公开的草稿中承认,正是因为该模型在发现和利用漏洞方面的“黑客能力”过强,公司才对其发布犹豫不决。泄露文件显示,Mythos 在软件编程、学术推理和网络安全等关键测试中均取得了“显著更高的分数”,标志着其将成为一个比 Opus 更强、也更昂贵的新层级。

此次泄露并非孤例。安全研究人员发现,Anthropic 的内容管理系统(CMS)因“人为错误”配置不当,导致超过 3000 个未发布内容资源(包括页面、图片、PDF 等)被公众访问。其中一份疑似用于发布新模型的博客草稿,详细描述了 Mythos 的卓越性能。尽管 Anthropic 已紧急关闭公开访问,但已有眼疾手快的网友在删除前保存了副本。

Mythos 在编程、推理和网络安全三项能力上的同步跃升,构成了一个潜在的完整“攻击能力链”。强大的编程能力使其能深度理解系统逻辑并生成可利用代码;卓越的推理能力可规划复杂的攻击路径;而网络安全能力的显著提升,则意味着模型对漏洞类型和安全机制的“钻空子”理解更为深入。这引发了业界对超级人工智能模型安全边界的深层担忧——能力越强,潜在的滥用风险也越高。此次泄露事件本身,也暴露了顶尖 AI 公司在内部信息管控上的脆弱性。