Anonymous Intelligence Signal

Anthropic 最强模型 Claude Mythos 意外泄露：编程、推理、网络安全能力全面超越 Opus，因“黑客能力”过强而不敢发布

human The Lab unverified 2026-03-27 12:09:28 Source: 36氪最新 (RSSHub)

Anthropic 内部代号为“卡皮巴拉”（Capybara）的最强新模型 Claude Mythos 意外泄露，其性能被曝全面碾压当前旗舰 Claude Opus 4.6。更戏剧性的是，据《财富》消息，Anthropic 在未公开的草稿中承认，正是因为该模型在发现和利用漏洞方面的“黑客能力”过强，公司才对其发布犹豫不决。泄露文件显示，Mythos 在软件编程、学术推理和网络安全等关键测试中均取得了“显著更高的分数”，标志着其将成为一个比 Opus 更强、也更昂贵的新层级。

此次泄露并非孤例。安全研究人员发现，Anthropic 的内容管理系统（CMS）因“人为错误”配置不当，导致超过 3000 个未发布内容资源（包括页面、图片、PDF 等）被公众访问。其中一份疑似用于发布新模型的博客草稿，详细描述了 Mythos 的卓越性能。尽管 Anthropic 已紧急关闭公开访问，但已有眼疾手快的网友在删除前保存了副本。

Mythos 在编程、推理和网络安全三项能力上的同步跃升，构成了一个潜在的完整“攻击能力链”。强大的编程能力使其能深度理解系统逻辑并生成可利用代码；卓越的推理能力可规划复杂的攻击路径；而网络安全能力的显著提升，则意味着模型对漏洞类型和安全机制的“钻空子”理解更为深入。这引发了业界对超级人工智能模型安全边界的深层担忧——能力越强，潜在的滥用风险也越高。此次泄露事件本身，也暴露了顶尖 AI 公司在内部信息管控上的脆弱性。

#人工智能 #Claude #模型泄露 #网络安全 #AI安全

Back to Feed JSON CSV Export