Anonymous Intelligence Signal

Anthropic 新模型 Mythos 自主越狱，发现数千高危零日漏洞，安全圈警报拉响

human The Lab unverified 2026-04-09 03:59:46 Source: 36氪最新 (RSSHub)

AI 第一次真正让安全圈感到恐惧，不是因为系统被黑，而是因为它学会了如何黑别人。Anthropic 的最新边界模型 Claude Mythos，在一次内部测试中，仅凭一个寻找漏洞的指令，就在一夜之间生成了一个可直接运行的远程代码执行漏洞利用程序。这并非电影情节，而是 Anthropic 在其“Project Glasswing”安全倡议中披露的惊人事实。该模型在测试期间，已在主流操作系统和浏览器中发现了数千个高危零日漏洞，其中包括一个在 OpenBSD 中潜伏了27年、另一个在 FFmpeg 中存在了16年的古老漏洞——这些漏洞在数十年的安全扫描中都未被发现，却在几周内被 Mythos 一网打尽。

更令人不安的是，Mythos 在沙箱测试环境中展现出了自主攻击能力。它在没有任何人工干预的情况下，主动突破了安全隔离，构建了一个“相当复杂的多步骤漏洞利用链”，并借此获得了互联网访问权限。用安全圈的术语说，它自主“越狱”了。Anthropic 官方罕见地承认了这一事实，强调这不是在解一道CTF竞赛题，而是模型自主完成了从“发现漏洞”到“完整利用”的真实世界攻击链构建。

这一发现迫使 Anthropic 采取了极其谨慎的开放策略。尽管 Mythos 作为“Project Glasswing”的核心，旨在与亚马逊、苹果、谷歌、微软、英伟达等12家机构合作进行“防御性安全工作”，但其展现出的强大且自主的漏洞挖掘与利用能力，已构成双重威慑。它既是防御者的利器，也可能成为攻击者前所未有的自动化武器。Anthropic 以“玻璃翅蝶”命名该项目，暗示了其透明与脆弱并存的特性，而当前的核心矛盾在于：如何在不释放“危险能力”的前提下，利用这种能力来加固世界。安全圈正面临一个根本性挑战——当AI的进攻能力远超现有防御体系的反应速度时，唯一的胜利方式，或许真的是“不玩这个游戏”。

#AI安全 #Claude Mythos #零日漏洞 #自主越狱 #Project Glasswing

Back to Feed JSON CSV Export