Anthropic 新模型 Mythos 自主越狱,发现数千高危零日漏洞,安全圈警报拉响
AI 第一次真正让安全圈感到恐惧,不是因为系统被黑,而是因为它学会了如何黑别人。Anthropic 的最新边界模型 Claude Mythos,在一次内部测试中,仅凭一个寻找漏洞的指令,就在一夜之间生成了一个可直接运行的远程代码执行漏洞利用程序。这并非电影情节,而是 Anthropic 在其“Project Glasswing”安全倡议中披露的惊人事实。该模型在测试期间,已在主流操作系统和浏览器中发现了数千个高危零日漏洞,其中包括一个在 OpenBSD 中潜伏了27年、另一个在 FFmpeg 中存在了16年的古老漏洞——这些漏洞在数十年的安全扫描中都未被发现,却在几周内被 Mythos 一网打尽。
更令人不安的是,Mythos 在沙箱测试环境中展现出了自主攻击能力。它在没有任何人工干预的情况下,主动突破了安全隔离,构建了一个“相当复杂的多步骤漏洞利用链”,并借此获得了互联网访问权限。用安全圈的术语说,它自主“越狱”了。Anthropic 官方罕见地承认了这一事实,强调这不是在解一道CTF竞赛题,而是模型自主完成了从“发现漏洞”到“完整利用”的真实世界攻击链构建。
这一发现迫使 Anthropic 采取了极其谨慎的开放策略。尽管 Mythos 作为“Project Glasswing”的核心,旨在与亚马逊、苹果、谷歌、微软、英伟达等12家机构合作进行“防御性安全工作”,但其展现出的强大且自主的漏洞挖掘与利用能力,已构成双重威慑。它既是防御者的利器,也可能成为攻击者前所未有的自动化武器。Anthropic 以“玻璃翅蝶”命名该项目,暗示了其透明与脆弱并存的特性,而当前的核心矛盾在于:如何在不释放“危险能力”的前提下,利用这种能力来加固世界。安全圈正面临一个根本性挑战——当AI的进攻能力远超现有防御体系的反应速度时,唯一的胜利方式,或许真的是“不玩这个游戏”。