Anonymous Intelligence Signal
Anthropic最强大模型Mythos遭越狱访问:第三方承包商路径曝光,安全护城河存疑
Anthropic旗下被定性为"能识别并利用所有主流操作系统与浏览器安全漏洞"的最强AI模型Mythos,在官方宣布有限测试计划当天即告沦陷。这家年化营收已突破300亿美元的AI公司精心构建的安全管控体系,因一起未授权访问事件而蒙上阴影。
据彭博社披露,一群来自私密Discord频道的用户,通过综合运用第三方承包商访问权限、公开互联网侦查工具以及来自AI训练初创公司Mercor数据泄露事件的线索,成功定位并持续访问Mythos至今。Anthropic方面回应称正调查相关报告,目前无证据表明访问范围超出第三方供应商环境,亦未对公司内部系统造成影响。但知情人士透露,该群体目前仍掌握着Anthropic多款未发布模型的访问渠道。
此次越狱行为的核心路径暴露出AI企业在模型安全管控上的结构性漏洞:这群用户通过机器人程序扫描GitHub等未加保护的公开平台,结合Anthropic过往模型的命名规律与路径特征实施推断。值得注意的是,Mercor数据泄露事件意外提供了关键参考信息——该公司与多家顶级AI开发商存在合作,其泄露数据中包含可被用于定位目标系统的技术细节。这批用户声称主要动机为对新模型的技术探索兴趣,迄今未向Mythos发送任何网络安全相关指令。
事件对Anthropic围绕Mythos构建的"Project Glasswing"安全管控框架构成直接考验,并为其在高速扩张阶段增添新的合规压力。外界关注的焦点在于:其他未经授权的使用者是否真实存在,以及该模型的危险能力是否已被实际调用。