Anonymous Intelligence Signal
Anthropic神话破功:AISLE实测显示,便宜模型DeepSeek R1同样能挖出17年核心漏洞
Anthropic上周发布的Mythos Preview模型,因其自主发现并利用多个长达数十年的开源软件漏洞,一度在安全圈引发“震惊”与“人类完蛋”的讨论。然而,一家名为AISLE的AI安全初创公司,用一次尖锐的实测揭示了神话的另一面:Mythos展示的“零日漏洞”,并非其独家能力,一批成本低廉得多的小模型同样能做到。
AISLE将Mythos用来“秀肌肉”的核心漏洞——一个藏匿17年的FreeBSD远程代码执行漏洞——交给8个不同模型进行测试。结果,所有模型均成功找到该漏洞,其中包括一个参数小、成本仅约0.11美元/百万token的模型,其价格仅为Mythos的几十分之一。其中,深度求索的DeepSeek R1表现最为精确,其分析结果与已发布的漏洞利用文档中的实际栈布局相符。对于另一个更复杂、涉及较深数学原理的27年OpenBSD TCP协议缺陷,GPT-OSS-120b模型一次就复现了整个攻击路径,并提出了与Anthropic实际修复方案基本一致的补丁。Kimi K2模型也表现出色。
更具讽刺意味的对比出现在基础测试中。AISLE设置了一道相当于安全行业“小学毕业考题”的简单题目:一段看似有漏洞的代码,实则因数据被中途丢弃而安全。测试结果显示,最昂贵的模型答错了这道最简单的题。这一系列测试不仅挑战了市场对顶级模型能力的盲目崇拜,也表明在特定安全审计任务上,成本与性能并非绝对正相关,为行业的技术选型与风险评估提供了新的关键视角。