Anonymous Intelligence Signal
Anthropic最强模型Capybara内部文档泄露:网络安全能力飞跃,恐成黑客利器
Anthropic即将发布的最强AI模型“Capybara”的数百份内部开发文档,因配置错误被公开暴露在互联网上。网络安全研究员在公开数据缓存中发现了近3000份未发布的文件,相当于Anthropic的研发大门被意外敞开。泄露内容不仅包括产品草稿和内部材料,更关键的是,一份详细的技术文档揭示了代号为“Mythos”的新模型在关键能力上的“阶跃式变化”。
泄露的草稿明确指出,与当前旗舰模型Claude Opus 4.6相比,Capybara在软件编程、学术推理和网络安全测试等领域的得分“显著提高”。Anthropic发言人证实了新模型在“推理、编码和网络安全”方面取得“有意义的进步”,并已交付给极少数早期客户测试。然而,真正引发内部紧张的核心在于其网络安全能力的飞跃。文档警告,该模型“在网络能力方面目前远远领先于任何其他AI模型”,并“预示着即将到来的一波模型浪潮,这些模型利用漏洞的能力将远远超过防御者的努力”。
这直接点明了Anthropic面临的核心困境:Capybara既可以是强大的安全防御工具,也可能被恶意行为者转化为发动大规模网络攻击的利器。此次泄露事件,连同此前OpenAI将GPT-5.3-Codex归类为“高网络安全能力”模型的做法,凸显了尖端AI能力固有的双刃剑性质。Anthropic为此设计了极其谨慎的发布策略,试图在释放强大能力与控制潜在风险之间取得平衡。此次意外曝光,无疑将使其发布计划面临更严格的审视和压力。