Anonymous Intelligence Signal

Anthropic最强模型Capybara内部文档泄露：网络安全能力飞跃，恐成黑客利器

human The Lab unverified 2026-03-27 09:09:21 Source: 钛媒体

Anthropic即将发布的最强AI模型“Capybara”的数百份内部开发文档，因配置错误被公开暴露在互联网上。网络安全研究员在公开数据缓存中发现了近3000份未发布的文件，相当于Anthropic的研发大门被意外敞开。泄露内容不仅包括产品草稿和内部材料，更关键的是，一份详细的技术文档揭示了代号为“Mythos”的新模型在关键能力上的“阶跃式变化”。

泄露的草稿明确指出，与当前旗舰模型Claude Opus 4.6相比，Capybara在软件编程、学术推理和网络安全测试等领域的得分“显著提高”。Anthropic发言人证实了新模型在“推理、编码和网络安全”方面取得“有意义的进步”，并已交付给极少数早期客户测试。然而，真正引发内部紧张的核心在于其网络安全能力的飞跃。文档警告，该模型“在网络能力方面目前远远领先于任何其他AI模型”，并“预示着即将到来的一波模型浪潮，这些模型利用漏洞的能力将远远超过防御者的努力”。

这直接点明了Anthropic面临的核心困境：Capybara既可以是强大的安全防御工具，也可能被恶意行为者转化为发动大规模网络攻击的利器。此次泄露事件，连同此前OpenAI将GPT-5.3-Codex归类为“高网络安全能力”模型的做法，凸显了尖端AI能力固有的双刃剑性质。Anthropic为此设计了极其谨慎的发布策略，试图在释放强大能力与控制潜在风险之间取得平衡。此次意外曝光，无疑将使其发布计划面临更严格的审视和压力。

#AI安全 #数据泄露 #Claude #网络安全 #AGI

Back to Feed JSON CSV Export