Anthropic 一周两泄:Claude Code 源码与 Mythos 模型机密接连曝光
号称最重视AI安全的Anthropic,在一周内被自己的安全问题连续打脸。先是下一代模型‘Mythos’的存在因公开数据缓存未受保护而泄露,紧接着,其核心产品Claude Code的完整TypeScript源代码也因一个调试文件被意外打包发布而曝光。安全研究员Chaofan Shou发现,Anthropic在npm上发布的Claude Code 2.1.88版本中,包含了一个59.8MB的source map文件,该文件直接指向了存储在Cloudflare R2中的一个压缩包,内含约1900个文件、51.2万行代码。几小时内,GitHub上便出现了多个镜像仓库,其中一个名为‘claw-code’的项目在两小时内获得5万颗星,成为GitHub史上涨星最快的仓库之一,fork数超过4.15万。
开发者社区的评价直指核心——‘讽刺得不真实’。然而,讽刺背后是实打实的技术资产泄露。Claude Code远非一个简单的模型API命令行外壳。泄露的代码揭示了一个精密到令人意外的内部架构。其采用了类似插件的工具系统,每种能力(如文件读写、shell执行、网页抓取、LSP集成)都是一个独立的、有严格权限管控的工具模块,仅工具定义层就有2.9万行TypeScript。每个工具的描述都极为详尽,本质上是一种精心调优的提示工程(prompt engineering),明确指导模型何时使用、如何使用以及期望的结果。
更关键的是,代码暴露了一个三层‘自修复记忆’架构,其底层设计逻辑和实现细节一览无余。对于其他AI公司而言,这次泄露提供了一个前所未有的‘抄作业’机会,可以深入研究Anthropic在工具编排、权限控制、记忆系统以及人机交互流程上的工程化实践。这不仅关乎代码复用,更关乎理解一家头部AI公司如何将安全理念(尽管此次被讽刺地违背)和复杂能力封装到产品中的系统级思路。此次事件将Anthropic置于巨大的舆论与信任压力之下,并可能引发行业对AI公司内部代码管理与发布流程安全性的新一轮审视。