Anonymous Intelligence Signal
华裔科学家程牛顿领衔Anthropic前沿红队,神秘小队决定不发布危险AI模型Mythos Preview
Anthropic决定不公开发布其强大的新AI模型Mythos Preview,理由是它可能构成严重的网络安全威胁。该模型的能力被描述为“强到让人害怕”,既能极大增强网络攻击,也能显著加强网络防御。为了避免模型被恶意行为者率先利用,Anthropic启动了“玻璃之翼项目”,选择性地将模型提供给关键行业合作伙伴和开源开发者,优先赋能网络防御方。这一决策的核心信号是,网络安全已成为AI发展的首要红线。
这一关键评估和决策,直接关联到Anthropic内部一个极为神秘的精英组织——前沿红队。该团队长期扮演“刺儿头”角色,从各个维度挑战和测试模型的弱点与潜在风险。此次走到台前、代表公司对外发声的,正是前沿红队中网络安全团队的负责人、华裔研究员Newton Cheng(程牛顿)。他频繁出现在官方信息和媒体采访中,明确表示:“由于Claude Mythos Preview的网络安全特性,我们不打算将其公开发布。”
程牛顿的背景揭示了一条非传统的安全专家路径。他拥有斯坦福大学物理学士学位和加州大学伯克利分校量子信息与量子引力博士学位,并非来自传统网络安全或渗透测试领域。2022年加入Anthropic后,他从基础科学研究转身,迅速在AI安全前沿获得重用。他的领导角色标志着,评估尖端AI风险的核心权力,正从传统的安全机构向拥有顶尖科学训练、能理解模型底层原理的研究者手中转移。Anthropic通过这一机制,试图在AI能力爆发与全球安全之间建立一道内部防火墙。