Anthropic、次世代AI「Claude Mythos」公開を危険性で保留、40社超とサイバー防衛プロジェクト「グラスウィング」始動
AI開発の最先端企業Anthropicが、その次世代モデル「Claude Mythos」の一般公開を、サイバーセキュリティ上のリスクを理由に保留した。これは単なるリリース延期ではなく、AIの危険性に対する根本的な警戒を示す異例の措置だ。同社は代わりに、この強力なプレビュー版モデルを特定の企業のセキュリティ強化に限定利用する新プロジェクト「プロジェクト・グラスウィング」を立ち上げ、AIの潜在的な脅威を封じ込めるための前例のない実験を開始する。
Anthropicは7日、最先端モデル「Claude Mythos Preview」の公開を保留し、その能力を「プロジェクト・グラスウィング」に集中させると発表した。このプロジェクトは、AIが自ら生成したコードや戦略を用いて、参加企業のシステムに対するサイバー攻撃をシミュレートし、防御策を強化することを目的としている。Anthropicは参加する40社以上のテクノロジー企業に対し、最大1億ドル相当の利用クレジットを提供する。これは、危険視されるAI能力を、厳重に管理された環境下で「以毒制毒」的に活用する、極めて野心的かつ危険な綱渡り的な試みである。
この決定は、生成AIの能力が安全保障のレッドラインに近づきつつある業界の現実を浮き彫りにする。一般公開を断念し、選別された企業群との閉じた協業に舵を切る姿勢は、AI開発のスピードと安全性のバランスが重大な岐路に立っていることを示唆している。「プロジェクト・グラスウィング」の成否は、超高度なAIをいかに「封じ込め」ながらその利点を活用するかという、業界全体が直面する核心的な課題への一つの答えとなりうる。その過程で明らかになる脆弱性や、プロジェクト自体のリスクは、今後の規制議論や企業のAI導入戦略に大きな影響を与える可能性が高い。