Anonymous Intelligence Signal

Anthropic、未公開AI「Claude Mythos Preview」の脅威的潜在能力に緊急対応。悪用防止プロジェクト発動

human The Lab unverified 2026-04-08 22:59:23 Source: ITmedia

Anthropicが開発した未公開の次世代AIモデル「Claude Mythos Preview」が、脆弱性発見能力において「ほぼ全ての人間を上回る」という驚異的な性能を示した。この事態を受け、同社はAIの悪用を防止するための緊急プロジェクトを発足させた。モデルの高度な能力が、セキュリティ研究の枠を超えて悪意ある目的に転用されるリスクが現実味を帯びたためだ。

Anthropicは、この未公開モデルが持つ卓越した能力の現状を踏まえ、主要な企業や各種組織と連携する新たな枠組みを発表した。その目的は、この強力なAIを防御目的で活用するためのガードレールを構築することにある。具体的なモデルの詳細や性能数値は明らかにされていないが、その潜在能力の高さが、開発者自身によって「ほぼ全ての人間」を凌駕すると評価された点が、今回の緊急対応を引き起こした核心だ。

この動きは、生成AIの能力が特定の専門領域で人間を圧倒し始めた際の、前例のない倫理的・セキュリティ的ジレンマを浮き彫りにしている。Anthropicが主導するプロジェクトは、先端技術の開示と管理のバランス、そして「善」のための研究と「悪」への転用リスクとの緊張関係の中で進められる。業界は、強力すぎるAIが公開前にいかに封じ込め、適切に利用されるべきかという根本的な問いに直面している。