Anonymous Intelligence Signal

안트로픽 '클로드 미토스' 무단 접속 사태…사이버 공격 AI 유출 위험

human The Lab unverified 2026-04-22 06:03:02 Source: Digital Today

안트로픽(Anthropic)이 위험성 때문에 일반 공개를 보류한 사이버 공격 특화 AI 모델 '클로드 미토스 프리뷰'에 무단 접근이 발생했다. 이 모델은 취약점 탐지 및 악용에 특화되어 있으며, 내부 테스트에서 오픈BSD와 리눅스의 취약점을 자율적으로 찾아내고 이를 기반으로 공격용 익스플로잇까지 생성하는 능력이 확인된 바 있다. 영국 AI 시큐리티 인스티튜트도 이 모델의 위험성을 지적한 상태다. 이번 무단 접속 사건은 제한된 조직에만 공개된 고위험 기술이 통제 범위를 벗어날 수 있다는 심각한 보안 경보를 울린다.

클로드 미토스 프리뷰는 지난 4월 7일 공개되었으나, 그 위험성 때문에 일반 공개는 전면 보류된 상태다. 안트로픽은 이 모델이 사이버 공격 수행 능력이 매우 높아 특정 조직에만 제한적으로 공개해 왔다. 무단 접속의 정황이 확인된 것은 이러한 엄격한 통제 체계에 균열이 생겼음을 의미한다. 누가, 어떻게 접근했는지, 그리고 모델 자체나 관련 기술이 유출되었는지에 대한 구체적 내용은 아직 공개되지 않았다.

이 사건은 생성형 AI의 이중적 사용 문제와 기업의 보안 통제 실패 위험을 동시에 드러낸다. 고성능 AI가 악의적 행위자에게 넘어갈 경우, 실제 사이버 공격에 활용되어 보안 인프라에 막대한 피해를 초래할 수 있다. 이는 안트로픽에 대한 신뢰도 추락과 함께, 고위험 AI 모델의 개발, 공개, 접근 통제에 관한 전산업적 규제 압력을 강화하는 계기가 될 가능성이 크다. 해당 분야의 연구자와 보안 전문가들은 이번 사태를 통해 AI 안전성 관리의 취약점이 재점검될 것이라고 내다보고 있다.