앤스로픽(Anthropic)이 미공개 Claude Mythos 모델의 상세 정보를 보안되지 않은 데이터 캐시에서 실수로 노출했다. Fortune 보도에 따르면 약 3,000건의 미공개 자료가 유출됐으며, 보안 연구자 로이 파즈(LayerX)와 알렉산드르 포엘스(캠브리지)가 이를 발견했다.
앤스로픽은 Mythos가 “역대 가장 뛰어난 모델이며 성능의 단계적 도약(step change)“이라고 설명했다. 동시에 내부 문서에서는 이 모델이 “소프트웨어 취약점을 빠르게 찾아 악용하는 전례 없는 사이버보안 위험”을 가진다고 경고했다. AI 안전을 핵심 가치로 내세우는 앤스로픽의 자체 모델 정보가 유출된 것은 아이러니한 상황이다.
앤스로픽이 10월 IPO를 검토 중인 가운데 나온 유출이라 타이밍도 민감하다. AI 모델이 강력해질수록 유출 시 위험도 함께 커진다는 점을 보여주는 사례다.