앤트로픽(Anthropic)의 클로드 미토스 프리뷰(Claude Mythos Preview)가 영국 AI 보안 연구소(AI Security Institute, AISI)의 새로운 평가에서 최초로 전체 시뮬레이션 기업 네트워크 공격을 완료한 AI 모델이 되었습니다.
이 결과는 모델이 4월 7일 공개된 지 며칠 만에 발표되었습니다. 암호화폐 사이버 역량이 보안팀의 즉각적인 대처를 요구할 만큼 높은 수준에 도달했음을 시사합니다.
클로드 미토스란 무엇입니까?
앤트로픽은 4월 7일 클로드 미토스 프리뷰 모델을 공개했습니다. 광범위한 대중 공개 대신, 연구팀은 보안 연구 기관에 제한적으로 접근 권한을 제공하고, 이 모델의 고도화된 역량을 평가 및 대비할 수 있도록 하였습니다.
“이 모델은 전반적으로 뛰어난 성능을 보입니다. 특히 컴퓨터 보안 작업에서 두드러진 역량을 보여줍니다. 이에 우리는 프로젝트 글래스윙(Project Glasswing)을 시작하였습니다. 이 프로젝트는 미토스 프리뷰를 활용해 세계에서 가장 중요한 소프트웨어를 보호하고, 나아가 사이버공격자에 앞서기 위해 산업계가 채택해야 할 실천 방안을 준비하는 노력입니다.” – 발표문
X에서 저희를 팔로우하시면, 최신 뉴스를 빠르게 받아 보실 수 있습니다
이 같은 개발은 이미 기술 및 정책 분야 전반에서 큰 관심을 받고 있습니다. 로이터 보도에 따르면, 상황에 정통한 소식통을 인용하였습니다. 미국 재무장관 스콧 베센트와 연방준비제도(Fed) 의장 제롬 파월이 주요 은행 CEO들과 긴급 회의를 개최하였고, 이 모델과 관련된 잠재적 사이버 위험에 대해 경고하였습니다.
클로드 미토스 프리뷰의 성과
AI 보안 연구소(AISI)는 영국 정부 과학혁신기술부 산하 연구기관입니다. 이곳에서 앤트로픽의 클로드 미토스 프리뷰의 사이버보안 역량을 평가하기 위한 사이버 평가를 실시하였습니다.
첫 번째는 캡처더플래그(CTF) 평가였습니다. 시스템은 숨겨진 “플래그”를 찾기 위해 취약점을 식별 및 활용하는 과제에 도전합니다. 미토스는 전문가 수준 과제에서 73%의 성공률을 기록했습니다. 이는 2025년 4월 이전까지 어느 모델도 해결하지 못한 기록입니다.
또한 AISI는 ‘더 라스트 원스(The Last Ones, TLO)’라는 32단계 기업 네트워크 공격 시뮬레이션을 구축하였습니다. 보안 전문가가 이 과제를 완료하려면 약 20시간이 소요됩니다.
미토스 프리뷰는 10번의 시도 중 3회 전체 시뮬레이션을 완료했습니다. 평균적으로는 32단계 중 22단계를 마치게 되었습니다. 차상위 모델인 클로드 오푸스 4.6(Claude Opus 4.6)의 평균은 단 16단계였습니다.
“미토스 프리뷰가 한 사이버 레인지에서 성공을 거둔 것은, 네트워크에 접근이 이루어진 소규모이자 방어가 약한 취약 기업 시스템을 자율적으로 공격할 역량이 있음을 의미합니다. 다만, 우리의 환경과 실제 환경은 중요한 차이가 존재해 더 쉽다는 점을 주의해야 합니다.” – 연구팀
앤트로픽의 자체 레드팀 테스트에서도 클로드 미토스 프리뷰가 주요 운영체제 및 선두 웹브라우저에서 제로데이 취약점을 사용자 명령에 따라 탐지하고 공략할 수 있음을 확인하였습니다.
“이 자리에서 자세히 보고할 수 있는 정보는 제한적입니다. 발견한 취약점 중 99% 이상은 아직 패치되지 않았기 때문에, 상세한 내용을 공개하는 것은 무책임한 일입니다.” – 연구팀
AISI는 조직들이 기본적인 사이버보안 조치를 우선시해야 한다고 강조하였습니다. 여기에는 정기적인 패치 작업, 엄격한 접근 권한 통제, 보안 구성 강화, 그리고 체계적인 로그 관리 등이 포함됩니다.
YouTube 채널을 구독하시면, 업계 리더와 기자들의 전문 인사이트 영상을 시청하실 수 있습니다





