클로드 페이블5 논란 확산…유저 ‘엔트로픽, 대표 AI 감금’ 주장

  • Claude Fable 5, 브릿지벤치 점수 86.2→25.9
  • 12개 디버깅 중 3개만 Opus 4.8로 안넘어감
  • 앤트로픽, 오탐지 증가 인정…핵심 모델 변화 없음
Promo

앤스로픽(Anthropic)의 클로드 페이블 5(Claude Fable 5)가 7월 1일 재출시 이후 점차 거센 반발에 직면하고 있습니다. 사용자들은 더 엄격해진 가이드라인 때문에 주력 모델의 코딩, 디버깅, 에이전트 성능이 크게 저하되었다고 주장합니다.

벤치마크 그룹 브릿지마인드(BridgeMind)는 브릿지벤치(BridgeBench) 전 항목에서 점수가 대폭 하락했다고 보고했습니다. 한편, 앤스로픽은 기본 모델은 변경되지 않았으며, 이 마찰이 강화된 안전 분류 때문이라고 설명합니다.

후원
후원

클로드 페이블 5, 재출시 이후 벤치마크 점수 폭락

브릿지마인드는 7월 1일자 페이블 5 버전을 재실행해, 점수가 급락한 것을 기록했습니다. 디버깅 점수는 86.2에서 25.9로, 리팩토링은 73.6에서 38.4로, 환각 대응은 75.9에서 61.7로 하락했습니다.

클로드 페이블 5의 브릿지벤치(BridgeBench) 점수, 재출시 전후 비교, 출처: X 사용자
클로드 페이블 5의 브릿지벤치 점수, 재출시 전후 비교, 출처: X 사용자

이 숫자 뒤의 메커니즘이 중요합니다. 12개의 디버깅 과제 중 세 가지만 클로드 오퍼스 4.8(Claude Opus 4.8)으로 교체하지 않고 완료되었으며, 모든 교체 시도는 0점을 기록했습니다.

따라서 이번 점수 폭락은 추론 능력 약화가 아닌 과제 차단에 의한 것입니다.

브릿지마인드는 과제가 끝까지 수행될 경우 페이블 5는 6월 당시와 성능이 같다고 강조했습니다.

“모델이 나빠진 것이 아니라, 갇혀버렸습니다.” – 브릿지마인드(BridgeMind) 측 설명

최신 소식 실시간 확인은 X에서 팔로우하세요

후원
후원

일련의 상황이 긴장감을 설명합니다. 앤스로픽은 6월 9일 페이블 5를 출시했고, 워싱턴은 3일 만에 서비스 중단을 결정했습니다. 규제 당국은 6월 30일, 100곳가량의 미국 기관에 미토스 5(Mythos 5) 접근권을 4일 전 재개한 뒤, 수출 통제를 해제했습니다.

복원된 접근권에도 제한이 걸립니다. 페이블 5는 7월 7일까지 주간 사용량 한도의 50%만 사용할 수 있고, 이후에는 유료 사용 크레딧으로 전환됩니다.

앤스로픽, 강화된 안전망 방어 입장 표명

앤스로픽은 6월 30일자 성명에서 이 교환 관계를 설명했습니다. 회사는 안전 여유폭을 의도적으로 넓히면서, 지금은 잠재적으로 정상적인 요청까지도 분류기가 차단한다고 밝혔습니다. 아마존 연구진은 새로운 필터가 우회 기법을 99% 이상의 시도에서 막았다고 보고했습니다.

차단된 요청은 오퍼스 4.8로 전달되며, 사용자에게 알림이 제공됩니다. 그러나 앤스로픽은 이전보다 더 많은 정상 코딩 및 디버깅 요청까지 필터가 걸러낸다고 인정했습니다.

자체 테스트에서도 페이블 5가 특유의 위험성을 지니지 않는다고 확인했습니다. GPT-5.5, 키미(Kimi) K2.7 등 경쟁 모델도 동일한 취약점을 식별했습니다.

앤스로픽은 미국 상무부 연구진이 두 가지 보호 장치 버전을 모두 평가한 결과, 매우 강력하다고 판단했다고 밝혔습니다.

논쟁은 단일 제품 주기를 넘어섭니다. 일시적 중단으로 유럽은 앤스로픽 유치에 나섰으며, 중국 AI 모델들은 미국 선행 연구소에 격차를 좁히고 있습니다.

앤스로픽은 현재 아마존, 마이크로소프트, 구글과 탈옥 심각도 프레임워크를 마련 중입니다. 분류기가 빠르게 오탐을 걸러낼 수 있느냐가 파워 유저 이탈 여부를 좌우할 수 있습니다.


BeInCrypto의 최신 암호화폐 시장 분석을 보려면 여기를 클릭하세요.

부인 성명

비인크립토 웹사이트에 포함된 정보는 선의와 정보 제공의 목적을 위해 게시됩니다. 웹사이트 내 정보를 이용함에 따라 발생하는 책임은 전적으로 이용자에게 있습니다. 아울러, 일부 콘텐츠는 영어판 비인크립토 기사를 AI 번역한 기사입니다.

후원
후원