
절충: Fable 5는 일상적인 코딩 작업을 차단할 수 있습니다.
6월 12일, 상무부는 Anthropic에 미국 이외의 모든 사람이 자사의 가장 진보된 모델에 대한 접근을 차단하도록 명령했습니다. 이 명령은 중국, 러시아 또는 기타 우려 국가가 전력망이나 은행 시스템과 같은 미국 인프라를 공격하기 위해 모델을 이용할 수 있다는 두려움에서 나왔습니다. 이에 대해 Anthropic은 국가별로 사용자를 차단할 방법이 없었기 때문에 모든 액세스를 차단했습니다.
특히 Mythos는 “사이버 공격에 이를 오용하려는 악의적인 행위자에게 매우 매력적인” 것으로 간주되었다고 Anthropic의 블로그는 밝혔습니다. Anthropic에 따르면 이 모델은 “가장 숙련된 인간 보안 전문가를 제외한 모든 모델보다 더 효과적으로 소프트웨어 취약점을 찾아 악용하는 데 사용될 수 있으며” 이러한 “놀라운 사이버 보안 기능”은 미국을 상대로 사용될 수 있습니다.
Fable 5는 “동일한 기본 모델”을 공유하지만 Mythos 5와 달리 “그렇게 독특한 공격 기능을 제공하지 않습니다”라고 Anthropic은 말했습니다. 일반 대중을 위해 설계된 Fable 5는 이미 Anthropic이 모델에 적용한 것 중 가장 강력한 보호 장치를 갖추고 있으며, Anthropic은 이러한 보호 장치가 이제 재배치에 앞서 더욱 강력하다고 말했습니다.
몇 주간의 테스트를 거친 후 Fable 5는 여러 가지 소프트웨어 취약점을 식별하고 수출 제한을 촉발한 Amazon 연구원이 발견한 우회 방법에 더 이상 취약하지 않습니다. Anthropic은 가장 문제가 되는 것은 취약점이 어떻게 악용될 수 있는지 보여주는 코드를 생성하도록 모델을 조작한 사례라고 말했습니다.
Anthropic에 따르면 테스트 결과 GPT-5.5 및 Kimi K2.7과 같은 시장에서 덜 발전된 경쟁 모델이 “보고서에서 Fable 5와 동일한 취약점을 식별할 수 있는” 것으로 확인되었습니다. 이를 통해 “보고된 기술은 Mythos 수준의 고유한 사이버 기능을 노출하지 않았으며” 일상적인 방어 사이버 보안 작업만 포함했음을 확인했습니다.
“그럼에도 불구하고 우리는 보고된 우회 문제를 해결하기 위해 신속하게 움직였습니다.”라고 Anthropic은 썼습니다. 이러한 탈옥 방법은 현재 99% 이상의 경우에서 차단된다고 Anthropic은 말했습니다. 그러나 보안 조치를 강화하면 “일상적인 코딩 및 디버깅 작업 중에” 일부 양성 프롬프트가 차단될 수 있는 “절충점”이 발생한다고 회사는 인정했습니다.
이 주제에 대해 더 알고 싶다면 아래를 참고하세요