앤스로픽 “중국 해커, 클로드 탈옥시켜 대규모 사이버 공격 자동화”
[서울=뉴스닻] 최승림 기자 = 생성형 AI 스타트업 앤스로픽(Anthropic)이 자사 챗봇 ‘클로드(Claude)’가 중국 국가지원 해킹 조직에 의해 ‘탈옥(jailbreak)’돼, 사람 개입이 크지 않은 상태에서 대규모 사이버 공격에 악용됐다고 밝혔다. 회사 측은 이번 시도가 “주요 단계의 80~90%를 AI가 수행한 첫 대규모 공격 사례”일 수 있다고 평가했다.
앤스로픽은 목요일 공개한 블로그 게시글에서, 문제의 공격이 전 세계 약 30개 표적을 겨냥했다고 설명했다. 대상에는 대형 기술 기업, 금융기관, 화학 제조업체, 각국 정부 기관 등이 포함됐으며, 이 가운데 “소수 표적에 대해서는 침투 시도가 실제로 성공했다”고 밝혔다.
회사 측은 공격 인프라 운영과 침투 시도, 일부 작업 자동화 등 전체 작업의 약 80~90%를 클로드가 처리했으며, “본질적으로 AI가 주도한 작전”이었다고 강조했다. 다만 배후로 지목된 중국 정부 지원 해킹 조직의 구체적 이름이나 세부 전술은 공개하지 않았다.

최근 기업들은 고객 응대 티켓 처리, 단순 운영 업무 등 반복 작업을 맡기는 ‘AI 에이전트(agents)’를 빠르게 도입해 왔다. 사람의 지시를 받아 자율적으로 여러 단계를 수행하는 이들 에이전트는 화이트칼라 업무 생산성을 높이는 도구로 각광받고 있다.
그러나 앤스로픽은 이번 사례처럼 동일한 기술이 해킹에도 그대로 전용될 수 있다고 경고했다. 지난해 8월에도 회사는, 소규모 팀이 클로드를 활용해 해킹 작업을 자동화하려 한 정황을 포착하고 차단했다고 밝힌 바 있다. 이번 공격은 그보다 더 조직적이고 규모가 큰 시도로 평가된다.

앤스로픽은 이번 작전을 분석한 결과, 일부 단계는 “인간 해커만으로는 사실상 불가능한 속도와 규모”였다고 설명했다. 거대한 양의 표적 정보를 수집·분석하고, 피싱·취약점 탐색 같은 초기 침투 과정을 병렬로 돌리는 데 AI가 핵심 역할을 한 것으로 보인다.
기존에도 해킹 커뮤니티에서 AI를 보조적으로 활용해온 사례는 있었지만, 앤스로픽은 “이번처럼 공격의 대부분을 AI가 처리한 ‘대규모 작전’이 문서화된 것은 처음으로 보인다”고 평가했다. 보안 업계에서는 앞으로 사이버 공격의 ‘규모와 속도’를 근본적으로 바꿀 분기점이 될 수 있다는 우려가 나온다.

AI 에이전트는 합법적 용도와 악성 용도가 사실상 동일한 기술 기반을 공유한다. 이 때문에 단순 키워드 차단이나 사용 약관만으로는 악용을 완전히 막기 어렵다는 지적이 꾸준히 제기돼 왔다.
앤스로픽 역시 이번 사건을 계기로, 모델이 공격 코드 작성·취약점 스캐닝·피싱 시나리오 설계 등 고위험 작업에 동원되지 않도록 추가 안전장치를 도입하겠다고 밝혔다. 보안 전문가들은 “모델 개발 단계부터 ‘적대적 사용’을 전제로 한 레드팀(red-teaming)과 남용 탐지 체계가 필수”라며, AI 기업과 정부의 공조가 없으면 향후 더 정교한 AI 주도 공격이 반복될 수 있다고 경고한다.
[저작권자 ⓒ 뉴스닻. 무단전재·재배포 금지]
최승림 기자 (seunglim.choi@newsdot.net)