●안전장치 적용된 미토스급 모델
9일(현지 시간) 앤스로픽은 미토스급 모델을 일반용으로 안전하게 조정한 ‘클로드 페이블5’와 보안 특화 모델인 ‘클로드 미토스5’를 출시했다고 밝혔다. 미토스5는 종전처럼 앤스로픽의 승인을 받은 소수 기관과 기업에만 제공하고, 일반 사용자와 개발자에게는 안전장치가 적용된 페이블5를 공개한 것. 앤스로픽은 ‘페이블’의 어원이 라틴어 ‘파불라(fabula)’로, 신화를 뜻하는 ‘미토스’와 유사한 뜻이라고 소개했다.
광고 로드중
다만 성능에는 일종의 ‘제한’이 있다. 악용 위험이 큰 분야에는 안전장치가 적용됐기 때문이다. 해커의 악용이 우려되는 사이버 보안이나, 생물무기 등에 악용될 수 있는 생물학, 화학 등에 대한 질의에 대해서는 바로 아래 단계 모델인 ‘오퍼스4.8’이 응답을 대신 처리하고 이용자에게 해당 사실을 고지한다.
앤스로픽은 자사 홈페이지를 통해 “페이블5는 거의 모든 AI 성능 벤치마크에서 최첨단 성능을 보여주며 소프트웨어 엔지니어링, 지식 기반 작업, 컴퓨터 비전, 과학 연구 등 다양한 분야에서 탁월한 성능을 입증했다”고 밝혔다. 이어 “안전장치가 없다면 페이블5의 사이버 보안 기능이 악용돼 심각한 피해를 초래할 수 있다”며 “모델을 안전하고 신속하게 출시하기 위해 안전장치를 보수적으로 조정했다”고 설명했다.
●모델 복제하는 ‘증류’도 걸러
이 같은 안전장치는 경쟁 AI 모델의 기능을 빼내는 무단 ‘증류’에도 적용된다. 증류는 고성능AI에게 수십 만개의 질문을 던진 뒤 나온 답변을 학습 데이터로 활용하는 일종의 ‘압축 학습방식’이다. 통상 기업이 자사 상위 모델 성능에 버금가는 경량 모델을 만들 때 쓰이지만, 최근 중국의 일부 AI 모델이 타사AI 모델을 ‘증류’해 학습시켰다는 문제 제기가 잇따랐다.
광고 로드중
전혜진 기자 sunrise@donga.com