미국 앤트로픽의 ‘클로드(Claude)’ 모델 데이터가 ‘증류(Distillation)’ 과정을 거쳐 딥시크, 문샷 AI, 미니맥스 등 중국 AI 기업으로 추출되는 과정을 시각화한 그래픽. 제미나이(Gemini) AI 생성 이미지
광고 로드중
미국 인공지능(AI) 기업 앤트로픽(Anthropic)이 중국 AI 기업들이 자사 모델 ‘클로드(Claude)’에 대규모로 접근해 데이터를 추출했을 가능성을 제기하며 논란이 확산되고 있다.
앤트로픽은 중국 기업들이 2만4000개 이상의 가짜 계정을 생성해 1600만 건이 넘는 질의를 수행했다고 주장했으며, 해당 과정이 자사 AI 모델의 응답 구조와 추론 능력을 분석·학습하는 데 활용됐을 수 있다고 밝혔다.
23일(현지 시간) 월스트리트저널(WSJ)에 따르면 앤트로픽은 딥시크(DeepSeek), 문샷 AI(Moonshot AI), 미니맥스(MiniMax) 등 중국 AI 기업 3곳이 반복적인 질의 방식으로 클로드 모델 데이터를 확보하려 했을 가능성을 제기했다.
광고 로드중
앤트로픽이 문제로 지목한 방식은 ‘모델 증류(distillation)’로 불리는 AI 개발 기법이다. 이는 기존 대형 모델의 응답 결과를 활용해 보다 작고 효율적인 모델을 학습시키는 방식으로, 업계에서는 일반적으로 활용되는 기술 중 하나다.
다만 앤트로픽은 경쟁사의 AI 시스템을 대상으로 대규모 질의를 수행할 경우, 상대 모델의 성능과 논리 구조를 빠르게 모방하는 데 사용될 수 있다고 주장했다. 회사 측은 이러한 방식이 제품 개발 시간을 크게 단축하고 비용을 낮출 수 있다고 설명했다.
앤트로픽에 따르면 기업별 상호작용 규모에는 차이가 있었다. 딥시크는 약 15만 회 수준의 질의를 수행한 반면 문샷 AI와 미니맥스는 각각 수백만 건에서 천만 건 이상의 상호작용을 진행한 것으로 분석됐다.
● 오픈AI 이어 제기된 의혹…AI 경쟁 전선 확대
광고 로드중
최근 중국 AI 기업들은 추론 능력과 코딩 성능을 강화한 신규 모델을 잇따라 공개하며 기술 격차 축소 가능성을 보여왔으며, 업계에서는 이러한 성능 향상 배경을 둘러싼 논쟁이 지속돼 왔다.
WSJ에 따르면 딥시크와 문샷 AI, 미니맥스 측은 관련 의혹에 대해 별도의 입장을 내놓지 않았다.
다만 딥시크는 과거 연구 자료에서 공개 웹페이지와 전자책 중심으로 학습 데이터를 구성했으며, 일부 웹페이지에 다른 AI 모델이 생성한 답변이 포함돼 있었을 가능성은 있다고 설명한 바 있다.
● 국가 안보 문제로 번진 AI 데이터 경쟁
광고 로드중
회사 측은 해외 연구기관이 미국 AI 모델을 통해 확보한 기능이 향후 군사·정보·감시 시스템 등에 활용될 가능성이 있다고 주장했다. 이러한 우려는 최근 미국 정부와 의회가 추진 중인 대중국 AI 기술 통제 논의와도 맞물려 있다는 분석이 나온다.
월스트리트저널은 이번 논란이 기존의 반도체·GPU 수출 제한 중심 규제를 넘어, AI 모델 접근과 데이터 활용 방식 자체를 둘러싼 새로운 경쟁 단계로 확산되고 있다고 전했다.
실제로 앤트로픽과 오픈AI 등 미국 AI 기업들은 미 정부에 클라우드 인프라 접근 관리 강화 등 추가적인 대응 필요성을 제기한 것으로 알려졌다. 업계에서는 향후 AI 경쟁의 핵심 쟁점이 하드웨어 확보를 넘어 데이터 접근과 학습 방식 통제로 이동할 가능성이 제기되고 있다.
최현정 기자 phoebe@donga.com