‘국가대표 AI’를 개발하겠다는 정부의 ‘독자 AI 파운데이션’ 사업이 논란에 휩싸였다. 네이버가 중국 알리바바의 인공지능(AI) 모델 ‘큐웬(Qwen)’의 이미지와 음성 인코더를 차용했다고 인정한 가운데, 경쟁 기업에서 평가 기관 측에 공식 문제 제기를 한 것으로 확인됐다.
7일 정보기술(IT) 업계에 따르면 독자 AI 파운데이션 선발전에 참여한 5개 정예팀 중 1곳이 평가 기관으로 참여 중인 한국정보통신기술협회(TTA)에 기술 검토 보고서를 제출했다. 네이버가 공개한 ‘하이퍼클로바X-띵크-32B·옴니-8B’ 모델에 활용된 이미지·음성 인코더가 알리바바 ‘큐웬 2.5 ViT’의 것을 차용한 데 따른 것이다.
동아일보가 입수한 이 보고서는 “(최신 연구들에 따르면) 인코더는 단순 부품이 아닌 핵심 지능 모듈”이라며 “비전(시각) 인코더의 품질은 멀티모달 대형언어모델(MLLM) 최종 성능의 상한선을 결정한다”고 지적했다. 또 “외부 인코더에 의존하는 모델은 지각적 특징 추출 단계부터 타사 아키텍처에 종속된다”며 “진정한 의미의 AI 주권 확보를 불가능하게 한다”고 강조했다.
인코더는 입력되는 이미지나 음성 데이터를 AI가 활용하는 데이터로 변환해주는 기능으로, AI의 ‘눈과 귀’에 비유된다. ‘중국산 인코더’ 논란에 네이버는 “검증된 인코더를 쓰는 것은 업계의 일반적인 방식”이라며 ‘두뇌’에 해당하는 파운데이션 모델은 자체 기술로 개발했기 때문에 독자성에는 문제가 없다는 입장이다.
하지만 업계에서는 “향후 라이선스 문제가 발생할 수 있다”고 우려한다. 정부도 지난해 7월 사업 공고 당시 독자 AI 파운데이션의 조건을 두고 “해외 모델 미세조정(파인튜닝) 등으로 개발한 파생형 모델이 아닌, 모델의 설계부터 사전 학습 과정 등을 수행한 국산 모델(타사 모델에 대한 라이선싱 이슈 부재)”이라고 명시하기도 했다.
댓글 0