7일 정보기술(IT) 업계에 따르면 독자 AI파운데이션 선발전에 참여중인 5개 정예팀 중 1곳이 평가 기관으로 참여 중인 한국정보통신기술협회(TTA)에 기술 검토 보고서를 제출했다. 네이버가 공개한 ‘하이퍼클로바X-띵크-32B·옴니-8B’ 모델에 활용된 이미지·음성 인코더가 알리바바 ‘큐웬 2.5 ViT’의 것을 차용한 데 따른 것이다.
동아일보가 입수한 이 보고서에는 “(최신 연구들에 따르면) 인코더는 단순 부품이 아닌 핵심 지능 모듈”이라며 “비전(시각) 인코더의 품질은 멀티모달 대형언어모델(MLLM) 최종 성능의 상한선을 결정한다”고 지적했다. 또 “외부 인코더에 의존하는 모델은 지각적 특징 추출 단계부터 타사 아키텍처에 종속된다”며 “진정한 의미의 AI 주권 확보를 불가능하게 한다”고 지적했다.
광고 로드중
하지만 업계에서는 “향후 라이센스 문제가 발생할 수 있다”는 우려의 목소리도 나온다. 국내의 한 AI 전문가는 오픈소스라도 정확한 라이선스 조건을 확인해야 하고 나중에 오픈소스를 제공한 측에서 비용을 요구할 가능성도 있다“고 했다.
정부도 지난해 7월 사업 공고 당시 독자 AI파운데이션을 두고 “해외 모델 미세조정(파인튜닝) 등으로 개발한 파생형 모델이 아닌 모델의 설계부터 사전학습 과정 등을 수행한 국산 모델(타사 모델에 대한 라이센싱 이슈 부재)”라는 조건을 달기도 했다.
최지원 기자 jwchoi@donga.com