NC AI가 16일 로봇 지능의 핵심인 ‘월드 파운데이션 모델을 성공적으로 시연하며 글로벌 피지컬 AI 시장에 강력한 도전장을 던졌다. NC AI의 WFM이 예측한 영상(왼쪽)과 로봇이 시뮬레이터에서 실제로 움직인 영상(오른쪽). (사진=NC AI 제공)
16일 NC AI는 자체 개발한 ‘월드 파운데이션 모델(WFM)’이 고난도 로봇 조작 태스크에서 글로벌 최고 성능 모델 대비 80% 수준의 성공률을 달성했다고 밝혔다. WFM은 로봇 지능의 핵심으로, 최근 많은 글로벌 빅테크들이 천문학적인 자본을 투입하고 있는 분야다. 그럼에도 로봇이 학습한 정보와 현실 사이의 ‘시뮬레이션-현실(Sim2Real)’ 격차는 해결하지 못한 과제로 남아있다.
보통 WFM은 영상을 생성하고 이를 ‘비전언어모델(VLM)’으로 추론을 한 뒤에 취해야 할 행동을 선택한다. NC AI는 과감하게 영상을 생성하고 추론하는 단계를 제거하고, 영상을 생성하기 전 신경망 정보(잠재공간 정보)에서 바로 행동을 도출하는 방식을 택했다. 연산이 많이 필요한 작업을 제거해 효율성은 높이고, 영상을 생성할 때 발생할 수 있는 ‘할루시네이션(환각)’을 방지함으로써 정확성은 높였다는 설명이다. 실제 이번 연구 성과는 글로벌 최고 성능 모델의 파인튜닝(미세 조정)에 필요한 그래픽처리장치(GPU) 자원의 25% 만으로 달성됐다.
광고 로드중
회사는 로봇 팔의 복잡한 움직임을 제어하는 24개의 고난도 로봇 조작 태스크로 시험한 결과, 자체 개발한 WFM이 엔비디아의 WFM ‘코스모스’ 등 최고 성능 모델 대비 70% 성능을 확보했다. 현장 투입 및 상용화와 직결되는 18개 핵심 과제에 대해서는 80%에 해당하는 성능을 보였다.
최지원 기자 jwchoi@donga.com