오픈AI(OpenAI)가 2024년 12월에 출시한 동영상 생성 인공지능 서비스인 소라(Sora)는 문자로 고품질 영상을 만든다는 점에서 시장에 충격을 안겼다. 시장은 영상 제작의 패러다임을 바꿀 게임 체인저로 평가했다. 이와 동시에 런웨이ML(RunwayML), 구글 딥마인드 비오(Veo), 피카(Pika), 하이루오(Hailuo) 등 다양한 서비스가 출시되며 생성형 인공지능 콘텐츠 산업이 빠르게 발전했다.
하지만 소라는 타 서비스와 비교해 기술 발전이 느렸다. 그 사이 구글은 1분 이상 영상 생성과 향상된 이미지-비디오 변환 기능을 갖춘 비오3을 공개했고, 런웨이는 4세대 생성 모델을 앞세워 고해상도 영상 생성 능력을 강화했다.
동영상 생성 인공지능 경쟁력 강화에 나선 오픈AI는 2025년 9월 30일, 소라 2를 공개했다. 흥미로운 부분은 기존 온라인 서비스 외에 스마트폰 앱을 제공한다는 점이다. 애플 iOS용으로 출시된 소라 앱은 출시 직후 미국 앱스토어 다운로드 1위를 기록하며 긍정적인 반응을 얻었다. iOS용 소라는 어떤 모습인지 사용해 봤다.
물리 법칙과 소리를 구현한 소라 2
소라 2는 기존 모델의 한계를 뛰어넘는 몇 가지 기술 진보를 이뤘다. 눈에 띄는 변화는 물리 엔진의 고도화다. 소라 2는 중력, 마찰 등 현실 물리 법칙을 더 정확하게 이해하고 영상에 반영한다. 예를 들어, “농구공이 림(골대 가장자리)을 맞고 튀어나오는 장면”을 입력하면 공의 탄성과 회전, 림에 부딪히는 각도까지 계산된 듯한 자연스러운 움직임을 만든다. 초기 소라 모델이 때때로 보여주었던 어색한 물체의 움직임이나 비현실적인 상호작용은 상당 부분 개선됐다는 게 오픈AI 측 설명이다.
복잡한 동작 재현 능력도 향상됐다. 체조 동작, 패들보드 위에서의 백플립, 피겨 스케이팅의 트리플 악셀까지 자연스럽게 생성한다. 복잡한 명령에도 영상의 일관성을 유지한다.
동기화된 오디오 생성 기능 추가는 소라 2의 변화 중 하나로 꼽힌다. 과거 소라는 소리 없는 영상을 만들었다면 소라 2는 영상의 내용과 분위기에 맞는 대사, 효과음, 배경음악 등을 자동으로 만든다. 사용자가 프롬프트에 [대화(dialogue)], [효과(sfx)] 등 지시어를 포함하면 인물의 입 모양에 맞춰 대사를 생성하고 장면에 어울리는 효과음을 입히는 식이다. 스타일 선택의 폭도 넓다. 사실적인 실사 영상부터 영화 같은 연출, 애니메이션 스타일까지 다양하게 구현 가능하다.
두 기능의 추가로 영상 콘텐츠의 몰입감을 높여줄 것으로 예상된다. 향후 발전 방향에 따라 ‘멀티미디어 콘텐츠 제작’ 도구로 진화할 가능성이 높다. 오픈AI는 소라 2를 ‘비디오 분야의 GPT-3.5’로 평가했다. 챗GPT가 대화형 인공지능 시장의 혁신을 가져온 것처럼 소라 2도 영상 생성 분야에서 획기적인 변화를 이끌 것이라는 자신감이 반영된 표현이다.
iOS용 앱은 영상 제작보다 소셜 플랫폼에 가까워
애플 iOS용 소라 앱은 전문적인 영상 편집 기술이 없는 일반인도 쉽게 고품질 영상을 만들 수 있도록 소셜 미디어의 피드 형식 인터페이스와 카메오(Cameo), 리믹스(Remix) 등 영상 생성 기능을 담았다.
먼저 카메오 기능은 사용자의 얼굴이나 특정 인물의 모습을 영상 속에 반영한다. 자신의 얼굴을 스캔해 등록하면 문자 입력만으로 내가 주인공인 영화 예고편이나 애니메이션을 만든다. 오픈AI는 사용자 초상권 보호를 위해 동의 기반의 안전장치를 마련했다고 언급했다. 카메오 사용을 위해 타 사용자를 선택하면 초안이 공유된다는 메시지가 출력된다.
소라 앱은 틱톡, 인스타그램 릴스 등 숏폼 비디오 피드와 유사한 소셜 플랫폼 느낌을 준다. 소라 앱을 실행하는 창작자들의 영상이 출력되고 위, 아래 스크롤로 다른 영상 재생이 가능하다. 내가 생성한 영상은 피드에 공유된다. 이 외에 오픈AI는 사용자 활동, 위치, 게시물 참여, 챗GPT 대화기록 등을 파악해 게시물을 추천한다. 마치 영상 알고리즘 생성 구조와 같은데 자칫 특정 영상만 재생될 가능성이 높다. 이 부분은 앱의 ‘탐색에 개인 맞춤 설정 사용하기’를 비활성화하면 된다.
리믹스와 협업 기능은 다른 사용자가 만든 영상이나 앱 내에서 유행하는 영상을 자신만의 스타일로 다시 생성해준다. 여러 사용자가 함께 영상 프로젝트를 진행하는 협업 기능도 지원해 창작 잠재력을 넓혔다.
테스트를 위해 사람이 물 위를 걷는 영상을 하나 생성했다. 애니메이션 풍 생성과 동작에 대한 설정을 문자로 정리해 입력하니 영상 생성 과정으로 전환된다. 해당 영상 생성에는 약 1분 가량이 소요됐다. 영상 생성이 마무리되면 피드에 게재할 것인지 묻는다.
스마트 기기 앱의 한계 때문인지 영상 품질은 선명하지 않다. 무료 사용자들이 쓰는 480p 수준의 영상 품질에 가깝다. 영상 길이도 짧다. 소라 2는 최대 20초 내외의 짧은 영상만 생성 가능하다. 짧은 클립이나 소셜 미디어용 콘텐츠 제작에는 유용하지만, 서사를 담은 긴 영상을 만들기에는 아쉬운 부분이다.
