동아일보 IT사이언스팀 기자들이 IT, 과학, 우주, 바이오 분야 주목할만한 기술과 트렌드, 기업을 소개합니다. “이 회사 뭐길래?” 기술로 세상을 바꾸는 테크 기업들의 비하인드 스토리! 세상을 놀라게 한 아이디어부터 창업자의 요즘 고민까지, 궁금했던 그들의 모든 것을 파헤칩니다.
성우 없이 AI 더빙… ‘K콘텐츠’ 돌파구로
국내선 크게 흥행한 인기 드라마를 미국 유럽 아시아 등 글로벌 시청자들에게 동시에 보여주려면 어떤 방법이 있을까? 배우 소지섭 임수정이 출연한 [미안하다, 사랑한다] 같은 작품을 예로 들어보자.
현재로선 넷플릭스와 같은 해외 OTT(온라인동영상서비스) 플랫폼이 유일한 답이다. 한국 방송사나 제작사들이 넷플릭스 등 해외 플랫폼과 손잡지 않고서는 전세계 시장에 작품을 대규모 유통시키긴 어려운 구조다. 넷플릭스가 제작한 ‘케이팝 데몬 헌터스’와 같은 작품이 글로벌 흥행을 기록하며 K 콘텐츠 열풍이 뜨겁지만, 오히려 해외 OTT 의존도는 더욱 높아지고 있는 것이 현실이다.
또 하나의 걸림돌이 한국어라는 언어 장벽이다. 미국 유럽 중동 등에서 인기 ‘K드라마’에 대한 ‘더빙’ 요청이 들어오는 것도 이 같은 언어 장벽이 자막으로는 해소되지 않기 때문이다. 현지인 목소리로 더빙하면 자막 대비 30배 이상의 시청 효과를 낸다. 자막 문화가 정착된 국내와 달리 해외에선 더빙판을 선호한다. 한국의 ‘오징어게임’과 스페인의 ‘종이의집’ 등이 더빙의 힘으로 글로벌 흥행에 성공한 대표적 사례다.
문제는 언제나 그렇듯 ‘자본’이다. 그간 성우가 직접 해온 ‘더빙’은 제작비가 너무 많이 들어 국내 방송사나 제작사들이 꺼리던 영역이었다. 더빙판을 만들면 만들수록 적자가 나기 때문이었다.
이처럼 소자본으로는 엄두도 내지 못했던 ‘더빙’ 제작이 터닝포인트를 맞은 것은 인공지능(AI) 더빙 기술이 등장하면서다.
비용과 제작 시간을 획기적으로 낮춰주는 ‘AI 더빙’은 성우를 쓰지 않아도 영상 속 출연자 목소리를 그대로 본따 전세계 각국 언어로 바꿔준다. 말하는 입 모양까지 자연스럽게 구현하는 것이 핵심이다. 교육용 콘텐츠와 같이 정보 전달 성격의 영상보다, 난이도가 높은 드라마는 AI 더빙으로 출연자들의 다양한 ‘감정’들을 어색하지 않게 전달하는 수준까지 올라왔다.
음색 억양 재현부터 입술 모양 ‘립싱크’까지 AI로
정부가 K-콘텐츠 경쟁력 확보를 위해 AI 더빙 기술을 핵심 무기로 내세우는 것도 이때문이다. 과학기술정보통신부는 올해 80억 원의 추경 예산을 편성해 AI 기술을 활용한 더빙을 지원하고 있다. AI 더빙 기술로 드라마, 케이팝, 영화, 예능 등 장르별 특성에 적합하게 발화자의 음색, 억양 등 비언어적 표현까지 정교하게 재현하는 것이다.
AI 더빙 특화 지원 사업 주관사로 선정된 이스트소프트는 AI 더빙 플랫폼 ‘페르소닷에이아이’의 기술을 통해 드라마 ‘미안하다 사랑한다’와 예능 프로그램 ‘나는 솔로’ 등 200시간 분량의 K-콘텐츠 현지화 작업을 진행 중이다.
페르소닷에이아이는 텍스트 입력만으로 110개 언어 음성을 만들어 낼 수 있는 ‘AISaaS’(서비스형 소프트웨어)를 제공한다. 발화자의 음색과 억양은 물론 비언어적 표현까지 정교하게 구현해 몰입감을 높이는 것이 특징이다.
정상원 이스트소프트 대표는 “넷플릭스도 아직은 AI 더빙 자동화를 하지 않고, 성우를 통해 더빙 작업을 하고있다”며 “격하고 섬세한 감정 표현이 많은 드라마 장르는 AI 더빙으로 정말 자연스럽게 만드는 기술 난이도가 높기 때문에 이제 본격화되는 단계”라고 설명했다.
AI더빙은 원본 작품에서 각 목소리를 분리해 텍스트로 변환하고, 다시 TTS(Text-to-Speech) 기술을 통해 텍스트를 자연스러운 음성으로 바꾼다. 출연자의 음색을 맞추는 보이스클로닝( Voice Cloning)을 통해 일관성을 유지하고, 화면상 입모양과 맞추는 복잡한 작업을 거친다. 각 작업 구간마다 각각 다른 AI 엔진을 사용하는데, 이 과정에서 가장 복잡한 고난도 기술은 완벽한 립싱크 구현이다. 한국어 발음 특성에 최적화된 AI로 자연스러운 입술 동기화를 실현해야 하기 때문이다.
정 대표는 “드라마를 AI 더빙으로 100% 자동화하려면 상당한 기술 투자가 들어가야 한다”며 “K컨텐츠를 전세계에 유통시킬 수 있는 요즘과 같이 중요한 시기에 정부가 국가사업으로 마중물 역할을 해줬다. 정부 지원 이후 국내외 방송사들에서 장편이나 다큐멘터리도 AI더빙을 할 수 있는지 문의가 많이 들어오고 있다”고 강조했다.
넷플릭스 유튜브도 ‘AI더빙’ 적극 투자
국내 유튜버들이 세계 시장에 진출하는 기회가 되기도 한다. 한국어로 제작된 유튜브 영상을 AI더빙을 통해 영어 중국어 일본어 스페인어 등 다양한 언어로 쉽게 변환할 수있기 때문이다. 테크몽, 하이유, 큰별쌤 등의 유명 유튜버들이 이스트소프트의 AI 더빙 기술로 한국어 영상을 영어 일본어 등 버전 등으로 제작해 내보내고 있다. 정 대표는 “각국 현지화에 성공한 넷플릭스는 콘텐츠 제작에 한해 15조 원 정도를 사용하는데, 그중에서 더빙에 쓰는 비용이 4조 5000억 원이나 됐다”며 “넷플릭스의 콘텐츠 제작 비용 중에서 30%가 현지화 비용으로 들어가는 부분이 인상적이었다”고 했다.
넷플릭스 역시 최근 콘텐츠 글로벌 경쟁력을 높이기 위해 더빙 시스템을 전면 개편했다. 오리지널콘텐츠 제작 시 최대 30개국 언어로 더빙을 지원하고, 일반 작품도 평균적으로 10개 언어 더빙판을 구비한다는 계획이다. 시청자들이 처음부터 콘텐츠가 자국어로 만들어진 것처럼 느끼도록 한다는 것이다. 넷플릭스는 AI 기반 더빙 기술에도 투자하고 있으며, 연간 투자 증가율이 25~35%에 달한다.
다른 글로벌 미디어 플랫폼들도 AI 더빙에 적극적이다. 유튜브는 지난해 구글의 AI 모델 ‘제미나이’를 기반으로 한 콘텐츠 자동 번역 및 더빙 기능을 추가했다. 더빙된 언어에 맞춰 유튜버의 입술 모양을 동기화하는 ‘더빙 AI’도 선보였다. 시장조사업체 마켓앤어스는 전 세계 AI 더빙 도구 시장이 2023년 7억9430만 달러(약 1조1089억원)에서 2033년 29억1890만달러(4조750억 원)까지 커질 것으로 전망했다.
댓글 0