뉴스 트렌드 생활정보 International edition 매체

배우 권상우 음성으로 도착한 서울패션위크 초대장[스테파니]

입력 | 2022-10-10 14:03:00

인공지능과 메타버스의 결합, AI 음성 합성 스타트업 ‘로보(LOVO)’의 이승건 대표 인터뷰






안녕하세요. 동아일보 스타트업 분야 데스크를 맡고 있는 김선미 기자입니다. 
스테파니(‘스’타트업과 ‘테’크놀로지를 ‘파’헤쳐보‘니’)를 통해 이번 서울패션위크의 음성 초대장을 소개해 드리려고 합니다. 

서울패션위크는 11~15일 서울 동대문디자인플라자(DDP)에서 3년 만에 100% 현장 패션쇼로 열리게 되는데요. 서울시는 인공지능(AI) 음성합성 스타트업 로보(LOVO)에 의뢰해 음성 초대장을 만들어 신청자 중 추첨으로 선정된 1500명에게 발송했습니다. 음성이 담긴 초대장은 전 세계 패션위크 중 최초의 시도라고 합니다. 
제가 7일에 받은 음성 초대장을 들어보실래요? 휴대전화 문자 메시지에 다음과 같은 음성 초대 링크가 붙어 있었습니다. 

“안녕하세요. 권상우입니다. 패션을 사랑하는 김선미 님을 동대문디자인플라자에서 열리는 서울패션위크에 초대합니다. 10월11일 오후 2시30분에 데무 박춘무 쇼에서 만나요.”




이 음성 초대장을 제작한 로보의 이승건 대표(32)를 서울 강남구 로보 사무실에서 만나봤습니다.

5일 서울 강남구 로보 사무실에서 만난 이승건 로보 대표. 안철민 기자 acm08@donga.com



―1500명에게 전하는 개별 음성 초대장을 일일이 녹음했나.
“아니다. 권상우 씨는 스튜디오에서 약 10분 간 50개 문장을 읽었을 뿐이다. AI를 학습시켜 권상우 씨의 목소리로 각 신청자의 초대 메시지를 만들었다.”

―어떤 50개의 문장을 읽었나.
“기업 비밀이어서 밝힐 수는 없다. 최고의 AI 음성을 추출하기 위해 한국어의 모든 음소를 커버할 수 있는 대본과 기술을 만들었다.”     

로보는 2016년 한국에서 시작한 후 2019년 미국 법인을 세웠습니다. 미국 UC버클리대 동문 두 명이 만든 스타트업으로, 창업 초기 모델은 목소리 내에서 감정을 분석하는 음성 인식이었습니다. 하지만 아무리 멋진 기술이 있어도 시장이 원하는 서비스와 제품을 만들지 않으면 결국 무용지물이라는 것을 깨달았다고 합니다. ‘우리가 해결할 수 있는 문제는 무엇인가’ ‘우리가 잘 할 수 있는 것은 무엇인가’를 고민하며 수많은 시행착오를 통해 사람의 마음을 움직이는 목소리, 그리고 메타버스 세상의 목소리가 되겠다는 비전을 갖게 되었다고 합니다. 

―왜 계속 음성에 매달렸나.
“시각 위주의 세상에서 음성 시장은 커질 수밖에 없다고 판단했다. 자동차 내비게이션 같은 음성 안내에서 내가 듣고 싶은 목소리를 골라 들을 수 있다면 재밌겠다고 생각했다. 지난해 카카오엔터테인먼트 등으로부터 투자를 받았고 올해 1월 ‘보이스벌스’라는 이름의 음성 NFT(대체불가토큰) 8888개를 민팅(minting·발행)해 10분 만에 다 팔았다.”

―처음 투자를 받을 때 사업 모델은.
“연간 정액을 내고 온라인 소프트웨어에서 원하는 목소리를 골라 다운 받는 것이었다.”

―고객은 누구였나.
“해외와 국내의 비율이 8대 2, 기업과 개인 비율은 5대 5였다. 개인 고객 중에는 유튜버가 많았다. 메타버스에서 가상의 이미지를 골라 쓰면서 다양한 목소리에 대한 수요도 커졌다. 어린 아들에게 자신의 목소리로 동화책을 들려주고 싶은 아버지를 위해 자신의 음성을 NFT로 만드는 서비스도 하고 있다. 이 NFT를 구입하면 오디오북에 ‘나만의 음성’을 입힐 수 있다.”

―어떤 음성이 인기인가.
“신뢰감 주는 성인 남녀의 음성일 줄 알았는데 의외로 밝은 에너지가 넘치는 어린이의 음성이었다.” 

―목소리를 NFT로 만든다는 의미는.
“목소리로 만들어진 메시지나 콘텐츠 외에 목소리 그 자체가 자산으로서의 가치를 가지는 것이다. 목소리에 대한 소유권이 명확하고 투명하게 블록체인 기술 기반의 ‘스마트 계약’으로 보여지며 거래할 수 있는 시장이 생기는 것이다. ‘디지털 페르소나(디지털 인격)’의 완성은 목소리가 될 것이다.” 

―앞으로 계획은.
“목소리가 자산인 시대가 열렸다. 목소리의 특징에 따라 다양한 기업과 개인에게 판매할 수 있게 될 것이다. 실제 사람의 목소리 외에도 AI를 통해 무궁무진한 종류의 목소리가 만들어질 수 있다. 우리가 메타버스 세상에서 시각적 아바타나 캐릭터 스킨 등을 골라 선택하듯, 상황에 따라 개인의 디지털 자아를 대변할 목소리를 자유롭게 고를 수 있게 될 것이다. 고객이 원하는 목소리를 일정 기간 대여해주는 서비스도 시작하려고 한다.” 

―이번 서울패션위크 음성 초대장의 의미는.
“이번에 보낸 개별 음성 초대장을 2주 후 NFT로 민팅해 보낼 예정이다. 해외에서도 NFT를 패션 분야에 도입할 생각은 했으나, 단순하게 옷을 NFT 이미지로 만드는 데에서 멈췄다. 하지만 패션과 트렌드는 더 이상 옷이나 눈으로 보는 것에만 국한된 것이 아니다. K팝이 세계인의 귀를 뚫은 것처럼 우리도 ‘패션의 청각’을 가미해보자는 생각으로 작업했다.”

김선미 기자 kimsunmi@donga.com