네이버웹툰이 시각장애인의 웹툰 감상을 돕는 인공지능(AI) 기술을 공개했다. 지금까지 웹툰은 시각장애인이 이용하기 어려운 콘텐츠에 속했지만 네이버웹툰 기술을 통해 향후 이미지형 콘텐츠 전반의 감상 문턱이 낮아질 것으로 기대된다.네이버웹툰은 5일 열린 정보 접근성 기술 및 노하우 공유 행사 ‘제10회 2022 널리 세미나: 현재를 넘어, 새로운 세상으로의 접근(Beyond Now, Access to the new world)’ 웨비나에서 AI 기술을 활용한 웹툰 대체 텍스트 제공 기술을 처음 공개했다.네이버웹툰은 완결 및 연재 중 회차 약 18만개에 웹툰 대체 텍스트를 적용해 내년 1월 배리어프리 웹툰 베타 서비스를 시작하고 이용자의 의견을 반영해 서비스를 보완해 나갈 예정이다. 배리어프리 웹툰 베타 서비스는 우선 한국어에만 적용되며 향후 서비스 언어를 점차 확대할 계획이다.그동안 네이버웹툰은 수천 개에 달하는 완결된 작품들과 매주 새롭게 추가되는 수백 개 회차의 이미지 정보를 빠르게 텍스트 정보로 변환시킬 수 있는 방법을 찾는 것에 집중했고, 1년여의 연구 끝에 ‘AI를 활용한 웹툰 대체 텍스트 자동 제공’ 기술을 개발했다.텍스트 정보를 청각 정보로 변환 시키는 과정은 스마트폰 운영체제(OS)에서 기본으로 제공하는 ‘보이스오버(VoiceOver)’나 ‘톡백(TalkBack)’ 기능을 통해 실행할 수 있다.웹툰 대체 텍스트 자동 제공은 크게 ▲컷 나누기 ▲대사 영역 추론 ▲대사 추출 ▲대사 순서 결정의 네 가지 단계를 거쳐 완성된다. 네이버웹툰이 활용한 기술은 ‘OCR(광학문자인식)’과 ‘웹툰 오브젝트 디텍션(Webtoon Object Detection)’ 기술이다.웹툰은 대부분 세로로 긴 스크롤 방식으로 제공되기 때문에 한 회차의 이미지 크기가 굉장히 크다. 따라서 대사 영역을 추론하고 텍스트를 추출하는 과정에 앞서 컷 나누기 작업이 반드시 선행되어야 한다. 특히 이 과정에서 대사, 말풍선, 컷 라인이 훼손되지 않게 컷을 잘 나눠야 이후 대사를 순서대로 나열할 수 있다. 네이버웹툰은 이를 해결하기 위해 컷, 말풍선, 대사 영역 등을 추론하는 웹툰 특화 객체 탐지 기술 ‘웹툰 오브젝트 디텍션’을 개발했다.컷 나누기 이후에는 웹툰 오브젝트 디텍션을 이용해 대사 영역을 추론한다. 말풍선의 순서를 명확하게 인식해야 하며, 말풍선과 말풍선 밖의 대사도 구별할 수 있어야 한다. 또한 건물 간판처럼 배경에 삽입된 텍스트가 대체 텍스트에 포함되면 스토리 전달을 방해할 수도 있다. 범용적인 OCR만으로는 서로 다른 말풍선과 컷의 단어를 하나의 문장으로 인식하는 경우가 발생한다. 네이버웹툰은 웹툰 오브젝트 디텍션으로 대사 영역을 먼저 추론하는 작업을 진행해 이 같은 오류를 줄였다.웹툰 오브젝트 디텍션을 통해 추론한 대사 영역의 OCR 결과로 텍스트를 추출하고 추론한 말풍선과 컷의 위치 정보를 활용해 대사 순서를 결정하는 과정을 거치면 웹툰 대체 텍스트가 완성된다.네이버웹툰은 대사를 누가 했는지 알 수 있는 화자 추론 기능과 대사가 없는 컷에도 대체 텍스트를 제공하는 기능을 개발하는 것을 장기적인 목표로 삼고 있다.박준현 네이버웹툰 AI 연구원은 “현재 버전의 대체 텍스트 자동 생성 기술은 아직 초기 단계로, 스토리 전달을 완벽하게 할 수 있는 대체 텍스트를 만들기 위해 계속 도전하고 연구를 진행할 것”이라고 말했다.김대식 네이버웹툰 AI 리드는 “대체 텍스트 제공은 네이버웹툰이 중요하게 생각하는 ‘다양성’이라는 가치를 지키기 위한 기술적 노력의 일환”이라며 “네이버웹툰은 장애나 언어 등의 장벽 없이 누구나 웹툰을 창작하고 감상할 수 있는 환경 구축을 위해 글로벌 1위 스토리테크 플랫폼으로서의 책임과 노력을 다하겠다”라고 밝혔다.[서울=뉴시스]