“AI, 읽기 힘든 古典 한글로 번역 부탁해∼”

전채은 기자 입력 2021-01-27 03:00수정 2021-01-27 05:32
공유하기뉴스듣기프린트
공유하기 닫기
AI로 ‘승정원일기’ 번역해보니
디테일은 많이 떨어지지만 내용 맥락 파악하기엔 충분
일반인에 활용가치 높을 것
한국고전번역원(번역원)과 한국천문연구원(천문연)이 인공지능(AI)을 활용한 고전 번역 서비스를 선보였다. 고전 자동번역 서비스는 승정원일기 모델과 천문 고전 모델 두 가지로 나뉘어 공개됐다. 우리나라에서 한문으로 쓰인 국내 고전 번역에 AI 기술을 활용한 건 이번이 처음이다.

우리 고전을 국문으로 번역하기 위해서는 실물에 적힌 원문을 컴퓨터로 옮기고, 이 원문에 문장부호(표점)를 표기하는 작업을 먼저 해야 한다. 원문 고전에는 고리점(마침표) 등 문장부호가 전혀 표시돼 있지 않아 전문 번역가가 표점을 찍는 작업만 완료해도 연구하기에 훨씬 수월해진다. 표점이 찍힌 텍스트를 국문으로 번역하면 비로소 국문 번역본이 나온다.

국내 최초로 AI 번역 기술을 개발하는 데 승정원일기가 활용된 이유는 우리 고전 중에서 비교적 번역 속도가 빠른 편에 속하기 때문이다. 조선시대 왕의 지시 내용을 기록한 승정원일기는 전체 3243권 중 약 30%가 국문으로 번역된 상태다. 나머지 70%가량은 표점 작업만 마친 채로 국사편찬위원회에서 운영하는 승정원일기 웹사이트에 공개돼 있다.

AI 번역기는 전문 번역가가 옮긴 30%의 데이터를 토대로 개발됐다. 승정원일기 웹사이트에 공개된 고전 원문을 자동 번역기에 넣으면 아직 번역되지 않은 70%의 내용을 미리 가늠해볼 수 있다. 승정원일기의 국문 번역본에 기반을 두고 개발한 기술이어서 조선왕조실록 등 원문이 공개된 다른 고전을 넣으면 번역 정확도가 다소 떨어진다.

주요기사
번역원이 AI 자동 번역 개발에 활용한 ‘말 뭉치’는 120만여 건에 이른다. 여기에 인명, 지명, 관직명 등 고유명사는 하나의 의미 있는 단어로 인식하지 않도록 따로 모아 학습시켰다. AI의 번역 결과가 승정원일기 초벌 번역으로 활용될 정도로 정확도는 높진 않지만 대학생이나 일반인이 맥락을 파악하는 데는 활용 가치가 높을 거라고 번역원은 내다봤다. 정영미 번역원 역사문헌번역실장은 “승정원일기는 다른 고전에 비하면 비슷한 내용이 동일한 문체로 반복되는 경향이 있어 AI 학습에 적합했다”고 설명했다. 14일 공개된 번역 서비스는 25일까지 1만7700여 명이 이용했다.

천문 고전 AI는 승정원일기의 데이터에 천문고전서 40여 권에서 뽑아낸 약 6만 건의 말 뭉치를 더해 개발했다. 서윤경 천문연 선임연구원은 “고전에 드러난 별자리와 기상 관측 결과, 관측기기 등을 활용해 2차로 연구를 진행해야 하는 입장에서는 엉성하더라도 초벌 번역으로 활용할 자동번역 서비스가 필요했다”고 말했다.

천문 고전 AI는 기상 현상, 관측기기 이름 등 고유명사를 수천 건 학습하도록 해 고(古)천문학자들이 연구하는 데 상당한 도움을 준다. 백한기 번역원 고전정보센터장은 “표점을 찍는 등 번역 기초 작업이 활발히 이뤄져야 자동번역 개발에도 속도가 난다”며 “아직 번역되지 않은 70%의 승정원일기도 번역하는 대로 AI 학습 데이터로 활용해 완성도를 높일 계획”이라고 말했다.

고전 자동번역 서비스는 번역원과 천문연 웹사이트, 또는 한국고전자동번역서비스 홈페이지에서 이용할 수 있다.

전채은 기자 chan2@donga.com
#고전#번역#승정원일기
0 개의 기사의견이 있습니다.댓글쓰기 Copyright ⓒ 동아일보 & donga.com
당신이 좋아할 만한 콘텐츠
기사 의견 0개의 기사의견이 있습니다.
동영상