“통역기로 스포츠 중계 10년내 가능”

  • 동아일보
  • 입력 2016년 10월 7일 03시 00분


코멘트

국내서 최근 선보인 앱 ‘지니톡’… 짧은 말 영어로 줄줄 “구글보다 정확”
IBM, 한국어 기반 ‘왓슨’ 개발 중… 콜센터 보조-의료서비스 활용 전망
영어공부 필요없을 때 우리말 미래… 빅데이터 부족으로 위기 올 수도

기계가 한글을 읽고 한국어를 말하는 시대에 우리말글의 미래는 어떻게 될까. 예홍진 아주대 사이버보안학과 교수는 “한국어 처리 기술이 발전하면 실시간으로 인터넷이나 소셜네트워크서비스(SNS)의 의견을 통계적으로 수렴할 수도 있을 것”이라고 말했다. 사진은 국립한글박물관의 지난해 기획 전시 ‘디지털 세상의 새 이름_코드명 D55C AE00’. 최혁중 기자 sajinman@donga.com
기계가 한글을 읽고 한국어를 말하는 시대에 우리말글의 미래는 어떻게 될까. 예홍진 아주대 사이버보안학과 교수는 “한국어 처리 기술이 발전하면 실시간으로 인터넷이나 소셜네트워크서비스(SNS)의 의견을 통계적으로 수렴할 수도 있을 것”이라고 말했다. 사진은 국립한글박물관의 지난해 기획 전시 ‘디지털 세상의 새 이름_코드명 D55C AE00’. 최혁중 기자 sajinman@donga.com
《 “아리아, 9시에 알람 맞춰줘.” 늦게까지 좀체 잠들지 않던 기자의 다섯 살 아이는 최근 홈 비서 기기의 호칭인 아리아를 불러 명령을 내리고 그대로 알람이 울리면 신기한지 고분고분 잠자리에 든다. 아리아는 “음악을 틀어 달라”는 아내의 말도 잘 따른다. 일정, 날씨 등도 물으면 답한다. 하지만 일상 대화 중 “어려워…” 하면 자신을 부른 줄 알고 반응해 웃음을 자아내기도 한다. 》
 
 인공지능 기계가 한글과 한국어를 사람처럼 읽고 말하는 시대가 눈앞이다. 9일 한글날을 앞두고 디지털 시대 우리말과 글의 미래에 관해 전문가들에게 들어봤다.

 최근 주목되는 것 중 하나는 자동 통·번역 기술의 급격한 발전이다. 한국전자통신연구원(ETRI)과 한글과컴퓨터가 최근 선보인 통·번역 애플리케이션 ‘지니톡’은 대화하듯 말하면 이를 영어 등 외국어로 번역해준다. 길지 않은 문장은 별 오류가 없다. 구글 번역기보다 정확도가 뛰어나다는 분석도 있다. 허명수 한동대 국제어문학부 교수(한국번역학회장)는 “자동번역은 10년 안에 학술대회나 스포츠 중계의 동시통역도 가능한 수준이 될 것으로 본다”고 말했다.

 영어를 따로 공부할 필요가 없는 세상이 온다면 한국어의 미래도 밝은 것 아닐까 싶지만 꼭 그렇지만은 않다. ‘한국어가 사라진다면’의 저자인 시정곤 KAIST 교수는 “빅데이터 시대에는 데이터의 크기가 중요한데 한글, 한국어로 된 데이터는 영어 등 사용자가 많은 언어에 비해 정보의 양과 질이 비교가 안 된다”며 “우리말글로 된 데이터의 활용도가 떨어지면 디지털화가 가속화될수록 미래는 어두울 것”이라고 말했다.

 한국어를 기반으로 개발된 인공지능의 수준은 어느 정도일까. 전자통신연구원이 총괄해 만들고 있는 인공지능 ‘엑소브레인’은 2011년 퀴즈쇼에 출전해 우승했던 IBM의 인공지능 왓슨처럼 다음 달 사람과 퀴즈 대결을 벌일 예정이다. 지난해 정보통신기술진흥센터 조사에서는 우리의 음성인식·통번역 및 지식처리 기술 수준은 미국 대비 약 70% 수준으로 2년 반 정도 뒤처졌다는 결과가 나왔다.

 전문가들은 영어 등 외국어를 바탕으로 개발된 인공지능이 한국어 처리에 적용되는 것도 큰 장애가 아니라고 했다. 실제 IBM은 최근 SK㈜ C&C와 손잡고 왓슨을 한국어 인식과 처리가 가능하도록 개발 중이다. 왓슨은 한국에서 콜센터 업무 보조와 의료 서비스 등에 활용될 것으로 전망된다. 조성배 연세대 컴퓨터과학과 교수는 “약 20년 전에는 한글 인식과 한국어 정보 처리에 장벽이 있다고들 했고 국내 포털의 성장에는 언어장벽도 도움이 됐다”며 “그러나 최근의 인공지능 기술은 그런 장벽을 뛰어넘고 있다”고 했다.

  ‘한국어 자연어(일상어) 처리’ 연구 발전을 위해 공공기관이 한국어 문장 데이터베이스를 만들 필요가 있다는 의견도 나온다. 미국 펜실베이니아대가 공적자금으로 운영하는 LDC(Linguistic Data Consortium)는 20여 년 동안 영어 등 여러 언어의 문장 데이터를 대량으로 모아 이 분야 연구 자료의 표준으로 활용된다.

 서정연 서강대 교수(컴퓨터공학전공)는 “인공지능 구현의 과제는 대부분 자연어 처리”라며 “이런 연구 인프라 구축은 굉장히 오래 걸리고 비용도 많이 들어 개별 연구소로는 버겁다”고 말했다.
 
조종엽 기자 jjj@donga.com
#통역기#스포츠#인공지능
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스