[CAR&TECH]인공지능의 언어별 데이터 차이 경쟁력 격차로 이어지는 상황 막아야

  • 동아일보
  • 입력 2017년 1월 26일 03시 00분


코멘트

IT 현장에서

 4차 산업혁명 기술을 발전시키는 데 영어가 더 유리하다면 어떻게 해야 할까. 영어를 쓰는 프로그래머의 머리가 더 좋다는 얘기가 아니다. 영어 데이터의 차이가 기술력의 차이로 이어질 수 있다는 뜻이다.

 인공지능(AI) 분야에서 최근 각광받는 딥러닝 등 기계학습(머신러닝)의 성패는 데이터 확보에 달려 있다. 번역과 얼굴·음성 판독 등 분야에서 축적된 데이터를 활용한 기계학습 기술의 발전은 눈부신 수준이다.

 기계학습의 힘에 놀란 정보기술(IT) 업계는 ‘데이터’의 위력을 실감했고, 당장 돈이 되는 유료화에 급급하기보다는 데이터를 축적하는 활동이 필요함을 깨닫고 있다. 지난해 SK텔레콤이 내비게이션 ‘T맵’을 자사 가입자가 아닌 고객에게도 전면 무료로 공개한 조치에도 데이터 확보를 위해 많은 사람이 쓰게 하려는 목적이 숨어 있다.

 문제는 한국어 기반의 데이터가 영어 기반의 데이터보다 양과 질 모두에서 크게 밀린다는 점이다. 사용하는 인구의 수도 그렇고, 세계 공용어가 된 영어로 이뤄지는 활동의 다양함은 한국어에 비할 수준이 아니다. 같은 기술수준에서 출발했더라도 기계학습의 특성상 데이터가 많으면 향후 데이터가 많은 쪽의 기술발전이 더 빠르게 일어난다. 이런 차이는 영어를 기반으로 하는 글로벌 업체와 한국어를 기반으로 한 국내 IT업체의 기술수준 격차를 더 벌어지게 할 수 있다. 16일 미래창조과학부가 주최한 국제가전전시회(CES) 2017 정책간담회에서 방승찬 한국전자통신연구원(ETRI) 미래기술본부장도 “언어의 격차가 기술력의 격차로 나타날 수 있다”고 우려했다.

 아직은 한국어를 기반으로 한 시장에서 국내 업체가 우위를 가지고 있는 것은 사실이지만, 언제까지 이어질지는 알 수 없다. 격차가 나더라도 양적으로 일정 수준을 넘어서면 큰 차이가 없을 수도 있지만, 한국어 기반 데이터는 아직 크게 부족한 것이 사실이다. 법원 내 최고 IT 전문가로 꼽히는 강민구 부산지법원장은 “영어번역 기술이 발전할수록 영어는 다양한 언어를 연결하는 중간 매개체 역할도 하게 된다”며 “구글 등 영어를 기반으로 하는 회사의 주도권이 더 공고해질 것”이라고 주장했다.

 언어의 격차가 기술력과 경쟁력의 격차로 이어지는 상황을 막아야 국내 IT업계에 미래가 있지 않을까. 방 본부장은 “아직 주도권이 있을 때 한국업체들이 최대한 데이터를 확보해야 하고, 그것을 위해서는 한국어를 사용자들이 더 많이 새로운 IT를 쓰게 해야 한다”고 말했다. 세계무대를 목표로 창업할 수 있으면 가장 좋지만, 누구나 또 언제나 가능한 것은 아니다. IT업계와 정부의 관심이 필요한 시점이다.

김성규 기자 sunggyu@donga.com
#인공지능#aii#it
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스