IT 현장에서
4차 산업혁명 기술을 발전시키는 데 영어가 더 유리하다면 어떻게 해야 할까. 영어를 쓰는 프로그래머의 머리가 더 좋다는 얘기가 아니다. 영어 데이터의 차이가 기술력의 차이로 이어질 수 있다는 뜻이다.
인공지능(AI) 분야에서 최근 각광받는 딥러닝 등 기계학습(머신러닝)의 성패는 데이터 확보에 달려 있다. 번역과 얼굴·음성 판독 등 분야에서 축적된 데이터를 활용한 기계학습 기술의 발전은 눈부신 수준이다.
기계학습의 힘에 놀란 정보기술(IT) 업계는 ‘데이터’의 위력을 실감했고, 당장 돈이 되는 유료화에 급급하기보다는 데이터를 축적하는 활동이 필요함을 깨닫고 있다. 지난해 SK텔레콤이 내비게이션 ‘T맵’을 자사 가입자가 아닌 고객에게도 전면 무료로 공개한 조치에도 데이터 확보를 위해 많은 사람이 쓰게 하려는 목적이 숨어 있다.
아직은 한국어를 기반으로 한 시장에서 국내 업체가 우위를 가지고 있는 것은 사실이지만, 언제까지 이어질지는 알 수 없다. 격차가 나더라도 양적으로 일정 수준을 넘어서면 큰 차이가 없을 수도 있지만, 한국어 기반 데이터는 아직 크게 부족한 것이 사실이다. 법원 내 최고 IT 전문가로 꼽히는 강민구 부산지법원장은 “영어번역 기술이 발전할수록 영어는 다양한 언어를 연결하는 중간 매개체 역할도 하게 된다”며 “구글 등 영어를 기반으로 하는 회사의 주도권이 더 공고해질 것”이라고 주장했다.
언어의 격차가 기술력과 경쟁력의 격차로 이어지는 상황을 막아야 국내 IT업계에 미래가 있지 않을까. 방 본부장은 “아직 주도권이 있을 때 한국업체들이 최대한 데이터를 확보해야 하고, 그것을 위해서는 한국어를 사용자들이 더 많이 새로운 IT를 쓰게 해야 한다”고 말했다. 세계무대를 목표로 창업할 수 있으면 가장 좋지만, 누구나 또 언제나 가능한 것은 아니다. IT업계와 정부의 관심이 필요한 시점이다.
김성규 기자 sunggyu@donga.com