양환정 과학기술정보통신부 정보통신정책실장
자율주행차, 인공지능 비서, 정밀의료 등 우리의 삶을 윤택하게 만드는 지능화 서비스는 대규모 데이터가 반드시 필요하다. 이러한 데이터는 인공지능이 학습할 수 있는 형태로 가공되어야 한다. 기업들이 인공지능 서비스를 만들 때 직면하는 문제는 대규모 데이터를 개별 기업 차원에서 구축하는 것이 현실적으로 어렵다는 점과 데이터를 구축한다 하더라도 인공지능이 학습할 수 있는 형태로 가공하는 데 많은 인력과 시간이 소요된다는 점이다.
실제로 인공지능 스피커, 챗봇, 인공지능 콜센터 등 인공지능 제품과 서비스를 만드는 스타트업과 중소·벤처기업들이 호소하는 어려움은 인공지능 학습용 데이터를 제대로 확보하기 어렵다는 것이다. 정부가 서둘러 여러 분야에서 활용할 수 있는 인공지능 학습용 데이터 구축에 나서려고 하는 이유이다.
과기정통부는 우선 인공지능 서비스 개발에 필수적으로 활용되는 범용 학습용 데이터셋(Data set)을 대규모로 구축하여 기업과 연구자들이 활용할 수 있도록 지원할 것이다. 산업 파급효과가 큰 헬스케어, 제조, 치안안전, 법률 등의 분야에서 활용가치가 높은 데이터셋을 우선 구축할 계획이다.
또한 중소기업들이 필요로 하는 데이터를 가공하는 데 들어가는 비용의 일부를 지원하는 사업도 내년부터 추진할 계획이다. 활용도가 높은 데이터는 직접 구축하고, 시장의 수요가 큰 데이터 가공에는 비용을 지원하여 데이터 산업을 진흥할 것이다. 이렇게 함으로써 4차 산업혁명 시대에 부합하는 혁신성장과 일자리 창출에도 큰 도움이 될 것으로 기대한다.