
정부의 디지털 뉴딜 정책으로 더욱 탄력을 받아 빠르게 성장하는 인공지능 산업분야에서 토대가 되는 게 데이터 레이블링(Data Labeling) 기술이다. 인공지능이 데이터를 판단하고 학습할 수 있도록 적절하게 가공하는 과정인 데이터 레이블링은 일반적인 상식을 뛰어넘는 데이터의 수량과 종류로 AI 기술 고도화에 있어 핵심요소로 손꼽힌다.
데이터 가공 전문 기업인 ㈜데이터메이커(대표이사 이에녹)는 최근 작년 한 해 동안 수행한 데이터 누적 수량을 공개했는데, 데이터메이커 플랫폼에서 비식별화 처리한 인물 안면 이미지는 약 2억 개의 객체로 한반도와 일본에 있는 모든 인구의 총합에 가까운 수량이다.
데이터 댐을 방불케 하는 방대한 양의 데이터 처리가 가능한 바탕에는 AI 전 처리 엔진과 고도화된 프로세스가 있다.
데이터메이커 오석일 이사는 “작업자 투입 전에 AI-assist 엔진으로 auto 라벨링을 수행하고 그 후에 작업자들이 간단한 수정 위주의 작업을 함으로써 하루 최대 10만 장의 이미지를 처리할 수 있다”며 “많은 양의 데이터 가공에 소요되는 일정을 최대한 효율적으로 관리하는 운영 프로세스도 중요하다”고 말했다.
박해식 동아닷컴 기자 pistols@donga.com