데이터메이커 “자율주행 AI관련 1년간 수행 도로 이미지 이어붙이니 지구 한바퀴”

박해식 동아닷컴 기자 입력 2021-03-02 10:16수정 2021-03-02 10:25
공유하기뉴스듣기프린트
공유하기 닫기
SBS 신년특집 ‘세기의 대결! AI vs 인간’은 인공지능(AI)이 인간의 지능을 뛰어넘는 미래가 2045년에 도래할 것이라는 예측 하에 모창, 골프, 주식 등 각 분야의 전문가와 AI의 대결을 그렸다. AI가 어디까지 발전할 수 있을지 알아보는 기획의도로 제작해 5부작으로 방송한 해당 프로그램은 최고 시청률 7.4%를 기록하는 등 인공지능 산업 분야에 대한 관심이 매우 높다는 것을 보여줬다.

정부의 디지털 뉴딜 정책으로 더욱 탄력을 받아 빠르게 성장하는 인공지능 산업분야에서 토대가 되는 게 데이터 레이블링(Data Labeling) 기술이다. 인공지능이 데이터를 판단하고 학습할 수 있도록 적절하게 가공하는 과정인 데이터 레이블링은 일반적인 상식을 뛰어넘는 데이터의 수량과 종류로 AI 기술 고도화에 있어 핵심요소로 손꼽힌다.

데이터 가공 전문 기업인 ㈜데이터메이커(대표이사 이에녹)는 최근 작년 한 해 동안 수행한 데이터 누적 수량을 공개했는데, 데이터메이커 플랫폼에서 비식별화 처리한 인물 안면 이미지는 약 2억 개의 객체로 한반도와 일본에 있는 모든 인구의 총합에 가까운 수량이다.

이밖에도 자율주행 AI 개발을 위해 차량, 보행자, 차선 등을 라벨링한 거리는 약 5만km로 지구 둘레를 한바퀴 돌고도 1만km가 남는 거리이며, AI 음성 인식에 활용되는 가공 음성은 총 6000시간으로 뉴스 앵커가 하루 2시간씩 8년 내내 쉬지 않고 말하는 시간과 같다.

주요기사
데이터 댐을 방불케 하는 방대한 양의 데이터 처리가 가능한 바탕에는 AI 전 처리 엔진과 고도화된 프로세스가 있다.

데이터메이커 오석일 이사는 “작업자 투입 전에 AI-assist 엔진으로 auto 라벨링을 수행하고 그 후에 작업자들이 간단한 수정 위주의 작업을 함으로써 하루 최대 10만 장의 이미지를 처리할 수 있다”며 “많은 양의 데이터 가공에 소요되는 일정을 최대한 효율적으로 관리하는 운영 프로세스도 중요하다”고 말했다.

박해식 동아닷컴 기자 pistols@donga.com
오늘의 핫이슈
0 개의 기사의견이 있습니다.댓글쓰기 Copyright ⓒ 동아일보 & donga.com
당신이 좋아할 만한 콘텐츠
기사 의견 0개의 기사의견이 있습니다.
동영상