세계적인 정보기술(IT) 시장조사업체인 가트너의 브라이언 프렌티스 부사장(사진)은 지난달 19일 동아일보와의 인터뷰에서 “유행처럼 데이터 수집에만 열을 올리면 결국 쓸모없는 데이터만 손안에 남을 것”이라며 “빅 데이터를 어떤 끈으로 꿰어 해석하느냐에 따라 전혀 다른 가치를 얻게 된다”고 말했다.
트위터나 페이스북에 올라오는 모든 대화를 수집한 뒤 선거의 방향을 예측하려고 해봐야 소용없다는 얘기였다. 그는 “빅 데이터라는 말이 처음 등장했을 때는 현재 기술이 처리하기 어려운 수준의 지나치게 많은 데이터라는 뜻으로 쓰이기도 했다”고 덧붙였다.
프렌티스 부사장은 “감정까지 헤아리는 감성분석(sentiment analysis)을 시도해야 정치인이나 기업 등 빅 데이터를 활용하려는 사람들이 실질적인 도움을 받을 수 있다”고 설명했다. 감성분석은 트위터나 페이스북에 올라오는 대화에서 사용되는 단어와 문장 구조 등을 분석해 사람들의 감정을 해석하는 기술이다.
예를 들어 트위터나 페이스북에 ‘일자리’라는 단어가 많이 등장했다는 사실만 파악한다면 이는 별로 쓸데가 없다. 있는 일자리를 나누라는 것인지, 월급을 별로 못 받는 값싼 일자리라도 많이만 만들면 된다는 것인지 알 수 없기 때문이다.
대신 ‘일자리’와 ‘좌절’ 등의 단어가 결합하는 비율이나 ‘일자리’와 ‘편의점’ 등의 단어가 결합하는 비율을 파악하고 해당 발언을 한 사람이 ‘대학’과 ‘미팅’ 등의 단어를 주로 쓴다는 사실까지 깨닫는다면 젊은 세대가 단기 아르바이트에 만족하지 못한다는 사실을 이끌어낼 수 있다.
흘러가버린 트위터의 수다들을 시간대별로 모아 수개월에 걸친 변화 추이를 비교해도 의미가 생긴다.
프렌티스 부사장은 “데이터를 얼마나 많이 수집하느냐보다 얼마나 빠르게 수집해 이용하고, 수집한 데이터의 가치를 오래 지속되도록 만드느냐가 중요하다”고 강조했다.
댓글 0