“감정까지 헤아려야 ‘빅데이터’ 분석 쓸모”

  • Array
  • 입력 2012년 2월 3일 03시 00분


코멘트

IT시장조사업체 가트너社 프렌티스 부사장 인터뷰

“그냥 수많은 데이터만 모아놓는다고 ‘빅 데이터’를 이용하는 게 아닙니다. 양이 아니라 질에 주목해야 해요. 빅 데이터는 의미를 찾아내야 가치가 생깁니다.”

인터넷과 스마트폰 등을 통해 만들어진 방대한 데이터를 분석해 활용하는 ‘빅 데이터 선거’가 올해 주요 선거를 앞둔 세계 각국 정치권의 화두로 떠오르고 있다.

▶본보 2일자 A1·4·5면 [2012 총선-대선은 ‘빅 데이터’ 선거]
A1면 ‘빅 데이터’ 선거 시대

A4면 정치인 트위터 영향력 1위 이정희, 2위 박원순…

A5면 전화-출구조사로 헤매던 민심읽기…

A5면 안철수, SNS 무대에선 ‘아날로그’


세계적인 정보기술(IT) 시장조사업체인 가트너의 브라이언 프렌티스 부사장(사진)은 지난달 19일 동아일보와의 인터뷰에서 “유행처럼 데이터 수집에만 열을 올리면 결국 쓸모없는 데이터만 손안에 남을 것”이라며 “빅 데이터를 어떤 끈으로 꿰어 해석하느냐에 따라 전혀 다른 가치를 얻게 된다”고 말했다.

트위터나 페이스북에 올라오는 모든 대화를 수집한 뒤 선거의 방향을 예측하려고 해봐야 소용없다는 얘기였다. 그는 “빅 데이터라는 말이 처음 등장했을 때는 현재 기술이 처리하기 어려운 수준의 지나치게 많은 데이터라는 뜻으로 쓰이기도 했다”고 덧붙였다.

프렌티스 부사장은 “감정까지 헤아리는 감성분석(sentiment analysis)을 시도해야 정치인이나 기업 등 빅 데이터를 활용하려는 사람들이 실질적인 도움을 받을 수 있다”고 설명했다. 감성분석은 트위터나 페이스북에 올라오는 대화에서 사용되는 단어와 문장 구조 등을 분석해 사람들의 감정을 해석하는 기술이다.

예를 들어 트위터나 페이스북에 ‘일자리’라는 단어가 많이 등장했다는 사실만 파악한다면 이는 별로 쓸데가 없다. 있는 일자리를 나누라는 것인지, 월급을 별로 못 받는 값싼 일자리라도 많이만 만들면 된다는 것인지 알 수 없기 때문이다.

대신 ‘일자리’와 ‘좌절’ 등의 단어가 결합하는 비율이나 ‘일자리’와 ‘편의점’ 등의 단어가 결합하는 비율을 파악하고 해당 발언을 한 사람이 ‘대학’과 ‘미팅’ 등의 단어를 주로 쓴다는 사실까지 깨닫는다면 젊은 세대가 단기 아르바이트에 만족하지 못한다는 사실을 이끌어낼 수 있다.

흘러가버린 트위터의 수다들을 시간대별로 모아 수개월에 걸친 변화 추이를 비교해도 의미가 생긴다.

프렌티스 부사장은 “데이터를 얼마나 많이 수집하느냐보다 얼마나 빠르게 수집해 이용하고, 수집한 데이터의 가치를 오래 지속되도록 만드느냐가 중요하다”고 강조했다.

김상훈 기자 sanhkim@donga.com
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스