7억 방문자 관심사 정밀분석… 야후 “빅 데이터 제공합니다”

  • 동아일보
  • 입력 2012년 2월 14일 03시 00분


‘뉴욕’에 있는 ‘18~24’세 ‘여성’들이 가장 많이 본 ‘패션’ 관련 뉴스는?

팝의 여왕 휘트니 휴스턴의 갑작스러운 사망으로 미국이 슬픔에 빠졌다. 그래서일까. 미국 동남부에서 가장 큰 도시 가운데 하나인 애틀랜타에 사는 여성들이 13일 오후 3시 56분(한국 시간) 기준으로 지난 24시간 동안 가장 많이 읽은 연예 뉴스는 휴스턴과 그녀의 전 남편 보비 브라운 사이에서 태어난 딸인 보비 크리스티나(19)의 퇴원 소식이었다.

애틀랜타 시민은 관련 뉴스를 24시간 동안 4085만9714회 클릭했다. 여성(59%)이 남성(41%)보다 더 많이 읽었다. 연령대로 보면 55세 이상의 애틀랜타 여성이 이 뉴스를 600만 회 이상 읽으며 가장 큰 관심을 보였다. 이런 결과를 분석하면 미국 정치인들은 애틀랜타 지역에서 크리스티나같이 부모를 잃은 청소년을 위한 복지정책을 공약으로 내세워 중년 이후 여성들의 표심을 사로잡겠다는 계획을 세울 수 있다.

야후가 12일 공개한 ‘코어 데이터 시각화 서비스’(visualize.yahoo.com/core)를 통해 이런 분석과 활용이 가능해졌다. 이번 서비스는 사람들이 인터넷과 모바일에서 수많은 행위를 할 때 생기는 엄청난 양의 데이터를 뜻하는 ‘빅 데이터’를 분석해 나온 것이다. 야후는 창업자인 제리 양을 떠나보낸 뒤 첫 승부수로 빅 데이터를 꺼내들었다.

○ 빅 데이터로 변신한 야후

이번 서비스는 전 세계 7억 명의 야후 이용자가 각각 첫 화면에서 어떤 뉴스를 선택했는지를 ‘하둡’이라는 빅 데이터 분석 기술로 정리한 뒤 성별 연령별 시간대별 지역별로 실시간으로 보여주는 서비스다. 예전 같으면 정보기술(IT) 전문가나 관심을 가졌을 빅 데이터 기술을 통해 이제 일반인들을 대상으로 한 서비스를 제공하는 시대가 온 것이다.

이 서비스로 전 세계인의 관심사를 관통하는 최신 트렌드를 언제 어디서든 손쉽게 볼 수 있어 금융 동향이나 마케팅 자료, 정치 현장의 기초 자료 등으로 활용할 수 있다. 예를 들어 ‘뉴욕에 있는 18∼24세 여성이 가장 관심 있게 본 패션 관련 뉴스’라거나 ‘정치의 도시인 워싱턴에서 45∼54세 남성이 가장 많이 본 정치 뉴스’가 시간대별로 어떻게 변하는지 생생하게 볼 수 있다. 야후는 현재 애틀랜타, 클리블랜드, 샌프란시스코 베이 지역 등 미국 3개 지역을 대상으로 시범 서비스를 하고 있다. 조만간 미국 전역과 한국 등 전 세계로 서비스 범위를 넓힐 계획이다. 아직은 크롬, 사파리, 인터넷 익스플로러8과 9 등의 브라우저를 통해서만 볼 수 있다.

빅 데이터를 내세운 야후의 이번 변신은 온라인 결제 전문업체 ‘페이팔’의 수장이면서 데이터 분석 전문가인 스콧 톰슨이 새로 최고경영자(CEO)를 맡으며 예견됐다. 그는 취임 직후 가진 전화회의(콘퍼런스 콜)에서 “야후를 성장시킬 구체적인 방안을 내놓는 것은 아직 이르지만 7억 명이나 방문하는 야후의 데이터를 잘 분석한다면 답이 나올 수 있을 것”이라고 견해를 밝힌 바 있다. 새로 내놓을 서비스가 빅 데이터 분석 기술을 이용할 것임을 내비친 것이다.

○ 빅 데이터 민심의 시대


서비스가 정교해지면 더욱 미시적인 트렌드도 분석할 수 있게 된다. 야후코리아 관계자는 “여성들이 많이 클릭한 스포츠뉴스 결과를 종합했을 때 여성들은 단순한 경기 결과보다 선수의 인간적인 면모에 초점을 맞춘 기사를 흥미롭게 여긴다는 수준까지 분석할 수 있다”고 말했다. 이를 통해 기업이 인기 있는 선수를 활용해 마케팅 활동을 하거나 스포츠 구단이 선수를 트레이드하는 데 참고할 수도 있다. 누구나 마케팅 전문가, 리서치 전문가, 애널리스트 수준의 통찰력을 얻을 수 있는 시대가 온 것이다.

이런 서비스에서 분석한 결과를 정치 분야에선 실시간으로 바뀌는 ‘빅 데이터 민심’을 읽는 데 쓸 수 있다. 국내 홍보기업인 미디컴의 문경호 본부장은 “빅 데이터를 제대로 분석해 국민이 가장 원하는 것을 정확하게 읽어낸 뒤 공약을 만드는 데 참고하면 선거에서 승리하는 데 큰 도움이 될 것”이라고 말했다.

정진욱 기자 coolj@donga.com  
:: 하둡(Hadoop) ::


무질서하게 떠도는 각종 데이터에서 의미 있는 정보를 추출해 해석하는 빅데이터 분석·저장 기술의 하나. 예를 들면 서울 도봉구에 사는 한 누리꾼이 어떤 뉴스를 클릭하고, 뉴스에 어떤 댓글을 다는지를 분석해 해당 지역 주민의 정치적 성향을 파악하는 식으로 응용할 수 있다. 의료 분야에 적용하면 사람 개개인의 유전체 변이정보와 염기서열 등의 데이터를 분석해 첨단 신약 개발에도 활용할 수 있다. 구글의 안드로이드 운영체제(OS)처럼 누구나 가져다 쓸 수 있는 공개된 기술이며 야후가 2006년부터 ‘하둡 아파치 오픈소스 프로젝트’라는 이름으로 지원하고 있다.  
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스