[10·26 재보선/선거를 바꾼 SNS]<하>투표율과 상관관계

  • Array
  • 입력 2011년 10월 29일 03시 00분


코멘트

오후 2~5시 트윗 6만건 훌쩍 → 오후 7~8시 투표율 5.7%P 껑충

10·26 재·보선 당일 트위터를 통한 투표 독려가 활발할수록 투표율도 올라간 것이 데이터로 확인됐다. 동아일보와 데이터분석업체인 SAS코리아가 26일 오전 5시부터 오후 7시까지 매 시간 트위터의 투표 관련 글 집중도와 실제 시간대별 투표율을 분석한 결과다. 출근 전과 퇴근 전 시간대에 투표를 독려하는 트위터 글이 집중된 점에 비춰볼 때 오전 7∼9시와 오후 6∼8시 넥타이, 하이힐 부대의 투표 참여에 영향을 미친 것으로 분석된다.

○ 선거일 트위터 투표 독려 폭발

선거 당일 트위터에 투표를 독려한 글을 올리거나 리트윗(다시 트윗해 자신의 팔로어들에게 보내는 것), 멘션 등의 활동을 한 건수는 총 24만8772건이었다. ‘1 대 9 대 90’의 법칙(전체 온라인 이용자 1%가 글을 올리면 9%가 그 글을 편집하거나 댓글을 달아 반응하고 90%는 콘텐츠를 열람하는 것)에 따르면 224만여 명이 그 글을 봤다는 계산이 나온다.

선거기간에 하루 평균 나경원 후보와 박원순 후보를 언급한 트위터 총량이 각각 1만9230건, 1만7340건인 것과 비교하면 선거 당일 투표 독려 활동이 얼마나 왕성했는지를 가늠해볼 수 있다.

이 기간에 200명 이상의 커뮤니티를 형성한 ‘파워 트위터리안(twitterian·트위터 사용자)’ 59명의 선거 당일 활동을 살펴본 결과 박 후보 지지 성향을 보인 14명의 파워 트위터리안과 나 후보 계정이 활발하게 활동했다.

선거법상 선거 당일에는 특정 후보를 지지하는 글을 올리는 활동을 할 수 없고 특정 후보 지지 성향이 확실한 유명인의 투표 독려 활동을 금지하고 있기 때문에 선거 당일 활동하지 않은 파워 트위터리안이 많았다. 그만큼 일반 참여자들의 투표 독려가 활발했던 것으로 해석된다.

박 후보 진영으로 분류되는 파워 트위터리안 14명의 커뮤니티에서 선거 관련 활동을 한 건수는 11만3603건이었다. 서영석 전 서프라이즈 대표, 조국 서울대 교수, 이정희 민주노동당 대표 커뮤니티의 활동이 많았다. 나 후보 커뮤니티의 글은 3만7045건이었다. 단일 커뮤니티로는 나 후보가 가장 컸지만 전체 파워 트위터리안의 활동은 박 후보 진영이 3배 이상 많았다.

○ 오전 5∼7시 투표 독려활동 가장 왕성

시간대별로 보면 출근시간 전인 오전 5∼8시, 퇴근시간 전인 오후 2∼5시에 투표 독려 글이 집중됐다. 하루 중 투표 독려 글이 가장 많았던 시간대는 투표 시작시간인 오전 6시를 전후한 오전 5∼7시였다. 투표를 독려하는 글은 오전 5∼6시, 6∼7시에 각각 3만2767건, 3만1578건으로 하루 평균 시간당 1만5548건에 비해 두 배가량 높았다.

실제 오전 7∼9시와 9∼11시 투표율 상승폭은 각각 전 시간대비 8.8%포인트, 8,5%포인트로 상당히 큰 편이었다. 이날 오전 9시 투표율은 같은 시간 10.9%로 최종 투표율이 49.1%였던 4·27 경기 성남 분당을 국회의원 보궐선거의 동시간대 투표율(10.7%)보다 높았다.

투표 독려활동은 오전 10시부터 오후 1시까지 뚝 떨어졌다. 오전 10∼11시 5546건, 오전 11시∼낮 12시 5058건, 낮 12∼오후 1시 9078건에 그쳤다. 오후 1∼6시까지 실제 투표율은 매시간 2.5∼2.7%포인트로 적었다.

오후 1시를 지나면서 투표 독려 글은 크게 늘었고 오후 2∼5시가 피크였다. 이 시간대는 박 후보 측에서 한나라당 지지세가 강한 강남 3구의 투표율이 높아 걱정이 높아졌던 때였다. 트위터에는 ‘비상 상황이다’ ‘밀리고 있다’는 글들이 끊임없이 올라왔다. 오후 2∼3시, 3∼4시, 4∼5시는 각각 투표 독려 글이 2만1815건, 2만2219건, 2만1308건으로 높아졌다.

퇴근 이후인 오후 7∼8시의 투표율이 5.7%포인트로 하루 시간대 중 투표율 상승폭이 가장 높았다. 이는 오후 2∼5시 트위터의 투표 독려 글이 폭증했던 것과 무관치 않다는 것이 SAS 측의 분석이다.

동정민 기자 ditto@donga.com  
정세진 기자 mint4a@donga.com  
▼ [기고/구방본] ‘빅 데이터’시대… 사회관계망 분석으로 여론 파악 ▼


구방본 SAS코리아 솔루션서비스본부 부장 
구방본 SAS코리아 솔루션서비스본부 부장 
‘오피니언 마이닝’ ‘사회관계망 분석’이란 말은 여전히 일반인에게 낯설다. 하지만 온라인과 소셜네트워크서비스(SNS)에서 데이터가 폭발적으로 급증하는 이른바 ‘빅 데이터’의 시대에 이런 낯선 단어는 우리에게 새로운 기회를 준다. 해당 분야의 전문가가 아니더라도 데이터의 의미를 읽어내면 사안의 흐름을 파악하고 예측도 할 수 있기 때문이다.

SAS코리아가 동아일보와 함께 서울시장 보궐선거와 관련된 트위터의 여론을 분석하면서도 이런 사실은 입증됐다. 여론조사 기관은 이번 선거에서 두 후보가 박빙의 대결을 펼치면서 오차범위에 있다고 내다봤다. 하지만 트위터상의 데이터를 분석해보면 여론은 초반부터 선거 전날까지 박원순 후보에게 유리했다.

이번 작업은 기존의 SNS 분석과는 질적인 면에서 차이가 컸다. 기존 분석은 대부분 단순히 트위터에서 언급되는 후보 이름의 총량을 합하는 수준이었다. 한 걸음 더 나아간 분석도 단순히 글의 긍정과 부정을 파악했을 뿐이다. 하지만 이번 분석은 총량은 물론이고 신뢰도와 청렴도, 이미지 등 5가지 측면을 기준으로 사용자들이 각 후보에 대해 느끼는 감정까지 파악했다.

선거운동 기간에 형성된 각 후보의 커뮤니티 규모와 성향은 트위터 사용자 간의 관계를 밝혀내는 사회관계망 분석에서 드러났다. 나경원 후보가 트위터상에서 양적인 홍보에만 집중했다는 정치 전문가의 추론이 데이터로 입증된 것이다.

일부 선진국에서는 이미 이런 기법이 비즈니스 분야는 물론이고 여론분석 및 트렌드를 파악하는 데 응용되고 있다. 한국의 전문가 집단도 자신들의 오랜 경험에 데이터를 읽어내는 새로운 능력까지 갖춘다면 한 차원 높은 통찰력을 얻게 될 것이다.

구방본 SAS코리아 솔루션서비스본부 부장  
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스