뉴스 트렌드 생활정보 International edition 매체

[토요이슈]검색량 앞서던 文, 4월 들어 安에 역전당해… 18일 다시 추월

입력 | 2017-04-29 03:00:00

구글트렌드로 본 대선 민심




서울 서대문구에서만 크고 작은 선거를 20여 차례 치른 우상호 더불어민주당(민주당) 원내대표는 평소 기자들에게 “정치인의 손바닥 촉감이 바로 정치 풍향계”라고 말하곤 한다. 유권자들과 악수할 때 느끼는 손아귀 힘과 미세한 표정 등으로 대략적인 승부는 물론이고 나아가 전국 판세까지 예측할 수 있다는 얘기다. 또 은평구에서 5선을 기록한 이재오 전 의원의 비장의 무기는 ‘자전거 발품’이었다. 부지런히 페달을 밟는 뒷모습을 주민들에게 자주 내비치면 이길 확률이 올라간다는 경험 때문이다.

이 두 가지 사례는 현실 정치에서의 선거 전략이 구체적 수치보다는 ‘감(感)’에 의존하고 있음을 보여준다. 이는 대통령 선거와 같은 전국 규모에서도 마찬가지였다. 첨예한 정치 이슈를 놓고 상대방과 각을 세우는 방식으로 큰 그림을 그린 뒤 세부적으로는 혈연·지연·학연 등을 총동원하는 고전적 인맥 전술로 선거를 치른 것이다.

그러나 21세기 인공지능(AI)이 주도하는 ‘4차 산업혁명’이 선거판의 주요 화두가 된 시점에서 ‘3김 시대’에나 쓰일 법한 기법이 승부의 열쇠라고 말하기는 상당히 쑥스럽다. 아직은 초보 단계이기는 하지만 소셜네트워크 등의 뉴미디어가 바람을 불어 넣고 선거공학자들이 판을 키운 ‘빅데이터 선거’가 바로 이번 ‘장미 대선’의 하나의 관전 포인트가 되고 있다. 29일 발매된 주간동아 1086호에선 10일 앞으로 다가온 제19대 대선 과정에서 활용되고 있는 ‘빅데이터 선거기법’에 대해 살펴봤다.



IT로 파악하는 민심(民心)?

지난해 지구촌 최고의 정치 이벤트는 영국의 유럽연합(EU) 탈퇴를 이끈 ‘브렉시트’ 투표와 도널드 트럼프 미국 대통령의 드라마틱한 역전극이었다. 두 선거 모두 전통적인 문답 방식의 여론조사에선 역전이 불가능하리라 예측됐던 승부를 뒤집었다.

이후에 밝혀진 흥미로운 뒷얘기도 있다. 키워드 검색 통계인 구글트렌드(trends.google.com) 분석에 따르면 두 가지 결과가 모두 예측 가능했다는 주장이 나온 것. 실제 구글트렌드는 미국 대선이 치러지기 전 3개월 동안 ‘트럼프’ 검색 횟수가 평균적으로 ‘힐러리’ 검색 횟수보다 크게 앞섰다.

최근 국내 여러 기관에서도 소셜네트워크서비스(SNS)와 포털뉴스 댓글 등을 활용해 이를 ‘빅데이터 지수’로 포장해 발표하기도 했다. 하지만 편차가 크고 뚜렷한 원칙이 없어 선거관리위원회가 조만간 제재에 나설 계획이다. 미국에서도 트럼프에 대한 부정적인 여론이 높아 구글트렌드 통계가 실제 선거 결과로 이어지리라 기대한 사람은 많지 않았다.

한국에서도 이 같은 현상은 엇비슷하게 반복된다. 현재 구글트렌드 통계로 더불어민주당 문재인 후보와 국민의당 안철수 후보 관련 검색 결과는 4월 3일 이전까지는 문 후보가 앞서다 안 후보가 역전했다. 그리고 다시 18일에 뒤집힌 것으로 나온다. 여론조사에서 드러난 추이와 비슷한 흐름이다. 하지만 구글 사용자가 적어 어느 정도 믿어야 할지는 알 수 없다.

실제 2012년 대선이나 지난해 총선에서도 ‘빅데이터 활용’에 대한 이견이 있었다. SNS 데이터가 특정 세대와 특정 정치 성향에 한정됐다는 목소리가 높았던 것. 민경배 경희사이버대 교수는 “국내 SNS가 워낙 편향성이 커서 의미 있는 정보 추출이 어렵고 굳이 빅데이터 없이도 지역별, 이슈별, 세대별 유불리를 판단할 수 있어 정당의 관심이 그리 많지 않았다”고 설명한다.



“유권자 정보가 바로 승부의 키”

빠르게 발전하는 빅데이터 활용의 의미를 따라잡기 위해서는 미국 사례를 참고할 필요가 있다. 100년 넘게 강고한 양당 체제를 구축해 온 공화당과 민주당은 주로 부동층을 공략하기 위한 선거 전략 수립에 초점을 맞춰 왔다. 이를 위해 두 당은 수십 년간 쌓인 선거데이터를 적극적으로 활용하고 여기에 유통사 통신사 등이 확보한 최신 소비·경제 데이터까지 더한 ‘빅데이터 전략’을 실전에 투입한다.

특히 지난해 두 번의 선거 참여에서 실질적 성과를 거둔 미국계 빅데이터 회사 ‘케임브리지 아날리티카’가 대표적이다.

이 회사는 브렉시트 투표에서는 EU 탈퇴 측, 미국 대선에서는 트럼프 후보 측의 의뢰를 받아 빅데이터에 바탕을 둔 선거 전략을 제시한 것으로 유명해졌다. 특히 미국 대선에선 2억2000만 명의 유권자에 관한 5000여 가지 다른 데이터를 모두 취합해 일종의 유권자 심리 지형도를 만들었다. 트럼프는 이 회사의 핵심 인재를 캠프의 ‘수석 데이터 과학자’로 임명해 열세 지역 반전에 활용했다. 즉 빅데이터 전략은 유권자의 내밀한 심리를 파고들어 전세를 뒤바꾸는 비장의 무기로 쓰일 수 있다는 얘기다.

2012년 미국 버락 오바마의 정보기술(IT) 선거 전략을 분석한 책 ‘빅데이터 승리의 과학’을 펴낸 고한석 민주연구원 부원장은 “선거 운동의 핵심이 소극적 지지자들을 투표장으로 이끌고 부동층을 설득하는 과정이라고 정의한다면 유권자에 대한 구체적 데이터가 많은 쪽이 유리한 게임”이라며 “국내 선거도 데이터(과학) 선거로 빠르게 이동할 것”이라고 전망한다.

그렇다면 우리 정당의 유권자 분석 수준은 어느 정도일까. 전문가들은 이건희 삼성그룹 회장의 1995년 베이징 발언을 인용하며 “우리나라 정치는 4류, 행정은 3류, 기업은 2류”라고 요약한다. 스윙 보터(정당에 구애받지 않는 유권자)나 부동층을 정밀하게 겨냥해 공략하는 선진 선거 기법과는 큰 격차를 보인다는 얘기다.

선거 때만 되면 지역구 정치인들은 유권자 정보 확보에 혈안이 된다. 조기축구회, 교회 신도, 각종 사회단체 등 지역구에서 모을 수 있는 연락처를 최대한 확보해 이들에 대한 접촉 빈도를 늘리는 것이 선거의 기본 전략 가운데 하나다. 그러나 이 같은 정보가 당 차원으로 결집되지 못하고 일회성에 그친다.

보다 심각한 사례는 당원 정보의 부실한 관리다. 당원 명부는 당권을 가늠할 수 있는 ‘옥새’ 역할을 해왔다. 이를 확보해 활용하는 세력이 당내 경선 등에서 크게 유리하기 때문. 하지만 정당의 역사가 짧고 각 세력 간의 이합집산이 빈번한 탓에 당원 명부는 그 자료가 보완되기는커녕 분실되기를 반복했다.

민주당의 경우 2014년 전당대회를 준비하는 과정에서 2012년도에 구축한 36만 명의 당원 명부가 사라진 것을 확인하고 내부 갈등에 휩싸인 것이 대표적 사례다. 또 2012년 새누리당에서는 200만 명에 달하는 당원 정보를 스팸 문자업체에 팔아 넘긴 일도 있었다.

선거 앞두고 펀드 모집한 까닭은?

그렇다고 이번 대선이 ‘색깔론’과 ‘적폐 이슈’가 지배하는 구시대 선거인 것만은 아니다. 승리를 위한 각 정당의 열망이 뜨겁기 때문에 과학적 선거에 대한 노력도 구석구석에서 찾아볼 수 있다. 상대적으로 준비를 많이 한 곳은 민주당이다. 길게는 9년, 적어도 2년 넘게 이번 대선을 준비한 덕분이다. 자유한국당도 당원 휴대전화와 카톡 중심의 IT 전략을 착실하게 운영한다는 평가.

지난해 총선에서 특히 민주당은 당 차원에서 격전지 20여 곳을 집중 분석해 선거에 활용함으로써 쏠쏠한 재미를 봤다. 해당 지역을 동과 통 단위로 쪼개 그 지역의 유권자를 ‘민주당 적극 지지자-소극 지지자-부동층-상대 당 소극 지지자-적극 지지자 등’으로 5단계로 세분해 공략을 시도한 것이다.

유권자의 성향이 지리정보와 결합되면 선거 기간 중 홍보물 발송이나 유세차량 배치, 후보의 유세 동선(動線) 운용에서 경쟁자에 비해 효과적인 성과를 거둘 수 있다. 극단적으로 경쟁자의 적극 지지자가 많은 지역은 선거운동을 포기하는 게 낫다는 마케팅의 기본 원리를 활용한 사실상 첫 번째 사례였다.

이번 대선에서도 민주당은 이와 유사한 정보를 선거 운동에 활용하고 있다는 후문이다. 이 같은 전략이 효과를 발휘했는지 22일 부산 서면 유세에 3만 명이 모이는 등 경쟁 후보보다 더 좋은 그림을 연출해 냈다.

유권자들의 정치 성향을 가늠할 핵심 정보 수집을 위한 경쟁도 가속화되고 있다. 민주당의 대표 사례가 ‘정치후원금’과 ‘문재인 펀드’ 그리고 ‘내가 대통령이라면―문자로 정책 제안’ 등이 꼽힌다. 정치 데이터에 이해가 부족한 사람이라면 선거를 앞두고 ‘펀드 모집’과 같은 번거로운 작업에 대해 고개를 갸우뚱할 수밖에 없다. 같은 금리라면 은행에서 빌려도 될 일이기 때문.

민주당의 한 관계자는 “데이터 정치의 핵심이 ‘문재인 펀드’에도 담겨 있다”며 “돈 1만 원이라도 빌려 준 핵심 지지자의 정보를 확보하는 일은 당으로서는 미래의 핵심 자산을 만드는 일”이라고 말한다.

휴대전화 문자 소통 역시 마찬가지다. 27일 현재 문 후보 공개 전화로 도착한 정책 제언 문자는 10만 건을 넘었다. 단적인 사례로 특정 전화번호로 ‘강원도의 청년 실업’에 대한 제안이 들어온다면 그 전화번호는 강원 지역에 살며 민주당에 관심이 많은 젊은층일 가능이 높다.



선거판 뒤흔든 빅데이터 전략

현재 문 후보의 우위와 안 후보의 빠른 쇠퇴도 빅데이터 분석을 통해 어느 정도 설명이 가능하다는 분석도 있다.

이달 3일 민주당 대선 후보로 문 후보가 확정되는 시점에 선거구도가 크게 요동쳤다. 중도 포지션이던 안희정 충남도지사의 지지 세력이 눈 깜짝할 사이에 안철수 후보에게 이동하는 대격변이 벌어진 것.

당시 민주당 지도부는 단 2주 만에 20% 가까이 급상승한 안 후보의 지지율에 긴장했다는 후문. 하지만 지금은 전례 없이 빠른 전략 교체로 재역전에 성공했다고 자평하고 있다. ‘주적(主敵)’ 논란에 뚜렷한 반대 의사를 밝혀 집토끼를 붙잡고 사드 배치에 대해선 전략적 모호성을 유지하는 중도 확장 전략으로 지지율을 붙잡는 데 성공한 것.

문 캠프의 한 핵심 관계자는 “만일 ‘적폐세력 청산’ 구호를 ‘든든한 대통령’으로 바꾸지 못했다면 자칫 역전당할 가능성도 있었다”면서 “동시에 안 후보가 중도 포지션을 너무 빨리 버리고 사드 찬성 등의 보수 전략으로 바뀐 것이나 유치원 정책 등의 실수도 행운으로 작용했다”고 말한다.

실제 빅데이터 전문가들은 문 후보가 여러 경쟁 후보에 비해 데이터 선거에서 우위를 차지하고 있다는 판세 분석을 내놓는다. 여기에는 당 조직의 크기나 연륜도 영향을 미쳤을 것이란 분석도 있다. 실제 민주당과 자유한국당을 제외한 정당들은 ‘빅데이터’ 활용 현황에 관련된 질문에 뚜렷한 답을 내놓지 못했다.

이종훈 정치평론가는 “한때 젊은층의 전유물이던 SNS가 중장년층으로 확대된 것이 트럼프 승리의 밑거름이 됐다”며 “장기적으로 빅데이터 분석이 전화 여론조사를 대체할 가능성이 높아 국내 정당들도 관련 투자를 늘릴 수밖에 없을 것”이라고 설명했다.

이번 선거는 ‘촛불정국’이 만든 조기 대선인 탓에 빅데이터의 위력이 예상보다는 덜했지만 앞으로 미국 식의 정책 대결 구도가 뚜렷해질 경우 그 위력은 배가될 것이라는 게 전문가들의 공통된 전망. 이는 정확한 유권자 정보를 더 많이 확보해 맞춤 정책을 내놓는 정당이 권력을 오래 유지할 가능성이 크다는 얘기다.

정호재 주간동아 기자 demian@donga.com