[책의 향기]미국 대선 자금 모금엔 어떤 데이터 필요했을까

  • 동아일보
  • 입력 2018년 9월 8일 03시 00분


코멘트

◇데이터 분석의 힘/이토 고이치로 지음·전선영 옮김·이학배 감수/252쪽·1만4800원·인플루엔셜

수식 없이 데이터 분석을 쉽게 설명한 입문서다. 미국 시카고대 공공정책대학원 교수가 썼다.

‘무작위비교시행(RCT)’, ‘회귀불연속설계법(RD디자인)’, ‘집군 분석’…. 저자가 소개하는 데이터 분석 방법이다. 무시무시하게 어려워 보이는 명칭이지만 겁먹을 건 없다.

RCT는 집단을 무작위로 나눠 하는 실험이다. 예를 들어 전기요금을 올리면 사람들이 전기를 아낄지 알아보려면 요금을 올린 집단과 그렇지 않은 집단의 행동을 비교해야 하는데, 이때 두 집단을 무작위로 나눠야 한다. 그래야 다른 원인이 결과에 편향을 만드는 걸 막을 수 있다.

RD디자인은 인위적인 실험을 할 수 없을 때 실험과 비슷한 상황을 이용해 인과관계를 분석하는 방법이다. “일본에서 70세를 경계로 병원을 찾는 환자 수가 급격히 많아지는 이유는 70세에 의료비 본인부담금이 갑자기 낮아지기 때문이다”와 같은 문제를 증명할 때 사용된다. 이 같은 급격한 변화에 다른 변수가 영향을 준 게 아니라는 걸 검증한다.

책은 데이터에서 원인과 결과를 밝혀내는 방법을 직관적으로 이해할 수 있는 그래프만 가지고 설명한다. 저자는 데이터 분석을 초밥 장인의 작업에 비유했다. 훌륭한 재료(양질의 데이터)와 장인의 칼솜씨(분석)가 모두 필요하다는 것. 미국의 대선 자금 모금부터 첨단 기업의 마케팅까지 데이터 활용이 필수가 된 시대다. 꼭 초밥을 직접 만들지 않더라도 그 맛을 음미하기 위해 장인의 칼솜씨를 알아보는 눈을 키우려는 이들에게 ‘딱’이다.
 
조종엽 기자 jjj@donga.com
#데이터 분석의 힘#이토 고이치로
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스