[신문과 놀자!/눈이 커지는 수학]1000명 조사로 전 국민 생각 알 수 있는 ‘통계의 마법’

  • 동아일보
  • 입력 2015년 12월 16일 03시 00분


코멘트
상훈이는 매년 12월이 되면 신문이나 방송에서 각 분야에서 올해의 10대 뉴스를 보도하는 것을 보았습니다. 한 해를 정리해주는 것이 재미있기도 하고, 그동안 잊었던 1년의 생활을 돌이켜볼 수 있어 유익했기 때문이죠. 그런데 정작 상훈이는 이런 설문에 참여한 적이 없는데, 어떻게 10대 뉴스가 선정돼 발표되는 것인지, 또 어떻게 그것이 우리의 의견을 대표할 수 있는지 궁금했습니다.

상훈: 아빠, 시민이 뽑은 올해의 10대 뉴스는 어떻게 선정되는 거예요?

아빠: 시에서 몇 가지 안을 제시하고 일정 기간 온라인과 오프라인으로 조사한 후 그 결과를 발표하는 것으로 아는데, 이번 해에도 11∼12월 각 시도에서 조사를 하는 것 같더구나. 곧 연말이니 발표가 되겠구나.

상훈: 어? 저는 참여해본 적이 없는데, 우리 시민의 의견이라고 말해도 되나요?

아빠: 우리가 보도로 접하는 많은 여론조사 결과가 한 사람도 빠짐없이 모두 조사해 결과를 보여주는 것은 아니란다.

상훈:
그럼 어떻게 그 결과가 우리의 의견을 대표한다고 할 수 있나요? 믿을 수 있는 건가요?

○ 표본조사, 5000만 명의 생각을 1000명으로 추측

방송국, 신문사 등은 정기적으로 여론조사를 하고 그 결과를 전합니다. 이 밖에 행정기관이 국민의 뜻을 파악하기 위해 여론조사를 하는 경우도 있습니다. 여론조사는 ‘여론’이라는 사회 공통의 의견을 구체적인 숫자로 바꿔 제시하는 것입니다.

12월에 한 해를 정리하며 ‘올해의 뉴스’ 등을 선정하기 위해 우리 국민 5000만 명의 의견을 모두 조사하는 것은 시간이나 비용 면에서 너무 비효율적입니다. 그 대신 단 1000명에게 설문조사를 해도 답을 할 수 있답니다. 물론 여기에 고려할 것들이 몇 가지 있지만요.

왜 5000만 명 중 1000명에게만 물어도 전체의 의견을 추측할 수 있을까요? 그것은 쉽게 생각하면 우리가 주방에서 국을 끓일 때와 같습니다. 끓고 있는 국의 간을 보기 위해 우리는 국 전체를 다 먹어보는 게 아니라 한 숟가락만 맛봅니다. 국의 간이 골고루 섞여 있다면 한 숟가락의 맛이나 그 전체의 맛이나 같은 것일 테니까요. 마찬가지로 전 국민과 남녀, 나이, 지역 등 여러 가지 요소의 비율이 같은 설문 응답자 집단만 선정할 수 있다면, 그 집단의 의견을 듣는 것만으로도 전 국민의 의견을 추측할 수 있는 것입니다.

이때 조사 대상이 되는 전체 집단을 모집단이라고 하고, 이 중 모집단에서 뽑은 일부 자료를 표본이라고 합니다. 또 조사 대상 중 일부만 뽑아서 하는 조사를 표본조사, 인구통계조사처럼 조사 대상 전체를 조사하는 방법을 전수조사라고 합니다.

○ 무작위 선정과 조사 방법

그런데 어떻게 하면 전 국민과 같은 구성이 이루어진 1000명의 집단을 선정할 수 있을까요? 실제로 남녀, 나이, 지역 등을 고려하지 않고 무작위로 뽑으면 해결됩니다. ‘무작위’라는 것은, 일부러 꾸미거나 더하지 않았다는 의미에서, 일어날 수 있는 모든 일이 동등한 가능성으로 발생하게 하는 효과가 있습니다. 그런데 무작위로 고르는 일이 사실 어렵습니다. 예를 들어 설문 대상을 평일 아침 우리 학교 앞을 지나가는 사람을 고른다고 하면, 이는 전 국민의 구성과는 동떨어진 집단이 됩니다. ‘무작위로 고르는 것’과 ‘아무렇게나 고르는 것’은 전혀 다른 것입니다.

따라서 여론조사의 결과를 볼 때는 결과뿐만 아니라 어떤 방법으로 조사가 이루어졌는지, 그 조사 방법에도 유의할 필요가 있습니다. 현재 이루어지는 여론조사 방법은 방문 면접법, 전화 조사법, 우편 또는 온라인 조사법 등이 있습니다. 방문 면접은 회답률은 높을 수 있으나 정확한 답을 얻기 어려울 수 있고, 전화 또는 우편 조사는 비용은 저렴하나 회답률이 상대적으로 낮을 수 있습니다. 거리 앙케트와 인터넷 조사는 스스로 협력하는 사람들만 대상으로 하기에 조사 결과가 특정층에 치우칠 가능성이 높습니다.

○ 믿을 만한 것일까?

조사 방법이나 대상을 무작위로 골라 결과의 치우침이 생기는 요소를 모두 없앴다고 하면 1000명의 설문 결과가 전 국민의 의견을 정확히 반영한다고 할 수 있을까요?

예를 들어 어떤 상자 안에 빨간 공과 파란 공이 각각 50개씩, 모두 100개의 공이 들어 있다고 합시다. 이때 눈을 감고 상자에서 10개의 공을 꺼낸다고 상상해 봅시다(실제로 실험을 해도 좋습니다). 그러면 빨간 공과 파란 공이 각각 5개씩 나올 수 있을 것입니다. 그러나 공을 다시 넣고 10개를 다시 꺼내면 빨간 공이 6개, 파란 공이 4개가 나올 수도 있습니다. 빨간 공과 파란 공이 같은 비율로 들어 있는 100개의 모집단 공을 10개의 표본으로 뽑아 조사했지만 표본 결과가 모집단의 구성과 항상 같지 않음을 알 수 있습니다.



여론조사의 경우에도 이같이 표본이 모집단과 어긋나는 일이 생깁니다. 그것을 막을 방법은 없습니다. 다만 일어나기 쉬운 어긋남과 잘 일어나지 않는 어긋남이 있습니다. 예를 들어 다시 뽑았는데 빨간색 10개만 계속 나올 수 있을까요? 쉽지 않겠죠. 그래서 이러한 수학적인 어긋남을 인정하고, 어떤 표본에 대한 조사 결과가 나오면 그에 대해 모집단에서 참일 범위를 제시하고 어느 정도의 가능성을 갖는지 같이 제시합니다. 예를 들어 1000명에게 어떤 질문에 대해 물었을 때 70%가 지지했다면 실제로 모집단의 ‘참 지지율은 67∼73% 범위에 있을 가능성이 95%’라는 표현을 할 수 있습니다. 이것은 여러 번 여론조사를 하면, 모집단의 의견으로 추정될 수 있는 값이 표본에서 얻은 70%를 포함하는 67∼73% 범위에 포함되는 횟수가 전체의 95%라는 의미입니다. 이때 가능성 95%를 신뢰도라고 하며 67∼73%를 신뢰구간이라고 합니다.

○ 올해의 뉴스


이제 다시 올해의 뉴스로 돌아가 볼까요?

시민들이 뽑은 올해의 뉴스나 서점에서 조사하는 올해의 책 등은 온라인과 오프라인 등의 설문을 통해 스스로 참여하려는 사람들의 응답 결과를 정리해 발표하는 것입니다. 따라서 조사에 스스로 협력하고 그 분야에 종사하거나 관심 있는 특정한 사람들이 응답한 결과일 수 있습니다. 그러나 집단의 의견을 볼 수 있는 것은 사실입니다. 아직 한창 2015년 올해의 뉴스를 종합하기 위해 각 분야에서 조사 중이거나 이제 막 정리된 올해의 뉴스 등이 보도되고 있습니다. 우리도 여기에 관심을 가져보고 직접 참여해 본다든지, 또 매의 눈으로 조사 방법이나 표본 선정에 문제는 없는지, 보여주는 수치가 어떤 의미인지에 대해 다시 한 번 주의 깊게 살펴보고 해석하는 일에 적극적으로 참여해보면 어떨까요?

박지현 반포고 교사
#수학#표본조사#통계
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스