정보의 쓰나미 시대, 데이터 문해력으로 살아남기[기고/장원철]

  • 동아일보
  • 입력 2026년 6월 4일 23시 03분


장원철 서울대 통계학과 교수
장원철 서울대 통계학과 교수
바야흐로 정보의 홍수 시대이다. 에릭 슈밋 전 구글 최고경영자(CEO)는 2010년 “지금은 이틀마다 인류 문명의 시작부터 2003년까지 만들어낸 것과 맞먹는 양의 정보를 만들어낸다”라며 빅데이터 시대의 개막을 알렸다. 이와 비교할 때 2026년 현재는 정보의 홍수를 넘어 쓰나미 시대라고 해도 과언이 아니다.

하지만 쏟아지는 정보 속에서 정말 유용하고 쓸모 있는 정보를 찾아내기는 건초더미에서 바늘 찾기만큼 어려워졌다. 더구나 요즘은 로또 조작설에서 백신 유해론까지 허위 정보들도 나름 그럴싸한 증거를 제시한다는 점에서 기존의 허황된 정보와도 다르다.

‘나는 왜 과식하는가’(2008년), ‘슬림 디자인’(2017년) 등을 펴내며 소비자 행동 분야의 저명한 학자였던 브라이언 완싱크의 사례가 이를 잘 보여 준다. 그는 “음식을 작은 그릇에 담으면 적게 먹는다”, “레스토랑의 구석 자리에 앉으면 디저트를 먹을 확률이 높아지고 창가에 앉을 경우 샐러드를 먹을 확률이 높아진다” 등과 같은 특이한 연구 결과를 잇달아 발표하면서 학교 급식, 식생활 캠페인, 공공정책 담론에 영향을 미치게 된다.

하지만 완싱크가 자신의 블로그에 특별한 결과를 얻지 못했던 피자 뷔페 데이터를 여러 방식으로 다시 분석해 흥미 있는 결과를 만들어냈다는 취지의 글을 올리면서 연구부정 시비에 휘말리게 됐다. 이에 대한 조사 이후 그의 논문 상당수가 저널에서 철회됐고, 그는 미국 코넬대에서도 사임하게 됐다. 저명한 학자의 논문이더라도 심도 있게 검증해야 한다는 교훈을 준다.

편향된 데이터를 사용하는 것도 문제가 될 수 있다. 예를 들면 특정 프랜차이즈 업체의 평균 존속 기간을 발표할 때 실제로는 폐업한 매장의 데이터만 포함해 계산하는 경우가 있다. 특히 신생 프랜차이즈의 경우 짧은 기간 안에 폐업한 매장의 자료만 반영돼 실제 존속 기간보다 훨씬 짧게 오해할 수 있다. 이런 경우 아직 폐업하지 않은 사업체까지 함께 포함해 생존분석이라는 방법으로 존속 기간의 중위값을 추정하는 것이 더 적절하다.

위 사례들은 필자가 맡은 데이터 문해력 교과목의 수업 내용 일부이기도 하다. AI 시대에는 누구나 그럴듯한 분석 보고서를 만들 수 있다. 그렇기에 뼈대가 되는 데이터를 올바르게 사용하고 해석하는 능력, 즉 데이터 문해력이 기본 소양으로 자리 잡고 있다.

그렇다면 데이터 문해력을 기르려면 어떤 자세를 가져야 할까? 첫째, 데이터의 출처가 공신력 있는 기관인지 확인해야 한다. 자신의 생각과 일치한다고 출처 확인 없이 소셜미디어에 퍼 나르는 것은 회사 주요 보고서에 나무위키를 참고자료로 올리는 것과 동일하다. 둘째, 이해할 수 없는 용어를 자주 사용하는 주장은 경계해야 한다. 자신이 이해할 수 없는 내용이라면 아는 체하는 것보다 정확히 내용을 파악한 후 판단해도 늦지 않다. 마지막으로 유튜브를 보는 시간을 약간만 줄이고, 불확실성과 함께 살아가는 지혜를 다루는 다양한 데이터 문해력 서적을 읽어볼 것을 권고한다. 알고리즘 추천으로 편향된 정보만 제공하는 유튜브 채널을 보는 것은 편향된 데이터로 분석된 결과를 맹신하는 것과 똑같다.

정보의 쓰나미 시대에 우리에게 필요한 것은 더 많은 데이터가 아니라 숫자 뒤에 숨어 있는 의미와 한계를 읽어내는 능력이다.
#데이터 문해력#데이터의 출처#소셜미디어#나무위키#알고리즘
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

트렌드뉴스

트렌드뉴스

  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스