[신문과 놀자!/고희정 작가의 과학 돋보기]빅데이터 엮으면 범죄도 막아요

  • 동아일보
  • 입력 2014년 3월 12일 03시 00분


코멘트
최근 하루가 멀다 하고 일어나는 개인 정보 유출 사건. 나도 잘 모르는, 나에 대한 수많은 데이터가 세상 여기저기를 떠돌고 있다는 사실을 생각하면 섬뜩해지기도 합니다. 잘못 사용하면 개인뿐 아니라 사회와 국가를 위협할 수 있는 엄청난 무기가 되는 데이터. 하지만 잘 사용하면 세상을 좀 더 안전하게 만들어줄 수도 있는데요. 동아일보 1월 29일자 A12면에도 빅 데이터를 이용한 지리적 프로파일링 시스템으로 범죄를 예방한다는 기사가 실렸습니다. 오늘은 수많은 데이터들이 어떻게 안전한 세상을 만들기 위해 쓰이고 있는지 알아보겠습니다.

○ 빅 데이터


지리적 프로파일링 시스템이란 범죄기록, 주민신고 정보, 폐쇄회로(CC)TV 위치 정보, 유동인구 등의 데이터를 분석해 장소와 시간대별로 범죄 가능성을 예측하는 프로그램을 말합니다. 전국을 약 37만 개 지역으로 나눠 범죄 발생 개연성을 매일 시간대별로 예측해 지도에 지수와 색상으로 표시하는데요. 붉은색에 가까울수록 범죄 발생 개연성이 높고, 푸른색에 가까울수록 낮은 구역이라고 합니다.

범죄는 잠재적으로 예측 가능한 패턴을 지닌다는 원리를 이용해 범죄에 대한 구체적인 데이터를 파악하고, 범죄 발생률이 높은 지역에 경찰인력을 우선 배치해서 범죄를 사전에 예방하는 데 쓰는 것인데요. 이러한 시스템을 가능케 한 것이 바로 ‘빅 데이터’입니다.

빅 데이터란 말 그대로 ‘방대한 분량의 데이터’만을 의미하는 것이 아닙니다. 그 많은 데이터를 어떻게 효과적으로 처리하고 분석해 새로운 분야에 활용할 수 있는가가 더 중요한 초점입니다.

○ 디지털 포렌식

범죄 예방뿐 아니라 실제 범인을 찾아내는 데도 데이터는 유용하게 쓰입니다. 현대인들은 디지털 기기와 항상 접해 있기 때문에 개인에 대한 기록이 디지털 정보로 남아 있는 경우가 많습니다. 또 디지털 기술의 발달로 범행을 숨기기 위해 삭제한 자료도 복원이 가능해 범죄 수사에 널리 활용되고 있습니다. 이렇게 범죄와 연관된 각종 디지털 데이터 및 통화기록, e메일 접속기록 등의 정보를 수집하고 분석하여 DNA, 지문, 핏자국 등 범행과 관련된 증거를 확보하는 수사기법을 디지털 포렌식이라고 합니다.

하지만 데이터를 분석하는 과정은 쉽지 않습니다. 휴대전화, 개인휴대정보단말기(PDA), PC, CCTV 등 저장기기도 다르고 문자, 그림, 영상 등 저장 형태도 다 다르기 때문입니다. 또 엄청난 양의 데이터를 확보했을 경우, 그것을 처리하는 데에도 많은 인력과 고도의 기술이 필요합니다.

지난해 미국에서 발생한 보스턴 마라톤 폭탄테러. 미국 FBI는 사건 발생 직후, 사건 현장 근처 이동통신기지국 로그기록과 주변 사무실, 주유소, 아웃렛 등의 CCTV 영상, 현장에 있던 사람들의 휴대전화 카메라 영상 등 무려 10테라바이트(TB)나 되는 데이터를 모았습니다. 그리고 멀티미디어 자료 분석 전문가를 동원해 이 다양한 유형의 데이터들을 분석 가능한 체계적인 데이터 형식으로 바꾸어 분석한 결과, 이틀 만에 용의자의 복장과 신원을 밝혀내고, 마침내 범인을 검거할 수 있었습니다.

또 2012년에 일어난 신촌 대학생 살인 사건의 범인들 역시 CCTV로 덜미가 잡혔고, 그들의 휴대전화 SNS를 분석한 결과, SNS상의 다툼이 살인의 이유였다는 것이 밝혀져 큰 논란이 되기도 했습니다. 얼마 전 일어난 TV 프로그램 출연자 사망 사건의 경우도 피해자의 자살 이유를 찾기 위해 사건 현장의 CCTV 데이터는 물론이고, 사망 전 친구들과 주고받은 휴대전화 SNS 기록까지 면밀히 살펴보는 수사를 했습니다.

이제 각종 디지털 기기의 수많은 데이터는 사건을 해결하고 범인을 추적하는 핵심 증거물이 되고 있는 것입니다.

○ RFID

신용카드나 교통카드, 하이패스 등에 붙어 있는 전자태그(RFID·Radio Frequency Identification) 칩도 범인의 행적을 파악해 사건을 해결하는 데 큰 도움을 주고 있습니다. RFID는 초소형 반도체에 식별정보를 입력하고 무선주파수를 이용하여 자동으로 이 칩을 지닌 물체나 동물 등을 판독해 추적 관리할 수 있는 기술을 말합니다.

교통카드를 버스의 리더기에 갖다 대면 ‘띠’ 소리와 함께 사용한 금액이 표시되고, 선불제 카드는 남은 잔액이, 후불제 카드는 총사용한 금액이 표시됩니다. 하이패스의 경우 톨게이트를 지나가는 순간 기록이 남게 되죠.

이 기록은 교통카드나 하이패스 회사의 서버에 고스란히 저장됩니다. 언제 어디서 버스를 타고 내렸는지, 어떤 고속도로 톨게이트를 지났는지 알 수 있게 되는 것이죠. 교통카드를 이용해 버스나 지하철을 타 보면 RFID가 무엇인지, 나의 행적이 어떻게 데이터로 저장되는지 알 수 있습니다.

○ 3차원 스캐닝

최근에는 확보한 영상 데이터를 다양한 방법으로 재구성해 범인을 찾아내는 수사기법도 많이 사용되고 있습니다. 그중 하나가 바로 3차원 스캐닝입니다.

2003년 9월부터 약 10개월 동안 무려 21명을 살해한 연쇄 살인마 유영철을 기억하시나요? 유영철은 체포될 당시 범행을 강력하게 부인했는데요. 항상 마스크로 얼굴을 가리고 다닌 데다 확보한 CCTV 영상의 대부분이 정면 모습이 아니기 때문에 그가 범인이라는 확실한 증거가 되지 못했습니다.

이때 사용하는 것이 바로 3차원 얼굴 스캐너입니다. 범인의 얼굴을 3차원으로 촬영한 뒤 CCTV에 찍힌 마스크를 쓴 얼굴(2차원 사진)과 비교했습니다. 그 결과, 두 얼굴을 같은 각도로 놓았을 때 코의 각도와 높이, 귀의 위치와 모양이 똑같다는 것을 알아냈고, 마침내 유영철이 범인임을 증명할 수 있었습니다.

3차원 스캐닝을 이용하면 범행에 사용된 둔기를 알아내거나 교통사고를 재현할 수도 있습니다. 최근에는 3차원 영상 스캐너를 이용해 사건 현장을 고스란히 3차원으로 저장하기도 합니다.

매일 쏟아지는 수많은 데이터. 이제 데이터가 범죄의 대상이 아닌, 더 안전한 세상을 만드는 데 제대로 쓰이길 기대해 봅니다.

고희정 작가
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스