SNS 헛소문 판별 SW 개발

  • 동아일보
  • 입력 2014년 1월 10일 03시 00분


코멘트

KAIST 차미영 교수팀-MS 공동연구
“100만개 넘는 빅데이터 분석 결과 루머는 팩트보다 긴시간 지속 전파
연관없는 사람들끼리 산발적 발생”

각 점은 한 명의 사용자를, 선은 정보의 전달을 의미한다. 루머(위쪽)는 다수에 의해 산발적으로 생산되지만 멀리까지는 퍼지지 않는 특징이 있다. 반면 루머가 아닌 정보(아래쪽)는 전달받은 사람이 다른사람에게 전달해 멀리까지 퍼져나간다. KAIST 제공
각 점은 한 명의 사용자를, 선은 정보의 전달을 의미한다. 루머(위쪽)는 다수에 의해 산발적으로 생산되지만 멀리까지는 퍼지지 않는 특징이 있다. 반면 루머가 아닌 정보(아래쪽)는 전달받은 사람이 다른사람에게 전달해 멀리까지 퍼져나간다. KAIST 제공
차미영 교수
차미영 교수
트위터, 페이스북 등 소셜네트워크서비스(SNS)에서 떠도는 이야기들은 빠르게 다수에게 메시지가 전달되는 특성 때문에 영향력이 커졌다. 그러나 전달되는 내용의 진실성이나 ‘루머’를 밝히기란 쉽지 않다. 이 때문에 최근 정부가 ‘SNS 단속 강화’ 방침이라는 것을 내놔 논란이 되고 있을 정도다.

하지만 국내 연구진이 SNS 루머 판별 기술을 개발해 소모적인 논란을 피할 수 있는 실마리를 만들었다. 또 루머는 다른 사람에게 전달할 가능성이 낮아 ‘근거 없는 루머가 SNS를 타고 급속히 확산된다’는 일반적인 생각이 잘못됐다는 것도 밝혀냈다.

KAIST 문화기술대학원 차미영 교수팀은 서울대, 마이크로소프트 아시아 연구소와 공동연구를 통해 100개의 SNS 루머 중 90개를 판별할 수 있는 자동화 프로그램을 개발했다고 9일 밝혔다.

연구팀은 루머의 특성을 규명하기 위해 ‘빅데이터’를 이용했다. 2006∼2009년 미국 트위터에 올라온 정치 정보기술(IT) 건강 연예인 등에 대한 100개 이상의 사례와 100만 개가 넘는 관련 글을 분석했다. 버락 오바마 대통령이나 영화배우 니콜 키드먼에 대한 인신공격성 루머 등도 포함됐다.

분석 결과 루머는 일반 정보에 비해 긴 시간 지속적으로 전파되고, 서로 연관이 없는 사용자들로부터 산발적으로 전달됐다. 또 사용자를 점으로, 정보 전달을 선으로 표현한 ‘확산네트워크’를 통한 정보 확산 경로를 확인한 결과, 루머는 전달받은 사람이 또 다른 사람에게 전달할 가능성이 낮았다.

연구팀이 이런 루머의 특징을 프로그램에 적용해 다시 트위터의 글을 분석한 결과, 90%의 정확도로 루머를 판별하는 데 성공했다. 특히 비방이나 욕설이 포함된 루머의 경우 더 정확하게 판별할 수 있었다.

차 교수는 “앞으로 국내 SNS 루머 특성에 대해 더 분석하면 악성 루머를 감지하고 확산을 방지하는 데 도움이 될 것”이라고 말했다.

최새미 동아사이언스 기자 saemi@donga.com
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스