인터넷 댓글 7만건 분석…어떻게 조사했나

  • 입력 2009년 1월 15일 03시 04분


3개 포털에 실린 기사 댓글 32만개 1차 조사

‘기사당 200개 이상’ 6만9671개 일일이 분석

동아일보 산업부는 한국인터넷진흥원과 공동으로 지난해 8월 18일∼11월 23일 네이버 다음 야후 등 3개 포털에 실린 기사의 댓글을 분석했다. 구체적인 댓글 추출 및 분류 작업은 인터넷조사업체인 코리안클릭이 진행했다.

먼저 200개 이상 댓글이 달린 기사 841개를 뽑았다. 이 중 분야와 이슈별로 195개의 주요 기사를 선정했다.

또 인터넷 토론방 아고라에 오른 글 4개, 영화배우 문근영 씨 관련 게시글 1개를 더해 총 200개 글을 분석 대상으로 선정했다.

이어 이곳에 붙은 6만9671개의 댓글을 연구원이 전수 분석했다. 일반적으로 기사에 200개 이상의 댓글이 붙으면 해당 기사가 누리꾼의 상당한 관심을 끌고 있는 것으로 볼 수 있으며 통계적으로 의미 있는 결과를 이끌어낼 수 있다.

또 총 841개의 글에 붙은 32만4281개의 전체 댓글을 자동 프로그램을 통해 분석했다. 이때에도 프로그램에만 의존하지 않고 연구원들이 분석 결과를 직접 검수하는 절차를 밟았다.

댓글 가운데 △욕설, 협박, 사생활 침해, 사이버 스토킹, 갈등 조장 등을 포함한 단순 욕설 및 협박 △3회 이상 같은 글을 반복 게시하는 ‘도배’ △음란 내용, 성폭력, 스팸 등을 ‘악플’로 분류했다.

네이버와 다음 등은 △욕설로 인해 불쾌감을 일으키는 글 △개인정보 유포 △확인되지 않은 소문 유포에 해당하는 글의 게시를 금지하고 있다.

이에 따라 이번 조사는 포털이 미처 삭제하지 못했거나 경계가 모호해 삭제하지 않은 댓글만을 분석 대상으로 했다. 따라서 실제 악플의 비중은 이번 조사 결과보다 훨씬 높을 것으로 추정된다.

음란 및 스팸형 악플의 비중이 낮은 것 역시 포털이 발견 즉시 삭제하기 때문인 것으로 보인다.

댓글 여론을 주도하는 사람은 누구인지를 알아보기 위해 ID별로 댓글을 올린 개수를 파악했다. 한 사람이 여러 개의 ID를 사용할 수도 있지만 일반적인 누리꾼은 ID를 바꿔가면서 댓글을 올리지 않을 것이라고 가정했다.

댓글 여론 동향을 분석하는 데는 블로그, 게시판, 전문 사이트 등 약 6000개 사이트의 댓글을 추출해 온라인 여론을 분석하는 코리안클릭의 인터넷여론 동향 분석 프로그램 버즈워드를 사용했다.

김창덕 기자 drake007@donga.com

  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

지금 뜨는 뉴스