[디지털의 세계]인터넷사이트는 많아도 40%만 접근가능

  • 입력 1998년 4월 5일 19시 26분


현재 인터넷을 통해 정보를 제공하는 주소(웹사이트)는 3억2천만개가 넘고 있으나 핫봇이나 알타비스타와 같은 정보검색도구를 통해 접근할 수 있는 곳은 40%를 넘지 않는 것으로 조사됐다.

이같은 사실은 미국 NEC연구소가 전문가들의 조사결과를 토대로 과학전문지 ‘사이언스’ 최근호에 기고한 내용에서 밝혀졌다.

검색도구에 따라 정보를 찾아내는 범위에도 큰 차이가 있는 것으로 조사됐다. NEC연구진은 5백75가지의 조사항목을 설정하고 15만개 이상의 웹사이트를 뒤져 각 검색도구의 자료추출능력을 평가했다. 조사결과 6개 주요 검색도구 가운데 핫봇의 자료추출능력이 34%로 가장 높았으며 알타비스타 28%, 노던라이트 20%, 익사이트 14%, 인포시크 10%, 라이코스 3%로 나타났다고 밝혔다.

스티브 로런스연구원은 “앞으로 불과 몇년내에 웹사이트 숫자는 30억개가 넘을 것으로 예상된다”면서 “정보검색을 위한 혁신적인 방법이 마련되지 않으면 많은 인터넷 정보가 사장될 우려가 있다”고 전망했다.

이번 검색도구의 정보추출능력 평가는 검색도구의 기계적인 능력만을 측정하는 것이어서 일반인들에게 널리 알려진 검색도구인 ‘야후’는 제외됐다. 야후는 검색빈도가 높은 정보들을 검색사들이 분류해 놓은 것이기 때문이다.이같은 조사에 대해 라이코스측은 일반적인 웹사이트를 검색대상으로 하지 않고 연구진이 자의적으로 추출한 사항들만을 검색표본으로 사용했다며 결과의 신빙성에 의문이 있다고 반박했다.

〈구자룡기자〉

  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

지금 뜨는 뉴스