야후 검색성능 “야호”…자체검색엔진 대폭 업그레이드

  • 입력 2004년 3월 23일 19시 55분


코멘트
“어, 야후 검색이 엄청 변했네.”

야후코리아(대표 이승일)의 검색 기능이 ‘확’ 바뀌었다. 한 달 전에 비해 한글 웹페이지의 검색 성능이 눈에 띄게 좋아진 것.

야후 서비스에 무슨 변화가 있었던 것일까.

야후 본사는 최근 몇 년간 새로운 검색기술 개발에 주력해왔다. 그러다 2월 YST(Yahoo! Search Technology)라는 자체 검색엔진을 선보였다. 이 기술이 국내 사이트에도 적용되면서 검색 기능이 대폭 업그레이드된 것.

야후 본사가 웹페이지 검색에 ‘구글(Google)’을 채택했던 것과는 달리 야후코리아는 국내 업체의 검색엔진을 사용해왔다. 그러나 이 한글 검색엔진은 종종 ‘사오정’과 같은 결과를 보여줘 이용자를 곤혹스럽게 했다.

예를 들어 판소리 신동인 유태평양군의 이름을 검색하면 1만여건이 넘는 결과가 검색되는데 그중에서 법무법인 태평양의 한 변호사가 첫 번째로 등장했던 것.

이처럼 검색어와 상관없는 자료가 가장 먼저 검색되는 것은 한글 복합명사 처리기술의 문제 때문이다. ‘유태평양’이란 단어를 복합명사로 오인하고 ‘유’와 ‘태평양’으로 분리해 검색한 것.

야후코리아는 YST의 성능이 토종 검색 포털은 물론 ‘구글’도 능가한다고 주장한다. 과연 그럴까.

검색 포털 업체들은 성능 비교 자료에 매우 민감한 편이다. 따라서 공식적인 순위는 아직 없지만 이용자 입장에서 간단한 테스트를 해보면 대략 윤곽을 알 수 있다. 각각의 사이트에 동일한 검색어를 넣어 검색 결과의 건수와 정확성, 관련도 등을 비교해 보는 것.

예를 들어 1970년대 유행가요 ‘불나무’의 가사 중 “오 그대는 아는가”라는 부분을 검색했을 때 이 구절이 담긴 웹페이지를 가장 먼저 소개해야 관련도가 높은 것으로 볼 수 있다.

여러 단어를 한 단어처럼 통째로 검색하는 구문(句文) 검색기능도 시험해 볼 수 있다. 구문 검색 기호로는 주로 ‘큰따옴표’가 사용된다. 결과를 비교해 보면 야후코리아의 약진을 어느 정도 확인할 수 있다.

야후코리아 최형우 검색사업부장은 “새로운 검색엔진을 도입한 후 웹문서 검색의 데이터베이스(DB)양과 랭킹기술, 한글처리기술, 스팸사이트 걸러내기 등이 크게 향상됐다”고 말했다.

권혜진기자 hjkwon@donga.com

  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스