국내 포털들이 자체 검색 기술 개발경쟁을 벌이고 있는 가운데 지난주 SK커뮤니케이션즈의 '써플(searchplus.nate.com)'에 이어 엠파스가 새로운 한국형 웹 문서 검색 서비스를 선보인다.
SK커뮤니케이션즈의 써플이 사용자의 개입을 최대한 유도하는 집단지성을 이용한 시스템이라면 엠파스의 웹 문서 검색은 관련성 수치화 등 좀더 기계적인 알고리즘에 비중을 둔 것이 특징이다.
엠파스는 사용자가 검색하는 단어와 일치하는 내용을 상위 5개 결과 안에 보여주겠다는 뜻으로 '랭크 5'라는 방식을 제시했다.
검색포털 엠파스(www.empas.com)는 2년간의 노력끝에 순수 토종 기술로 개발한 '한국형 웹 문서 검색서비스'를 선보인다고 5일 밝혔다.
엠파스는 셀 수 없을 정도로 많은 웹 문서 중 중요도가 가장 높은 문서를 최상위에 노출시켜주는 새로운 웹 검색 서비스로 검색 결과의 신뢰도와 적합도를 대폭 향상시켰다며 독자 기술로 개발한 ‘랭크 5’ 방식을 소개했다.
검색 단어에 대한 웹 문서의 적합도를 수치화한 랭크 5 방식은 최초 검색 결과 상위 5개 문서 내에 사용자가 찾고자 하는 정보와 가장 근접한 결과를 보여준다는 것이 특징이다.
이를 위해 첫 정보 수집 단계부터 30억개 이상의 인터넷 주소(URL)를 평가하고 스팸 문서 등을 제거한 8억개 정도의 URL을 선별해 정보를 수집했다고 엠파스 측은 설명했다. 검색 단어의 활용 범주와 사이트의 적합성을 고려해 우선 선별 순위를 정하는 만큼 중요도가 높은 문서를 우선적으로 보여줄 수 있다는 것이 회사측 설명이다.
인터넷 웹 문서들이 서로 참조하는 방식을 분석해 페이지와 키워드간의 연관성을 수치화 하고 첨부 링크 종류, 링크 연관도 등의 가치를 평가했다. 또 데이터베이스의 업데이트 주기를 최소화해 수시로 추가되고 변경되는 웹의 변화를 검색 결과에 바로 반영할 수 있게끔 설계했다는 것이 엠파스의 설명이다.
엠파스 박석봉 대표는 "날마다 수없이 생산되는 UCC 콘텐츠를 좀더 신뢰성 있는 방식으로 신속하게 찾을 수 있게 됐다"며 이 웹 문서 검색이 '열린검색의 완성판'이라고 말했다.
그동안 코난테크놀로지의 검색엔진을 독점적으로 사용해온 엠파스는 이번 웹 문서 검색을 위해 검색 개발 팀을 별도로 구성해 진행한 것으로 전해졌다. ⓢ
------------------------------->
10시부터 공지하고 서비스한다고 합니다.