'내가 1위다!' 또는 '내가 5위다!'
사이트 순위 경쟁이 또 시작됐다. 다음, 네이버, 네이트, 야후가 1~4위 순위를 놓고 저마다 자기들이 1위를 했다며(할거라며) 나서고 있고, 최근에는 드림위즈, 파란, 엠파스 등이 5위를 놓고 다투고 있다.
오늘 NHN이 매트릭스 자료를 인용, 네이버가 주간 순방문자수에서 11월 3주차 1위를 차지했다고 밝혔다.
인터넷분석 평가 전문 업체인 매트릭스가 지난 23일 발표한 자료에 따르면 11월 15일부터 21일까지의 주간 방문자수를 기준으로, 네이버가 19,519,045명으로 2위인 다음(19,322,693명)보다 약 20만명이 많았던 것으로 집계됐다.
지난 9월 1주차 당시 다음보다 300만명 적었지만 점차 격차를 줄여오면서 이번에 처음으로 다음을 2위로 끌어내리며 순방문자 순위에서 1위를 차지한 것에 대해 네이버측은 한껏 고무돼 있는 표정이다.
어제는 드림위즈가 포털 5위를 놓고 엠파스와 파란과 치열한 경쟁을 벌이고 있다면서 인터넷 포털 부문에서 5위를 차지하고 있다고 밝힌 바 있다. 드림위즈의 이같은 발표는 지난 17일의 파란이 발표한 자료 때문이었다. 파란은 17일자 발표자료를 통해 코리안클릭 자료를 인용 11월 첫째주 전체 웹사이트 중 순방문자 순위에서 6위, 포털사이트 순위에서는 5위를 차지했다고 말했다. 파란을 운영중인 KTH로서는 '연내 업계 5위, 2006년까지 1위'를 폭표로 했는데 그중 한 가지를 예상보다 일찍 달성했다며 자랑했다.
이들 사이트들이 순위를 놓고 신경전을 벌이는 모양이 꼭 신문들이 발행부수를 놓고 저마다 1위라고 주장하는 조선중앙동아의 치열한 부수 경쟁의 모습과 비슷하다. 물론 시청률을 놓고 일희일비(一喜一悲)하는 방송사의 경쟁과도 닮았다.
신문의 발행부수 경쟁과 방송사 시청률 경쟁은 광고비와 맞닿아 있다는 것을 알고 있다면 이들 사이트의 순위 경쟁이 왜 치열해지고 있는지를 짐작할 수 있다. TV, 라디오, 신문, 잡지 등 기존 4대 매체에서 인터넷이 제 5의 매체로 부상했으며 인터넷 광고 시장이 잡지 광고 시장을 규모면에서 제친 것은 오래 전의 일이다. 당연히 더 많은 광고를 더 비싸게 유치하려면 트래픽 경쟁에서 살아남아야 하는 것이다.
물론 사이트 순위가 광고 유치에만 사용되는 것은 아니다. 초기 인터넷 사이트의 우열 경쟁의 대결은 회원수 경쟁이었지만 현재는 얼마나 더 많은 네티즌이 모여 있고 적극적으로 활동하느냐가 중요한 이슈로 자리잡았기 때문이다. 네티즌의 속성상 많은 사람들이 모여 있어야 더 많은 방문을 하게 되는 선순환 고리를 형성할 수 있기 때문이다. 그래서 나온 말이 '한 번 무너진 사이트는 회복 불가능'이다.
야후코리아가 1위를 다음과 네이버에 차례로 내주면서 3위권 경쟁으로 밀려나고 네이트에까지 밀려나고 있는 상황이나 프리챌이 성급한 커뮤니티 유료화로 입은 타격을 쉽게 복원하지 못하는 것을 보면 사이트 순위에 대한 업계의 집착이 얼마나 절박한 것인지를 짐작할 수 있는 대목이다.
사이트 순위는 절대 평가 아닌 상대 평가
그런데 문제는 이들 사이트들이 내세우고 있는 사이트 순위를 신뢰할 수 있느냐의 문제다.
우선 이들 사이트들이 자주 인용하고 있는 인터넷 웹사이트 조사업체들의 조사기준과 그 속에 등장하는 용어와 숫자에 대한 이해가 선행돼야 그 신뢰성에 대한 한계를 알 수 있다. 사이트들이 자주 인용하는 곳은 크게 네곳. 매트릭스(www.metrixcorp.com)와 랭키닷컴(www.rankey.com), 그리고 코리안클릭(www.koreanclick.com)이다. 코리안클릭의 데이터를 기반으로 한 서비스인 랭크9(www.rank9.com)을 방문하면 된다. 매트릭스는 분야별 순위 가운데 5위까지만 일반 회원에게 공개하고 있다. 이외에 매트릭스가 인수한 100핫(www.100hot.co.kr)에서는 좀더 자세한 자료를 찾아볼 수 있다.
일단 랭키닷컴과 100핫, 랭크9의 전체 사이트 순위를 보면 상위 순위는 매우 유사하면서도 10위권 이하의 순위가 뒤죽박죽인 것을 알 수 있다.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
사실 구체적인 숫자까지 들어가면 더 헷갈린다. 각 사이트별 다음을 기준으로 순방문자수를 보자. 랭키닷컴의 집계에는 1856만명이 방문한 것으로 나온다. 랭크9에서는 2003만명, 100핫에서는 1664만명으로 들쭉날쭉이다. 구체적인 방문자 수치는 논외로 놓더라도 순위의 아래쪽으로 내려갈수록 각 사이트간의 수치 차이는 더욱 극명하게 드러난다.
세 곳의 조사에서 15위 안에 모두 들어있는 곳은 네이버, 다음, 네이트, 야후코리아, 옥션, 엠파스, 드림위즈, 파란닷컴, 국민은행, 벅스 등 10개 사이트이며 조인스, 011이스테이션, 하나포스, 넥슨, 인터파크, MSN 코리아, 넷마블, 피망, 마이크로소프트 등은 각각 서로 다른 조사기관별로 순위가 심하게는 20위까지 차이가 난다.
왜 이럴까? 각 조사기관마다 패널을 선정 운영하는 방식과 샘플링 방식인 패널의 인구통계학상의 분포 비율 등이 이런 차이를 만들어낸다.
이들 세곳 모두 전체 사용자 가운데 일정 비율의 패널을 선정해 이들이 방문하는 사이트를 추적조사하는 방식을 사용한다. 이같은 트래픽 조사 방식은 실제로 초기 웹사이트 순위 사이트로 이름을 날렸으나 우리나라에서는 그다지 인용되지 않는 알렉사(www.alexa.com) 순위 선정 방식과 비슷하다. 툴바 프로그램을 사용자가 내려받게 하고 툴바를 사용하는 사용자의 비율을 인구통계학에 따른 수치를 적용한 다음 이를 다시 전체 인구의 비율에 따라 곱하는 방식이다.
쉽게 말하면 전체 인터넷 인구가 100명인데 이중 20명 정도가 해당 조사기관의 툴바를 설치했다면 조사에 반영되는 사람은 10명 정도가 실제 기준으로 잡히고 이들의 이용 형태에 따라 2명이 특정 사이트를 방문했다면 이를 다시 10으로 곱해 20명이 방문한 것으로 유추하는 방식이다.
각 조사기관별로 나름대로 공정한 기준을 정하고 있다고 주장한다.
우선 랭키닷컴은 일반적으로 쓰이고 있는 주별 순방문자수(Unique visits)가 아닌 시간당 방문자수(User session visits)를 가장 중요한 기준으로 삼는다. 시간당 방문자수는 해당 웹사이트에 방문한 방문자수를 순위산정의 기준으로 하되 한 시간이내 동일 사용자가 동일 웹사이트에 방문한 내역은 새로운 방문으로 인정하지 않아 순위산정에서 배제하는 방식이다.
인지도 높은 순위 사이트인 랭키닷컴은 이러한 조사 방식이 단순 페이지뷰(Page view)로 집계하는 데 따르는 왜곡 가능성을 줄이고 주별 순방문자수 조사에서 보기 힘든 충성도 고객 집계의 모호성을 해소하면서 좀더 충성고객의 트래픽을 공정하게 측정할 수 있다고 설명한다.
각 사이트들이 순위 자료로 자주 인용하는 매트릭스의 경우 패널은 RDD(Random Digit Dial) 방식을 적용하고 있다. RDD는 난수를 생성해 무작위로 대상자를 추출, 샘플링에서 발생할 수 있는 표본오차를 제거하는 방식으로 전화조사에서 흔히 이용되는 통계조사 방식이다. 이렇게 전화를 걸어 패널의 조건에 일치하는 대상자에게 조사협력을 의뢰해 로그트래킹 소프트웨어인 PcMeter와 함께 아이디와 패스워드를 발급하게 된다. 가구나 회사내에 동일 PC의 복수 사용자가 있는 경우에는 이용자를 지정해 데이터를 수집하기 때문에 패널 선정에 특히 신경을 쓰고 있다고 말한다.
온라인 광고대행사들이 자주 이용하는 코리안클릭도 마찬가지로 인터넷사용자실태조사를 기준으로 패널을 선정하는 방법으로 매트릭스와 비슷한 방식으로 패널을 선정해 트래픽 조사 툴을 사용자들이 이용하도록 한다. 단 신뢰성 유지를 위해 패널 참여의사를 자발적으로 표현하는 사람이나 보상 등을 바라고 일시적인 관심에 따라 참여하려는 사용자는 배제한다고 설명한다.
멀고 먼 '트래픽 공사 제도'
온라인 순위 조사 업체들의 고민은 바로 이 패널의 분포에 따른 조사 방식이 어느 정도의 신뢰도를 갖췄는지를 측정할 수 없다는 점이다. 일반적인 전화조사나 서면조사, 직접면담 조사 등은 사회통계학적인 연구가 오랫동안 진행돼 왔고 그 신뢰도 수준도 공개할 수 있지만 세 업체 어느 곳도 온라인 패널에 의한 조사에 대해 신뢰도 수준이나 오차 범위를 확신할 수 없는 상황이다. 이들 업체들도 순위 산정 방식에 대해 "절대적인 가치가 아닌 상대적인 가치로 자체 조사나 타 조사기관의 결과와 반드시 일치할 수 없다"는 점을 명시하고 있다.
온라인 광고 전문가들은 "자체 트래픽의 절대량이 공개되지 않는 상황에서 외부에서 실시하는 트래픽 순위에는 한계가 있다"며 온라인 사이트 트래픽도 신문잡지 출판부수 공사제도인 ABC 제도처럼 공사를 받아야 한다는 지적이 설득력을 얻고 있다.
반면 온라인 사이트들은 각 업체마다 트래픽 계측 기준이 다르고 기술적인 한계로 인한 트래픽 누락 부분 등이 많기 때문에 동등 비교할 수 없다며 트래픽 공시에 대해 부정적인 의견이다. 또한 포털 사이트처럼 메신저, 이벤트, 검색, 커뮤니티, 각종 1, 2차 링크서비스 등 다양한 트래픽 경로가 열려 있는 상황에서 전체 트래픽만으로는 그 사이트의 질이나 서비스 수준을 평가할 수는 없다고 말한다.
예를 들어 일부 사이트는 애드웨어나 광고 팝업 등을 통해 비정상적인 트래픽을 유발시키고 있으며 대대적인 홍보 이벤트를 시작했을 때의 일시적인 트래픽 상승효과가 빈번하게 일어나고 있다. 이른바 '트래픽 거품' 논쟁이 빈발하는 이유다. 결국 트래픽 측정의 표준이 마련되기 전까지는 외부 전문조사 업체들의 순위 선정에 의존할 수밖에 없다. 통계청이 사이트 순위를 공식적으로 집계할 수 없는 이유가 이러한 조사방법의 표준화 연구가 미진하기 때문이다.
각 사이트의 로그파일은 사업상 기밀이기도 하다. 기술적으로 온라인 트래픽 전량을 조사할 수 없는 상황에서 공식적인 순위 산정 등은 원천적으로 불가능한 것으로 볼 수 있다. 따라서 업체들의 순위 경쟁이 '그들만의 전쟁'이며 '마케팅 이슈' 정도에 그칠 수밖에 없는 이유가 여기에 있다. 어떤 사이트든 세가지 서로 다른 통계 가운데 유리한 것만 인용해 순위를 발표해도 언론이 발표자료에서 언급한 트래픽 조사에 대해 정확성을 검증할 수 있는 방법이 별달리 없는 것도 이런 이유다. @
http://www.zdnet.co.kr/itbiz/column/hot ··· 2C00.htm