Web Analytics

당신이 인터넷 회사에서 근무하고 있거나, 당신의 회사가 웹사이트를 운영하고 있다면 십중팔구 “사이트 통계”와 관련한 아래와 같은 논쟁을 접한 적이 있을 것이다.

1.웹사이트 통계의 정확성과 각 인덱스의 정의에 대한 논란
2.웹사이트 통계가 리포팅 되는 시점 및 기간에 대한 논란
3.웹사이트 통계의 측정, 분석, 보고 책임 소재에 대한 논란

인터넷이 우리에게 한 약속 중의 하나가 바로 “고객에 대한 정확한 설명력”이었던 것과 이것을 근거로 광고주들을 설득하며 광고 매출을 올렸던 지금까지의 모습을 생각하면 이런 주제들이 아직도 인터넷 전문 기업 내에서 논란거리로 남아있는 것은 어찌 보면 직무유기가 아닐까?

오늘은 웹사이트 통계와 관련한 문제들에 대하여 David & Danny의 입장을 한번 정리해보는 시간을 가지고자 한다.

Web Analytics for Internal Usage

먼저 웹사이트 통계의 종류를 확인해보자.
1.웹트래픽 분석 툴 설치 위치에 의한 분류:

A.내부 통계: 특정 웹사이트 운영자가 내부 시스템에 웹트래픽 분석 툴을 설치하여 특정 웹사이트에 방문한 유저들의 웹 이용 패턴을 수집, 분석하여 얻은 통계

B.외부 통계: 웹트래픽 분석 툴 클라이언트 프로그램을 고객의 인터넷에 접속 디바이스 측에 설치하여 고객들이 일정기간 동안 접근한 모든 웹사이트에 대한 정보와 유저들의 웹 이용 패턴을 수집하여 웹트래픽 분석 툴 서버로 전송하고 서버가 이를 분석하여 얻은 통계

2.표본의 범위에 의한 분류:

A.실측 통계: 실제 웹트래픽 분석 툴을 통해 확보한 유저들의 이용 패턴 정보만을 분석하여 얻은 통계.

B.추정 통계: 전체 인터넷 사용자 인구 분포 및 구성을 지역별로 연령별로 전화조사, 면접조사 등의 통계실측 기법을 통해 확보하여 이를 기반으로 웹 트래픽 분석 툴의 설치 모델을 설계하고 약 일천 명에서 오천명정도의 패널을 운영하여 얻은 정보를 기반으로 전체 인터넷 이용자들의 웹 이용 패턴을 추정하는 방식으로 얻은 통계

여기서는 마치 여러 개의 웹사이트 통계가 있는 것으로 보이지만 실제로 인터넷 기업 입장에서 보면 두개의 통계 시스템이 있을 뿐이다. 하나는 웹 분석 툴을 내부 시스템에 설치해서 얻은 자사 웹사이트의 이용자 행태 정보를 제공하는 “실측통계 시스템”이고 둘째는 외부의 패널형 웹 통계 전문회사를 통해 자사 뿐만 아니라 외부 타 사이트 나아가 전체 인터넷 이용자 패턴에 대한 정보까지를 제공하는 “웹패널형 추정통계 시스템”이다.

실제의 경우에서 이 둘은 결코 하나가 다른 하나를 대체할 수 없는 상호 보완적인 관계를 갖는다. 오늘 글에서 웹사이트 통계라고 할 때는 방금 설명한 “실측통계 시스템”과 “웹패널형 추정통계 시스템” 모두를 지칭하는 일반적인 용어라고 하자.

웹사이트 통계와 관련한 논란에 대해 이야기하기 전에 당신에게 “웹사이트 통계 결과를 어디에 활용하고 있는가?”라고 묻는다면 어떻게 대답할 것인가?

A.연초에 수립한 트래픽 목표달성 여부를 확인하는데 사용한다.
B.각 채널별 담당자의 트래픽 목표 달성 여부를 확인하고 이를 고과와 연결하는데 사용한다.
C.각 채널별 트래픽 특성과 채널별 광고 판매 실적 혹은 상거래 실적의 관계를 분석하고 이를 다시 채널 기획에 활용한다.
D.프로모션 이벤트의 성과를 측정하기 위해 사용한다.
E.다른 경쟁 웹사이트와의 비교를 통해 회사 전체의 서비스 전략을 수립하는데 활용한다.

만약 당신이 위에서 말한 모든 목적들 위해 이미 웹사이트 통계를 활용하고 있다면 더 이상 이 글을 읽을 필요가 없다. 하지만, 당신이 그렇지 못하다면 이 글을 더 읽어야 할 충분한 이유가 있다고 David & Danny는 생각한다.

당신이 이렇게 생각하고 있을지 모르겠다.“이런 목적으로 웹사이트 통계를 사용해야 한다고는 생각하지만, 실제로는 매일 매일의 일이 너무 많아서 이런 웹사이트 통계에 시간을 쓰고 있지 못하고 있다.또한 그런 통계를 적극적으로 이용하려 해도 실제로 이런 목적에 활용하기에는 사내 시스템이 너무 형편 없다.”

결론부터 이야기 한다면 당신이 채널 담당자이든, 엔지니어이든, 팀장이든, 경영자이든, 웹사이트 통계 시스템은 바로 당신의 분명한 사용목적에 의해 성공적으로 회사에 구축될 수 있고, 현재 회사의 시스템이 형편 없다고 느낀다면 그것은 당신회사의 엔지니어의 무능력이 원인이 아니라 그런 통계가 필요 없게 사업을 진행하고 있는 바로 당신이 원인이다.

분명한 사용목적과 필요가 존재하고 나서야 웹사이트 통계 시스템의 좋고 나쁨을 논하는 것이 의미를 갖는다.보지도 않고 활용도 않을 웹사이트 통계라면 좋든 나쁘든 그것이 무슨 상관이 있냐는 말이다.

1.웹사이트 통계의 정확성과 각 인덱스의 정의에 대한 논란: 당신회사가 “실측통계 시스템”를 쓰던 “웹패널형 추정통계 시스템”을 쓰던 아니면 둘 다를 쓰고 있던, 이런 논란은 인터넷 기업에서 자주 볼 수 있는 전형적인 통계와 관련한 논쟁인데, 이런 논란이 최악으로 흐르는 경우는 웹사이트 통계를 담당하고 있는 엔지니어와 기획자가 회사 최고위층 경영진 앞에서 이런 주제를 가지고 회의를 할 경우에 종종 나타난다.

이런 포맷의 회의에서는 대개 현재의 회사 통계 시스템은 곧 갈아 엎어야 할 최악의 시스템이라는 결론에서 회의 참가자들의 의견이 모아지고 새로운 통계 시스템을 만들 TF를 만들자는 결론이 나오면서 회의가 끝이 난다.그런데 더 큰 문제는 새로 만들어지는 통계시스템에 대해서 TF이외에는 아무도 관심을 갖지 않는 다는 것이고 모두들 회의적인 태도를 갖는다는 것이다.

정확한 통계 결과는 중요하다. 하지만, 사용목적과 통계의 정확성을 높이기 위해 투자해야 하는 시간과 돈을 생각하면 통계의 정확성을 높이기 위한 노력보다는 당신 회사에서 사용하는 통계 인덱스에 대한 정의를 신속하게 확정하고 이를 활용할 전사 담당자들과 같이 공유하고 활용을 장려하는 것이 그 무엇보다 중요하다.

대부분의 솔루션이 이미 거의 유사한 정도의 정확성을 가지고 있고, 시스템이 제공하는 인덱스가 유사한데도 이런 논란을 하면서 힘을 뺄 이유가 없는 것이다. 그런데 쓸 힘이 있다면 당장 당신 회사의 시스템이 허용하고 있는 부정확성의 허용 범위를 쉽게 정리해서 모두와 공유하고 각 인덱스의 의미를 정리해서 언제나 쉽게 볼 수 있는 Glossary를 만들어 배포하라.

다시 한번 말하지만, 가장 중요한 것은 사용목적과 활용이지 정확성 자체가 아니다.

2.웹사이트 통계가 리포팅 되는 시점 및 통계 기간의 문제: 이 문제는 “실측통계 시스템”과 관련해서 자주 일어나는 문제이다. 당신의 사이트가 특히 대형 포탈이라면 이 문제는 특히 심각하다. 각 채널별로 하루치의 로그나 패킷을 분석하는 것은 시간에서나 시스템 투자에서 큰 문제가 없는 경우가 대부분이다.

하지만, 1천만 명 이상의 유저를 가진 포탈이 사이트 전체의 1주 혹은 1개월간의 순 방문자 및 그 이용 패턴을 분석하려고 한다면 이것은 시스템 투자의 문제와 함께 처리 시간의 문제를 만들어 낸다.

작은 사이트 규모 였던 초기부터 착실하게 내부 통계 시스템을 확장하고 업그레이드 해왔다면 별문제가 없겠지만, 이미 상당히 커진 웹사이트를 위해 시스템을 마련한다면 상당한 투자를 각오해야 할 것이다. 그리고 처리 시간의 문제도 만만치 않은데, 채널 하나의 전날치 데이터를 처리하는 것이야, 빠르면 1시간 이내에도 가능하지만, 전체 사이트의 한 달치 데이터를 처리한다면 실제로 몇 일이 걸릴지 장담하기 어려운 문제이다.

이럴 경우 우리는 과연 한 달치 결과를 보름이 지나서야 보는 것이 일주일치를 다음주가 수요일에 보는 것이 정말 의미가 있는지 생각해볼 필요가 있다.

여기서도 가장 중요한 판단 기준은 우리가 얻으려는 통계를 무엇을 위해 사용할 것이고 누가 사용할 것인가 하는 것이다. 대개 일 통계의 경우는 담당 기획자들이 아주 상세한 수준으로 요구하는 경우가 많고 월 통계라면 팀장급 이상의 회사 경영진들이 회사의 대부분의 트래픽을 만들어내는 상위 채널들에 대한 추세 정보와 사이트 전체의 정보를 보기위해 요구하는 경우가 대부분이다.

만약 요구가 이렇다면, 일”이나 “주” 통계는 “실측통계 시스템”을 사용하고 “월” 통계는 “웹패널형 추정통계 시스템”을 사용하는 것이 훨씬 합리적이지 않을까? 물론 양 시스템 인덱스 정의의 차이를 미리 확인하고 분석할 채널들을 그룹으로 분석할 요구가 있을 경우 분류 기준을 맞추는 작업이 미리 해야 할 작업이 될 것이다. 두 시스템 모두를 적절한 상태에서 균형을 맞춰 활용하는 것이 더 정확한 좋은 설비를 갖추는 방식에 비해 훨씬 좋은 ROI를 보장한다.

3.웹사이트 통계의 측정, 분석, 보고 책임 소재에 대한 논란: 또 하나 자주 듣는 논란 중의 하나는 바로 웹사이트 통계 측정, 분석, 보고의 책임을 누가 지느냐 하는 문제이다. 대개 웹사이트 통계 시스템의 구축과 운영은 사내의 개발팀이 진행을 하는 경우가 많고 이를 통해 통계를 리포팅을 하는 것은 기획자들 중에서 하는 경우가 많다.

그런데, 문제는 바로 회사에서 이런 통계 리포팅을 하는 것을 공식석상에서는 모두들 중요한 일이라고 말은 하면서도 실제로는 아무도 하지 않으려는 하찮은 일로 여겨지는 경우가 다반사라는 데에서 출발한다. 그도 그럴 것이 이런 통계 리포팅 업무는 이 업무만을 전문적으로 하는 사람을 두는 것이 아니라 대개 다른 업무를 맞고 있는 기획자에게 덤으로 일을 맡기는 경우가 많기 때문이다. 물론 작은 사이트를 운영하고 있는 상황이라면 이렇게 하는 것이 어쩔 수 없는 일일 수 있다. 하지만, 포탈 혹은 전문 보탈 사이트라면 이야기가 다르다.

글의 앞 쪽에서 열거한 다섯 가지의 활용 목적 이외에도, 구축하기 위해서 수 억원의 투자를 했고. 이 시스템을 이용해서 지속적으로 사이트를 더욱 효율적으로 만들기 위해, 더욱 많은 이용자들이 좋아하는 사이트로 만들기 위해서 튜닝 하려 한다면 우리는 이 시스템의 활용에 좀더 진지한 태도를 가져야 할 필요가 있지 않을까?

간단하게 말해서 이 통계 시스템의 결과치의 의미를 분석하고 배포하고 개선 방향 등을 지속적으로 사내에 공유 시키는 일을 전체 업무로 하는 담당자를 선정하라는 것이다. 좋은 웹사이트 통계 시스템은 쉽게 만들어 지는 것이 아니고 또 좋은 시스템을 가지게 되었어도 이를 잘 활용하게 되는 것은 또 전혀 다른 의미이기 때문이다.

오히려 비용을 걱정한다면 이 통계 시스템에 투입한 기술 인력의 수를 줄이는 것이 오히려 현명하다. 최초 구축에 개발 인력이 참여하는 것은 당연하나, 이후 통계 시스템을 운영하고 리포팅하는 것은 통계 처리 등에 익숙한 기획자들이 맞는 것이 회사 입장에서 훨씬 생산적이다.

지금까지 회사 내부 사용을 위한 웹사이트 통계와 관련한 논란들에 대한 David & Danny의 입장을 정리해봤다.

Web Analytics for External Usage

이제부터는 또 다른 웹사이트 통계의 의미인 매체력 지표 측면에서의 웹사이트 통계문제를 살펴보자. 이런 의미에서의 웹사이트 통계는 사내가 아닌 회사 외부의 이용자들을 위한 통계라고 할 수 있다.

대부분의 웹사이트들은 자사의 웹사이트 통계 시스템(내부 실측 통계 시스템과 광고서버)을 통해 확보한 통계를 광고주들에게 제공한다. 하지만, 이런 자료들은 광고주들의 입장에서 보면 상당히 주관적인 자료이고 해석도 주관적이라고 생각하게 마련이다.

이렇기 때문에 광고주들이 매체를 선정 할 때 객관적인 매체력 통계를 필요로하는 것이다. 인터넷 매체들의 입장에서 보면 이런 일을 하기에 가장 접한 것이“웹패널형 추정 통계 시스템”이라고 볼 수 있으나, 현재의 웹패널형 추정 통계는 광고주들의 인정을 받기에는 여러면에서 부족함이 많다. 아마튼, 이런 신뢰할 만한 인터넷 매체력 통계 서비스의 유무는 인터넷 매체에 대한 광고주들의 신뢰성의 향상과 직결되는 중요한 문제라고 볼 수 있을 것이다.

해외의 경우 실제로 대부분의 매체들은 업계 안에 자신들의 매체력을 공정하게 측정하는 공인 기관들을 가지고 있다. 1999년과 2000년 포탈들끼리 벌인 페이지 뷰 논쟁은 결국 국내에서 객관적이고 권위있는 기관이 없자, 결국은 외국 기관에 의뢰를 하고서도 여러이유로 결론을 내지 못하고 흐지부지 막을 내렸다. 이런 일을 떠올려 본면 국내에 이런 공정한 매체력 측정 기관이 얼마나 중요한 지 바로 이해가 될 것이다.

2002년 현재 인터넷 업계에서 누가 1위인지 2위인지를 측정하는 것은 실상 의미가 없어져 버렸다. 이유는 분명하지 않은가. 그런데 이런 공인 매체력 측정 기관들이 하는 또 한가지의 중요한 일이 바로 해당 매체와 타 매체간의 매체력을 비교하여 이종 매체에 비해 얼마나 해당 매체가 영향력이 큰지를 다양한 방법으로 광고주들에게 설득하는 일이다. 어찌보면 이 일이 더욱 크고 중요한 일이 아닐까?

인터넷 광고 시장에서 현재 상위를 차지 하고 있는 다음, 야후, 네이버, 라이코스 같은 포탈이나 필름2.0, 엔키노 같은 보탈이 실제로 싸우는 상대는 타 경쟁 포탈이나 경쟁 보탈이 아니다. 오히려 이들이 싸우는 상대는 인터넷 매체에 광고주를 뺏기지 않으려는 기존 유력 매체들이다.

인터넷매트릭스의 Internet Index에 의하면 지난 2002년 5월말 현재의 전체 인터넷 이용자의 수가 주간 단위로 2천만 명을 넘어서고 5월 한 달을 기준으로는 2천5백만 명에 이고 있다고 한다.그리고 KRNIC의 자료에 의하면 2002년7월말 현재 케이블과 ADSL을 통한 인터넷 접속 가구수가 877만호라고 한다.

이 정도의 수치라면 TV를 제외한 다른 매체들이 충분히 심각한 걱정에 빠지기에 충분한 수치다.바로 이런 상황에서 인터넷의 각 매체들이 먼저 신경을 써야 하는 부분은 바로 인터넷 광고에 대한 광고주들의 신뢰를 만들어 내어 미래의 4대 매체라고 불리는 인터넷 미디어 광고 시장을 최소한 TV에 버금가는 광고시장으로 만드는 장기적인 공동의 노력을 업계 전체로부터 끌어내는 것 이어야 한다.

Conclusion

먼저 상위 10개 웹사이트와 정보통신부가 모여 미국의 Interactive Advertising Bureau와 같은 인터넷 광고 시장을 대표하는 기구를 만들라.
이런 기구는 초 대형 광고주들에게 먼저 접근하여 인터넷이 이미 TV를 제외한 대부분의 매체의 매체력을 앞서고 있다는 것을 알리고 다양한 방식의 연구와 성공 사례를 공인된 방법론을 가진 컨설팅 회사 및 광고주 그리고 매체와 손을 잡고 만들어 나가야 한다.

둘째로는 광고 매출 상위 인터넷 업체들이 모여 각 사이트간의 공정한 비교가 가능하도록 업계 공통의 매체력 인덱스를 결정하라.가능하다면 각 사이트별의 유사 서비스를 그룹으로도 비교가 가능하도록 그룹핑 기준도 공동으로 정해야 한다.

끝으로 광고 매출 상위 인터넷 업체들이 모여 특정 “웹패널형 추정통계” 서비스 사업자를 인터넷 매체력 측정 대표기관으로 결정하거나 공동으로 그런 업체를 설립하라. 물론 각 웹사이트와 정부가 공동으로 월 일정액을 “웹패널형 추정통계” 서비스 사업자에게 정식으로 지급 해야 한다. 만약 특정 “웹패널형 추정통계” 서비스 사업자가 많은 사업자를 이렇게 동시에 확보 할 수 있다면, 이 사업자는 당연히 더욱 좋은 서비스를 각 웹사이트 고객들에게 제공할 수 있게 된다.

그리고 각 웹사이트들은 또한 “웹패널형 추정 통계” 서비스 사업자에게 현재 보다 더 많은 패널을 확보해서 공정성을 더욱 높이라고 요구할 수도 있고 OLAP과 같은 고급 기능도 제공할 것을 요구 할 수 있다.

이런 일련의 노력이 향후 지속적으로 계속된다면, 분명 많은 중소형 인터넷 업체들도 이런 노력에 동참하게 될 것이고 자연스럽게 “웹패널형 추정통계” 서비스 사업자도 대형화하면서 성장 할 수 있게 될 것이다. 하지만, 이런 일을 통해 결국 가장 큰 혜택을 입는 당사자는 인터넷 광고 시장의 상위 업체들이 될 것이다.

이런 이유 때문에 당신이 상위 포탈에 다니고 있다면 그리고 계속해서 당신의 회사가 인터넷 광고시장에서 큰 매출을 올리기 원한다면 적극적으로 이런 제안을 당신 회사내부에 해야 한다고 David & Danny는 생각한다.

결론적으로 David & Danny는 웹사이트 통계의 올바른 내부 활용 증대와 공정한 웹 사이트 매체력 측정 시스템 정착을 통한 인터넷 업계 전체에 대한 광고주의 신뢰확보가 결국은 우리 대한민국 인터넷 산업을 좀더 객관적인 근거에 기반 한 합리적인 경영 판단이 주를 이루는 선진적인 산업으로 만들어 주게 될 것이라고 믿는 것이다. 2002/08/20

More from Danny
Google(구글 검색)의 BERT 알고리즘 업데이트가 가지는 의미
자연어 처리를 위한 알고리즘의 하나였던 BERT가 지난 10월 25일 주간에 구글 알고리즘에...
Read More
Leave a comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

2 × 1 =