Skip to content

Posts 데이터로 쉽게 사람들을 이롭게 하기(5) #
Find similar titles

(그간 격조했습니다. 글 쓰는 곳을 옮기기도 했고 연말 연초라고 개인사로 쓸데없이 정신없던 바람에...기존 글들은 여기에서 볼 수 있습니다.)


앞에서, 지표란 것도 결국은 기존의 '현상'을 '손쉽게' 확인하고자 하는 것이므로 '현상을 쉽게 확인하는 방법'인 신문 기사의 관점을 따라 5W 1H의 항목을 드러내야 한다고 했고, 이에 따라 Why/What/Who/When의 관점에서 지표를 살펴보았다.

그러면 (앞 글에서도 언급했지만) 이번 글에서는 자연스럽게 지표의 Where/How를 살펴볼 것이라는 것을 알 수 있다. 우선 Where의 관점을 보자. 지표에서 '웬 위치?'라고 의아하게 생각할 수도 있겠지만, 여기서 Where는 지표에서 다루고자 하는 범위다. 이 범위는 굉장히 중요하며, 지표 뿐만이 아닌 모든 데이터 분석 및 통계에서 기본이 되어야 하지만 사람들이 종종 잊고 살아서 모호하게 다루어서 통계를 사기학으로 만드는데 크게 일조하는 부분이기도 하다. 예를 들어, 특정 웹사이트의 UV(User Visit. 방문자수)를 계산한다고 해보자. 이 웹사이트는 데스크탑에서 접속할 수 있지만, 모바일 앱으로도 접속 가능하다. 물론 기본적인 웹사이트 활성화 확인을 위해 전체의 UV를 볼 수도 있지만, PC버전 웹에는 얼마나 접속을 하는지, 혹은 앱으로 접속하는 사용자의 증감 추이를 보고자 할 수도 있다. 이런 경우에는 앱 UV, PC버전 UV를 따로 나누어서 봐야 한다. 특히 PC버전과 앱 버전의 사용성 평가 등이 필요할 경우에는 이 둘을 나누어서 봐야 한다. 당연한 이야기라고 생각할 수 있겠지만, 실제로 이 것이 잘 이루어지지 않고 그냥 전체 UV가 올랐다고 '우리 사이트의 사용성은 괜찮구나' 하고 넘어가는 경우도 다반사다. 실제로는 PC버전 사용성이 엉망이라 사용자가 다 앱버전으로 넘어갔는데도 말이다. 앞에서 말했던 'What'을 잘 고려하여 이 'What'이 어느 '범위'안에서 이루어지는 지를 파악하고 이를 명확하게 정의해야 한다.

마지막은 'How'다. 사실 이 부분이 가장 어렵고, 다루고 싶은 이야기도 많았고, 내가 가장 집중하는 부분이자 가장 언급하기 힘들었다. 이 시리즈를 다 읽으신 분들 중에는 서론에서 언급한 'Magic Number'관련 이야기를 기억하시는 분도 있을 것이다.(있다고 해주세요.엉엉.) 이런 'Magic Number'는 모든 지표 관련 사람들에게는 꿈이자 로망이며, 그만큼 쉽지는 않다. 하지만 이에 대해서 지속적으로 나를 비롯하여 나보다 이 쪽에 대해서 더 해박하거나 경험이 많으신 분들이 같이 고민을 하고 있다. 일단 이에 대해서 가장 간단하면서 이해하기 용이하게 생각할 수 있는 것은,보고자 하는 항목들을 쭉 정리한 후 이를 최소화한 후 이에 대해 구조방정식을 생성하여 최소한의 수치로 만드는 것이다. 이에 대한 프로세스는 간단하게 다음과 같다.

  1. 우선 보고자 하는 항목들을 쭉 나열한다.
  2. 이 항목들에 대해 상관성을 확인해서 상관성이 높은 항목을 제거한다.
  3. 남은 항목들(m)에 대한 중요도(g)를 수치화한다.
  4. 항목들에 대한 중요도를 가중치로 사용하여 간단한 구조방정식을 생성하여 하나의 수치로 정리한다. $$ \sum_{\substack{i=1...n}}m_i g_i $$

물론 이 방법이 간단하고 사람들에게 이해시키기도 쉬워서이기도 하지만 이 방법을 기껏 생각해서 사람들에게 설파했는데 관련해서 더 찾아보니 이미 많이 사용되고 있는 방법이라고 한다.orz 대표적으로는 요즘 잘 나가는 Lean 방법론에서 분석 관련한 토픽으로 다루고 있는 OMTM(One Metric That Matters)이 있다. 이 외에도 많은 연구가 요즘 왕왕 나오고 있어서, 찾아보다가 나는 무슨 삽질을 하는 것인가 하는 생각이 들어 그냥 깨갱하면서 도망가기로 했다(...부끄럽고요). 관심 있으신 분들은 구글링해 보시면 많이 나올 것이라. 이거 관련해서 찾아서 읽고 있자니 난 이런 걸 왜 생각하고 왜 쓰고 있었나 싶은 지경이다. 이래서 역시 아는 것이 힘이고 많이 듣고 많이 읽어야 한다. 다만 위안이라면 내가 하는 고민을 다들 많이 하고 있고 언제부터인가 내가 생각하고 고려하는 것은 항상 트렌드가 된다는 것. 이래서 생각하는 것들에 대해서 빨리 정리해서 약을 팔아야 하는데 이번 지표도 그렇지만 늘 타이밍을 놓친다. 행동력과 약파는 기술이 승리한다. (결론은 산으로)

데이터에 대한 관심도 늘어나고, 데이터 기반의 의사 결정 방법론에 대한 관심 및 의지도 늘어나면서 데이터의 요약과 지표가 점점 중요해지고 있다. 굳이 데이터 전문가가 아니더라도 '의사 결정'을 위해서 데이터를 보다 많은 사람들이 널리 사용하기 위해서는 '신뢰성 있는' '쉬운' '간결한' 정보로 데이터를 정제해서 제공하는 것이 필요하다. 그리고 이를 위해서 '지표'를 사용할 수 있다. 그만큼 지표의 중요성은 높아져가고, 이를 잘 만드는 것의 중요성 또한 높아진다. 빅 데이터니, 데이터 과학이니, 하면서 무언가 기술적으로, 정교하게 접근하는 것도 물론 필요하지만, 데이터 기반의 의사 결정, 데이터 기반의 시대가 보다 손 끝에 가까워져 오고 있는 지금 오히려 더 필요한 것은 이런 데이터를 쉽고도 믿을 수 있게 만들어서 사람들을 널리 쉽게 데이터와 친숙하게 만들고, 이를 통해 궁극적으로 이롭게 하는 것이 아닐까.


Data

Incoming Links #

Related Articles #

Suggested Pages #

Other Posts #

0.0.1_20140202_5