프로덕트 분석

[AARRR] 그로스 해킹에서 지표를 잘 선택하고 활용하는 법

ISLA! 2024. 3. 2. 14:22

지표란?

  • 그로스 해킹은 결과적으로 ‘지표’에 관한 일
  • 지표의 속성에 따른 구분
    • 스톡(Stock) 형태의 지표 : "저장 지표"라고도 하며, 특정 지점의 스냅숏에 해당하는 지표
      • 누적 가입자 수, 누적 거래액, 레벨 1인 사용자 수 등
    • 플로(Flow) 형태의 지표
      • 시작과 끝에 대한 시간 범위가 존재하며, 일정한 시간 동안의 변화량을 나타냄
      • (예) 1월 1일의 가입자 수, 2월 1일 하루 매출, 일 평균 주고받은 메시지 수 등
  • 지표의 속성에 따라 지표를 모니터링하는 방식이나 대시보드 설계 등이 전혀 달라지므로, 핵심 지표를 선정하거나 그로스 실험의 성과를 측정할 때 지표를 정확히 구분해서 사용해야 함

 

지표를 명확하게 정의하기

🧐 모호한 지표는 모호한 액션을 이끌 수밖에 없다!

▶︎  지표의 조작정 정의

  • 같은 지표라고 해도 회사나 서비스마다 중요하게 생각하는 부분이 다를 수 있고, 더 적합한 측정 기준이 있을 수 있음
  • 따라서 이 단계에서는 "원칙"을 세우는 것이 필수 → 지표의 조작적 정의를 내리는 것이 우선 (Operational Definition; 객관적이고 측정 가능한 기준으로 기술한 정의)
  • 지표를 개선하기 위해서는 측정할 수 있어야 하고, 측정하기 위해서는 해당 지표에 대한 조작적 정의가 필요함

 

▶︎ 사례

✈️ 여행 관련 서비스 종합 플랫폼의 ‘cross-sell, 교차구매’ 비율을 높이는 것이 목표인 상황을 가정

 

  • ‘항공권을 예약한 사람이 호텔도 예약하면 크로스셀’이라는 개념적 정의는 비교적 쉬움
  • 하지만 크로스셀 비율을 정확하게 집계하기 위해서는 많은 경우의 수를 고려해야 함
    • 런던 항공권을 산 사람이 파리 호텔을 사면 크로스셀인가?
    • 1월에 런던 항공권을 산 사람이 7월에 파리 투어를 사면 크로스셀인가?
    • 런던 야경투어를 산 사람이 그다음 날 똑같은 투어를 하나 더 사면 크로스셀인가? 등..
  • 지표에 대한 조작적 정의를 하기 위해서는 이러한 질문을 바탕으로 ‘우리가 크로스셀이라고 판단하는 기준이나 원칙을 어떻게 세울 것인가?’에 대해 답할 수 있어야 함
  • 서로 생각하는 기준을 공유하고, 조율하고, 질문하고, 답변하는 과정을 통해 크로스셀 개념을 구체화하고, 결과적으로 모두가 공감하는 기준을 만들어야 진행 가능

허무 지표에 빠지지 않기

  • 좋은 지표가 가져야 할 조건 중 하나 : 그 지표를 바탕으로 행동할 수 있어야 함(actionable)
  • 이와 반대되는 지표 → 허무지표; vanity metric
    • 주요 허무지표 : 누적 다운로드, 누적 앱 설치, 누적 방문자, 페이지 뷰
    • 시간이 지나면서 자연스럽게 증가하는 지표 등 ; Stock 지표의 대부분이 이에 속함

전체 관점에서의 최적화

  • 지표를 개선하기 위한 행동이 부분 최적화가 아닌 전체 관점에서의 최적화에 초점을 맞춰야 한다는 점
  • 예를 들어, 단순히 클릭률이나 클릭당 단가(CPC; cost per click)라는 부분 최적화 지표에 매몰되면 안 됨
  • 클릭률이 아니라, 구매 전환 성과를 측정할 수 있는 ROAS를 기준으로 마케팅 성과를 판단한다면?
    → ROAS가 절대적 기준이 아니며, 계산 기준도 상황에 따라 달라짐
🎯 마케팅 성과를 전체 관점에서 측정하고 최적화하려면?
한 두 개의 지표 움직임으로 판단하는 것이 아니라 해당 마케팅을 통해 우리 서비스의 신규 고객 유치나 매출 상승에 어떤 효과가 있었는지 여러 시나리오와 지표를 바탕으로 종합적으로 판단하고 의사결정해야 함!

 

  • (예시) 페이스북 손 흔들기 기능 : 잘못 클릭했을 때 사용자가 불편함을 겪지만, 역으로 DAU를 높이고 메신저 기능을 사용하게 하긴 함
    → 과연 전체적으로 봤을 때 성공적인 기능인가?

심슨 패러독스(Simpson’s Paradox)

( 👉 심슨 패러독스만 다룬 별도 포스팅이 있습니다! 블로그 내에서 참고해 주세요 )

  • 전체 데이터를 놓고 보면 잘 드러나지 않는 특성들이 쪼개진 상태에서는 명확하게 드러나는 경우가 많음
  • 심슨 패러독스란 쪼개진 데이터에서 성립하는 관계가 합쳐진 데이터에서는 반대로 나타나는 현상
  • (위와 이어지는) 마이리얼트립 크로스셀 사례
    • 크로스셀에 대한 조작정 정의를 마치고 지표를 추적 → 점차 높아지다가 하락함(전체 데이터로 봤을 때)
    • 국가별로 쪼개서 본 크로스셀 비율은 대부분 꾸준히 증가 중이었음
    • 원인 : 크로스셀 비율이 높았던 일본 여행이 전체에서 차지하는 비중이 줄어듦(한일 외교 갈등 → 일본 불매운동)

대푯값을 사용할 때 주의할 점

[사례1]  💕 데이팅 서비스 리텐션 높이기 프로젝트

  • 가입 후 첫 한 달 이내 이탈 사용자가 많았음
  • 첫 가설 : “첫 한 달 동안 커플 연결이 안 됐기 때문에 싫어하고 나가는 사용자들이 많을 것이다.”
    → 데이터를 확인해 보니, 한 달 동안 평균 커플 연결 횟수 2.3회(가설이 틀린 걸까?)
  • 데이터 추가 확인
    • 이탈하는 대부분의 사용자는 한 달 동안 0회(절대다수)
    • 인기 있는 소수의 사용자만 많이 성공(평균 30회까지도 있음)
    • 결국,  데이터 분포가 매우 극단적 → 평균은 두 그룹 중 어느 쪽도 대변하지 않았음

 

[인사이트]

  • 즉, 데이터가 정규분포가 아니거나 아웃라이어가 있는 경우 → 평균은 그 데이터를 대표하지 못하는 경우가 많음
  • 분석 대상 데이터 세트에 아웃라이어가 있거나 분포를 알 수 없는 경우라면 중앙값(median)을 대푯값으로 사용하는 것을 적극 고려해 볼 필요 있음

 

[사례2] 🛫 여행자들에게 여행자보험을 추천하기에 가장 적합한 시기는 여행일로부터 며칠 전일까?

  • 여행자 보험 예약 시점에 대한 데이터 분석 : 평균적으로 여행일로부터 14일 전
  • 그래프로 확인해 보니, ‘평균’의 함정
    • 대부분의 여향자들은 여행 직전에 예약, 일부 소수의 여행자들이 여행을 한참 남겨두고 미리 예약

 

[인사이트] 대푯값을 정하기 전에 그 분포를 확인하는 것이 매우 중요!

  • 산점도(Scatter Plot), 상자-수염 그램(Box-and-whisker Plot)을 간단히 그려만 봐도 확인 가능
  • 데이터 분석을 할 때는 이런저런 분석 기법을 적용하기에 앞서 수집된 데이터의 구조와 형태, 분포 등을 다각도로 확인하는 EDA 과정을 충분히 거쳐야 함

생존자 편향(Survivorship Bias) 피하기 

  • 데이터 분석 전 꼭 체크해야하는 점 : 수집된 데이터가 분석하려는 목적에 적합한가? → Garbage In Garbage Out 방지!
  • (예1) 세계 2차 대전 당시, 귀환에 성공한 전투기의 데이터만 선택적으로 분석하면 잘못된 결론을 낼 수 있었던 사례
    분석 대상 데이터들이 편향성을 가진 채 수집되면 분석 결과를 신뢰할 수 없음

 

  • (예2) 항공권 예약과 호텔 예약의 크로스셀 분석을 위해서는 둘 중 하나만 예약한 고객이 아니라
     둘 다 예약한 고객 데이터만 분석해야함

 

 

 

---

본 포스팅은 도서 <그로스 해킹>을 참고하여 작성했습니다 👍 (도서를 직접 읽어보시는 것을 추천합니다)

https://product.kyobobook.co.kr/detail/S000001766457

728x90