본문 바로가기

전체 글339

그로스 해킹이란? (개념과 전제 조건) 그로스 해킹이란? 들어가기 전에, 관련 주요 개념 🎯 그로스 해킹 크로스펑셔널한 직군의 멤버들이 모여서, "핵심 지표"를 중심으로 실험을 통해 배움을 얻고 이를 빠르게 반복하며 제품이나 서비스를 "성장"시키는 것 목적 기반 조직에서 여러 직군이 치열하게 협업해야 함 (Cross-Functional Team) 린 스타트업 : 제품 개발 → 지표 측정 → 학습 및 개선 사이클을 빠르게 반복 최소 기능 제품(MVP : mininum Viable Product) 가설을 검증할 수 있는 최소한의 기능이 포함된 제품 AARRR : 고객 유치, 활성화, 리텐션, 수익화, 추천 → 5개 범주에 따라 주요 지표들을 모니터링하고 관리해야 함 그로스 해킹의 전제 조건 1. PMF(Product-Market Fit) : 제품.. 2024. 2. 28.
[Python] 티스토리 제목 썸네일 자동화 코드 위와 같이 간단하게 티스토리 포스팅 타이틀만 입력하면 썸네일을 만들어주는 코드를 공유합니다 ▶︎ PIL(Pillow) 라이브러리를 사용하여 이미지를 생성하는 함수 제목은 특정 길이를 초과할 경우, 자동으로 줄바꿈되어 표시된다 from PIL import Image, ImageDraw, ImageFont import textwrap def make_thumb(save_path, var_title): var_max_w = 500 # 이미지 폭 var_max_h = 500 # 이미지 높이 var_anchor = "mm" # middle, middle var_font_path = "....../NotoSansKR-Bold.otf" # 폰트 경로 var_font_size = 50 var_font_color = ".. 2024. 2. 21.
[회귀] 회귀 모델의 R2(결정계수)를 올리는 방법 결정계수가 낮은 원인을 세 가지 범주로 나누어 살펴본다 데이터의 특성과 분석의 목적에 따라 상황이 다를 수 있으므로 고려해야 할 범주를 기준으로 문제의 원인을 파악하고 적절한 조치를 취한다 1. 모델 문제 모델이 단순하거나 제한적일 경우 : 모델이 데이터의 복잡성을 충분히 반영하지 못할 경우 (예를 들어) 모델이 선형성을 가정하지만, 실제 데이터가 비선형 관계를 가지고 있는 경우 적합하지 않은 모델 선택 종속변수와 독립변수 간의 관계를 잘 나타내지 못하는 모델을 선택했을 경우 결정계수가 낮아짐 ▶︎ Solution 👉 다른 모델을 사용해 볼 것 : 선형 회귀, 릿지 회귀, 라쏘 회귀, 결정 트리, 랜덤 포레스트, 그라디언트 부스팅, 서포트 벡터 머신, 다항회귀 👉 다양한 모델을 시도하고, 교차 검증을 통.. 2024. 2. 21.
선형회귀와 다항회귀 (단순 비교) 🎯 선형회귀와 다항회귀에 대한 간략한 비교를 통해 둘의 개념과 차이를 명확히 알아본다 선형 회귀 (Linear Regression): 선형 회귀는 독립 변수와 종속 변수 간의 선형 관계를 모델링함 즉, 독립 변수의 변화에 따라 종속 변수가 선형적으로 변화함 모델은 일차 함수 형태인 직선으로 표현됨 >> 예를 들어 Y=β0​+β1​X와 같은 형태로 모델링됨 다항 회귀 (Polynomial Regression): 다항 회귀는 선형 회귀와 유사하지만, 독립 변수와 종속 변수 간의 관계를 다항식으로 모델링함 다항식 특징: 비선형 모델을 사용하지 않으면서도 일부 비선형 관계를 포착할 수 있는 방법 즉, 독립 변수의 변화에 따라 종속 변수가 비선형적으로 변화할 수 있음(비선형적 관계를 모델링 할 수 있음) 일반적으.. 2024. 2. 21.
[Marketing Data Analysis] 쿠폰 마케팅이란? 🎯 웹/앱 커머스에서 진행하는 프로모션 중 쿠폰 마케팅에 대해 알아보고 성과와 현황을 측정하기 위한 주요 기준과 지표를 알아본다. 쿠폰 마케팅이란? 잠재 고객에게 쿠폰을 배포하여 구매를 유도하는 판촉 전략 기업이 고객 기반을 늘리고 매출을 늘리며 브랜드 충성도를 구축하는데 효과적인 도구 주요 이점 신규 고객 유치 판매 증대 → 매출과 수익 향상 재고 정리 재구매 유도 → 고객 충성도 높이기 브랜드 인지도 구축 쿠폰 마케팅 전략 타겟 고객 이해 : 고객 인구통계, 구매 행동, 선호도를 분석하여 고객에게 가장 큰 매력을 줄 수 있는 할인 및 프로모션 유형 파악할 것 명확한 목표 설정 : 예) 매출 증대, 신규 고객 확보, 기존 고객 유지 등 고객 세분화 : 모든 고객에 대한 일괄 할인보다 관심 분야, 구매 .. 2024. 2. 21.
[회귀] 선형회귀와 결정계수(R-squaured) 선형 회귀 종속변수(매출, 만족도 등)의 차이가 어디에서 비롯되는지 알고자 할 때 사용하는 알고리즘 종속변수를 가장 잘 설명/예측(Best-fit) 하는 선형관계를 찾는 방법 1. 계산 방법 (Least Squares) y = b0 + b1 * x + error b0 : y축 절편(intercept)으로, 예측변수가 0일 때 기대 점수 b1 : 기울기 x가 한 단위 증가했을 때 y의 평균적인 변화 값 2. P-value(Probability-Values) 통계적 유의성을 나타내는 수치 : x, y 사이에 발견된 관계가 통계적으로 유의미한가 데이터를 통해 확인한 관계가 우연히 나왔을 확률 예를 들어, p값이 0.03이라면 x, y 사이에 선형적 관계가 없는데도 불구하고, 데이터 샘플링의 실수로 우연히 관계.. 2024. 2. 12.
[PostgreSQL] 10. 지속률과 정착률 한 번에 산출하는 쿼리(종합) 참고 지속률과 정착률은 모두 등록일 기준으로 n일 후의 행동을 집계하는 것이다. 따라서 등록일로부터 n일 경과하지 않은 상태라면 집계가 불가능하다.(1일 ~ 7일과 같은 단기간 지표를 활용하는 이유) 정착률은 7일 동안의 기간을 집계하므로, 실제로 며칠 사용했는지는 알 수 없다. 종합 쿼리 정착률을 계산하기 위해 만들었던 repeat_interval 테이블의 형식을 수정하면 지속률까지 계산할 수 있다. WITH repeat_interval(index_name, interval_begin_date, interva_end_date) AS ( VALUES ('01 day repeat ', 1, 1) , ('02 day repeat ', 2, 2) , ('03 day repeat ', 3, 3) , ('04 d.. 2024. 2. 4.
[PostgreSQL] 9. 매일의 N일 정착률 추이 확인하기(종합쿼리 포함) N일 지속률과 N일 정착률의 추이 n일 지속률과 n일 정착률을 따로 집계하면 등록 후 며칠간 사용자가 안정적으로 서비스를 사용하는지, 며칠 후에 그만두는 사용자가 많아지는지 등을 알 수 있다. 만약 지속률이나 정착률이 극단적으로 떨어지는 시점이 있다면, 해당 시점을 기준으로 공지사항 등을 전달하거나 N일 이상 사용한 사용자에게 보너스를 주는 등의 대책을 수행할 수 있을 것이다 ✨ 이번 포스팅에서는 지속률에 이어 정착률을 확인할 수 있는 종합 쿼리를 작성해본다 매일의 N일 정착률 추이 👉 지속률과 마찬가지로, 대책이 의도한 대로의 효과가 있는지 확인하려면 정착률을 매일 집계한 리포트가 필요하다 👉 참고로 7일 정착률이 극단적으로 낮은 경우에는 정착률이 아니라 '다음날 지속률' ~ '7일 지속률'을 확인해서.. 2024. 2. 4.
[PostgreSQL] 8. N일 후 지속률 산출하기(종합쿼리 첨부) 🎯 등록 시점을 기준으로 일정 기간 동안 사용자가 지속해서 사용하고 있는지를 조사할 때 지속률과 정착률을 사용하면 경향을 쉽게 파악할 수 있다. 지속률과 정착률이란? 지속률 : 등록일 기준으로 이후 지정일 동안 사용자가 서비스를 얼마나 이용했는지 나타내는 지표 등록일 이후 매일 서비스를 사용하지 않더라도, 판정 날짜 안에 사용했다면 지속자로 취급함 집계 방법 : 등록자와 사용자 수를 집계하고, (사용자 수 / 등록 수) 로 구한다. 정착률 : 등록일 기준으로 이후 지정한 7일 동안 사용자가 서비스를 사용했는지 나타내는 지표 7일이라는 기간 동안 한 번이라도 서비스를 사용했다면 정착자로 다룸 7일 정착률은 등록 후 1일부터 7일까지의 정착률을 기준으로 산출함 14일 정착률은 이후 7일(등록일부터 8일 후부.. 2024. 2. 1.
728x90