본문 바로가기

분류 전체보기339

[Google Cloud Platform] Colab 과 BigQuery 연동 초기 세팅 코랩에 접속하여 다음 코드를 입력 사용자 인증에 관련된 것 from google.colab import auth auth.authenticate_user() 데이터 가져오기 공식문서 참조 : https://pandas.pydata.org/docs/reference/api/pandas.read_gbq.html 프로젝트 아이디 확인하여 복사 위에서 복사한 프로젝트 아이디를 아래 코드와 함께 작성 GCP에 로드한 데이터셋과 쿼리 결과가 잘 나오는지 확인 import pandas as pd project_id = 'mulcamp2310-402300' sql = ''' SELECT * FROM `mulcamp2310-402300.project_dataset.iris` LIMIT 1000 ''' df =.. 2024. 1. 14.
[BigQuery] 현업 문제 해결 쿼리 작성(4) : 성과 확인(A/B test) 성과 확인 target : 서비스에 행한 변화가 유저의 행동에 어떤 변화를 주었는가 👉 서비스에 적용한 변화가 기업이 원하는 목표(지표)를 달성하게 하였는가 적용한 변화 : 공고 카드에 '스킬셋' 노출 어떤 유저들이 변화의 대상인가 : 공고 페이지에 들어오는 모든 유저 예상되는 행동 변화 : 공고 카드를 더 많이 클릭할 것 문제1. 배포 전 대비 배포 후 성과를 평가해보자 👉 일별 전환율을 확인 with를 써서, jdlist 에 진입한 유저와 jd에 진입한 유저를 날짜별로 구분해서 구한다 WITH jdlist AS( SELECT DATE(timestamp) AS date, session_id FROM wanted_sample_data.project_log WHERE event_name = 'jdlist_.. 2024. 1. 14.
[Sales Analytic Dashboard] #5. Sales Sparkline(전년 동월 매출 표시 추세선) Sales Sparkline 매출의 년/월별 추이를 살피고, 가장 최근 월 기준 과거의 동월 값을 '원'으로 표시한다 🧑🏻‍💻 Sales Sparkline 1. 시작하기 행 선반에 order date 올려두고, 연속형(월)로 변환 열 선반에 Sales 올려두기 >> 머리글 표시 해제 하단 머리글 표시도 해제 2. 가장 최근 월과 전년도의 동월 표시 계산된 필드 만들기 : Datepart Month Datepart Month를 열 선반에 올리고, '연속형(월)' 타입으로 변경 Datepart Month 마크는 '원'으로 바꿔주기 3. 원의 색상을 구분해주기 원을 가장 최근월과 / 이전 월들로 구분하기 위한 계산식 필드 생성 Sales Spark Color 계산식 : 가장 최근 날짜의 시작 '월'을 날짜로 .. 2024. 1. 13.
[Sales Analytic Dashboard] #4. KPI 배너(가장 최근 월, 전월 대비 성장률) 다음과 같이 전월 대비 상승/하락율을 보여주는 배너를 만들어보자. 🧑🏻‍💻 SALES 배너 만들기 1. Max Month 계산 필드 만들기 가장 최근 날짜의 '월'을 기준으로 true/False를 반환하는 계산식 행 선반에 위에서 생성한 Max Month를 추가 Order Date를 option(mac기준) 키를 잡고 행 선반에 드래그, 년/월 선택 Sales를 더블클릭 Sales를 복사해서 세부정보(마크카드)에 추가 세부정보에 추가한 Sales 카드 우클릭 >> 퀵 테이블 계산 >> 비율 차이 세부정보를 >> 텍스트 타입으로 변경 테이블 계산 편집 >> 특정 차원 >> 모든 컬럼 선택 전체 기간 범위를 다 고려하기 위해 '모든 컬럼 선택' 👉 전월 대비 증감률이 나타남 테이블에서 '거짓' 부분 숨기기 .. 2024. 1. 13.
[Sales Analytic Dashboard] #3. Top N Customers 🎯 가장 많이 구매한 N명의 고객 다음과 같이, 가장 많이 구매한 n명의 고객을 확인하는 시트를 만들어보자 1. 시작 행 선반에 Customer Name 끌어다 놓기 순위 지정을 위해 index() 함수를 행 선반에 추가 >> 불연속형 >> 테이블(아래로) index() 함수 탭을 command를 누른상태에서 왼쪽 데이터 패널로 드래그 >> 계산식에 추가됨 계산식 편집 >> 이름을 RANK로 바꿔주기 2. 고객 주문수 만들기(계산된 필드) 계산된 필드 만들기 >> 필드명 : Orders by Customer 고객명 고정 상태에서 count(주문 번호) 지정 만들어진 Orders by Customer 를 행선반에 추가 >> 불연속형으로 변경 서식 >> 기본값/숫자 >> 숫자(사용자 지정) >> 다음 이미.. 2024. 1. 13.
[Sales Analytic Dashboard] #2. Profit by Sub-Category & Region 🎯 하이라이트 그래프 다음과 같이 리젼(지역)별로 서브카테고리의 수익 차이를 하이라이트 그래프로 만들어보자. 포인트는, 상단에 위치한 Region을 대시보드 디자인 계획에 맞춰 아래로 내려주는 것 >> min(1)을 사용한다. 1. 시작 행 선반에 sub-category를, 열 선반에 Regions를 끌어다 놓는다 profit을 색상 선반에 놓는다 행과 열에 대한 필드를 숨겨준다. 마우스 우클릭 > 열/행에 대한 필드 레이블 숨기기 화면을 '전체보기'로 맞추어 워크시트에 그래프가 꽉차게 해준다. 2. 대시보드 디자인을 위해 상단의 region을 맨 아래로 내리기 행 선반에 'min(1)'을 추가 : 상단에 레이블(region)이 들어가면 나중에 대시보드에서 레이아웃이 안맞는다. 새로 생긴 Min(1)의.. 2024. 1. 13.
[Sales Analytic Dashboard] #1. Sales by Sub-Category 다음 최종 대시보드의 하단 첫 번째, Sales by Sub-Category를 만들어보자. 🎯 막대 그래프 전국(미국)의 서브 카테고리별 매출 총액을 확인하고자 한다. 1. 시작 행 선반에 sub-category를, 열 선반에 Sales를 끌어다 놓는다 2. 서브 카테고리 순위를 인덱스 함수로 만들기 행 선반에 "index()"를 추가, 불연속형으로 전환 >> 인덱스탭을 행 선반의 맨 앞으로 이동 행에 대한 필드레이블 숨기기 3. 그래프 내림차순 정렬, Sales 값의 소수점을 없애고 $표시 넣기 행 선반의 '서브 카테고리'탭을 누르고, 내림차순 클릭 Sales 탭 우클릭 >> 서식 >> 숫자/사용자 지정 수정 4. 디자인상 불필요한 선 제거 워크시트에서 우클릭 >> 서식 글꼴 맞추기 테두리 > 행 .. 2024. 1. 13.
[BigQuery] 현업 문제 해결 쿼리 작성(3) : 인사이트 적용 상황 이제 팀은 PO가 제시한 인사이트와 분석가의 지표 검증 후, 모든 포지션에 스킬셋(및 역량)을 추가하려고 한다. 기획 분석이 끝나 잠시 시간이 생겨, 데이터 분석가와 데이터 사이언티스트 공고에는 어떤 스킬&역량이 있는지 궁금해졌다고 가정하고 다음 문제를 풀어보자. 📍문제1 SQL jd 컬럼을 ‘주요업무’, ‘ 자격요건’, ‘ 우대사항’, ‘혜택 및 복지’ 단어로 구분하여 컬럼을 4개로 나눠주세요. 컬럼명은 순서대로 responsibilities, requirements, preference, benefits로 해주세요. split()을 활용 : split(자를 컬럼명, 기준 문자열) safe_offset() : 오류가 나면 null 처리 safe_offset(숫자) : 나눈 문자열을 인덱싱하는 기준.. 2024. 1. 9.
[BigQuery] 현업 문제 해결 쿼리 작성(2) : 인사이트 적용 전, 지표 분석 배경 현업 문제 해결 쿼리 작성(1)에서의 분석을 바탕으로 전환율이 떨어지는 부분을 개선하고자 한다. 근래 타 페이지에서 유저에게 스킬셋을 적극 노출해을 때 유저 반응이 좋았다라는 분석이 있었다고 하자. 따라서 PO가 해당 인사이트를 바탕으로 공고리스트 페이지에서 스킬셋을 좀 더 적극적으로 노출하고 하는데, 분석가 입장에서 🎖️공고리스트 페이지에서 동일한 인사이트를 적용해도 좋을지에 대해 판단해보자. 분석 단계 로그 데이터를 바탕으로 적절한 가설을 세워 검토를 진행한다. 1. 현재 공고리스트 페이지에서 스킬을 활용할 수 있는 기능은 무엇인가요? 👉 필터에서 스킬을 고를 수 있음 2. 유저 코호트를 정의해주세요. 👉 팀에서는 ‘스킬셋 활용’이 공고리스트 페이지에 어떠한 영향을 주는지 확인하고자 한다. 따라.. 2024. 1. 8.
728x90