본문 바로가기

분류 전체보기339

M1 Mac 가상환경(Conda)에 Konlpy 설치하기 콘다 가상환경에 konlpy를 pip install로 설치했음에도, 다음과 같은 에러 메시지가 나타낼 때가 있다. 에러 : No JVM shared library file (libjli.dylib) found. Try setting up the JAVA_HOME environment variable properly.\ 🙋‍♂️ M1 맥 사용자를 기준으로 conda 가상환경에서 텍스트 분석을 진행 시, 아래와 같이 진행하면 Konlpy를 설치할 수 있다. M1 Mac에서 Conda 가상 환경에 Konlpy 패키지를 설치하고 사용하는 방법 👉 conda 가상환경 접속 conda activate [myenv:가상 환경이름] 👉 JPype1 설치 JPype1은 Konlpy 패키지가 Java와 Python을 연결.. 2024. 4. 1.
[BigQuery] 데이터 타입별 함수 정리 (문자열과 시간/날짜) 🎯 데이터를 그대로 가져오지 않고 변환이 필요한 경우에 쓸 수 있는 함수를 알아보자 SELECT 문에서 데이터를 변환시킬 수 있으며, WHERE의 조건문에서도 사용 가능 데이터의 타입에 따라 다양한 함수가 존재 1. 자료 타입을 변형하는 함수 : CAST SELECT CAST(1 AS STRING) # 숫자 1을 문자 1로 변경 👉 더 안전하게 데이터 타입 변경하기 : SAFE_CAST() → 변환이 실패할 경우 NULL을 반환하며, 다음과 같은 경우에 에러 대신 NULL이 됨 SELECT SAFE_CAST("문자열" AS INT64) (유사 사례) 안전하게 나누기 연산하기 : SAFE_DIVIDE() SAFE_DIVIDE(x, y) # zero error 대신 null 발생 2. 문자열을 다루는 함수 .. 2024. 4. 1.
실험하기 - A/B Test의 단계별 주의사항과 Action 📍본 포스팅은 [인프런] 카일스쿨의 PM을 위한 데이터 리터러시 강의를 기반으로 요약 / 실습했습니다. 실험을 시작하는 기준 충분한 사용자 수가 존재 평가 지표를 정의할 수 있는 경우 사용할 수 있는 리소스가 존재하는 경우(개발, 데이터) 실험군과 대조군이 서로 간섭하지 않는 경우 법적인 이슈가 없는 경우 실험을 통해 배울 마인드가 존재하는 경우 무엇을 실험해야 할까? 👉 어떤 실험이 비즈니스 임팩트가 큰지 확인하기 제품 관점에서 제일 중요한 퍼널을 개선하는 것을 먼저 진행(퍼널 역순) 데이터로 실험할 영역에 하루 몇 명이 접근하는지 확인한 후, 유저 몇 명 정도에게 영향을 미치는지 확인해야 함 → 실험 기간을 결정할 때도 영향을 미침 📑 주요 실험 소재 예시 제품 : 특정 화면에서 A라는 기능이 있는 .. 2024. 3. 30.
데이터 로그 설계(2) - Event & User Property 와 Event Taxonomy 📍본 포스팅은 [인프런] 카일스쿨의 PM을 위한 데이터 리터러시 강의를 기반으로 요약 / 실습했습니다. 제품 기획 후, 지표를 고민한 다음 해당 지표를 도출하기 위해 필요한 데이터 로그를 설계한다. 데이터 로그는 크게 두 가지(Event, User)로 나누어 설계한다. 이때도, 문제 정의와 지표 정의하기에 기반함을 잊지 말자! 결국 프로젝트의 목적에 부합하는 지표를 설정하는 것이 핵심이므로👆 데이터 로그 설계 시 2가지 관점 1. 지표에서 필요한 Event 정의 👉 Event Parameter 기능에서 발생할 수 있는 User Event & 이벤트에 저장할 추가 정보(parameter) 데이터 로그 설계 흐름(Event) 어떤 것을 기록하고 싶은지 생각한다 해당하는 event_name을 정의한다 어느 시.. 2024. 3. 23.
데이터 로그 설계(1) - 기초 개념 📍본 포스팅은 [인프런] 카일스쿨의 PM을 위한 데이터 리터러시 강의를 기반으로 요약 / 실습했습니다. 데이터 로깅 : 로그(Log)를 기록하는 행위 로깅을 왜 해야 할까? : (서비스의 특정 기능 개발/개선 배포 후) 지표를 기반으로 서비스의 성과를 측정하기 위해 Event taxonomy / Tracking Plan : 어느 시점에 어떤 데이터가 저장될 지 기록 1. 데이터의 종류 (1) 서비스 로그 (DB data) 서비스가 운영되기 위해 필요한 데이터 예) 구매 기록, 즐겨찾기 등 고객에게 노출되는 데이터 DBMS, DB, Table (2) 유저 행동 로그 (사용자 행동 데이터) 서비스에서 유저의 활동 더 좋은 제품을 위한 '분석'을 위해 필요한 데이터(고객에게 보여줄 필요는 없음) 추천 엔진 만.. 2024. 3. 23.
지표 구성 시 유의사항 & 서비스에 적용해보기(1) 📍본 포스팅은 [인프런] 카일스쿨의 PM을 위한 데이터 리터러시 강의를 기반으로 요약 / 실습했습니다. 지표 : 측정하고 싶은 것을 숫자로 표현한 것 해결하고자 하는 문제 → 문제 정의 과정에서 지표를 생각해야 함(무엇을 확인해야 할까?) 원하는 결과 해당 지표가 어떻게 변할지 🤔 Mental Simulation 하는 것이 중요함 → 불활실성 감소! 지표가 올라간다면 왜 그럴까? → 더 빠르게 올릴 수 있을까? 지표가 내려간다면 왜 그럴까? → 내려가지 않게 하려면 무엇을 해야할까? 좋은 지표의 조건 업무 목적과 관련이 있음 : Objective 측정이 가능함 : Measurable 지표를 토대로 '행동'할 수 있음 : Actionable 누구나 이해할 수 있음 : Understand 정의를 명확하게 함.. 2024. 3. 21.
정리 멘토님, 안녕하세요! 포트폴리오 파일을 첨부합니다. pdf 로 만들어 지원중입니다. 티스토리 블로그에 학습과정을 정리하고 있으며(https://everyday-joyful.tistory.com/) 깃허브에 프로젝트 파일을 정리했습니다(https://github.com/minseungryu) 2024. 3. 12.
[분석 사례] 딜라이트룸 : 신규 기능의 진입률과 전환율 높이기 📱 새 기능을 출시했을 때 확인할 것 (1)사용율을 살피고, 해당 기능 사용까지의 (2)퍼널별 전환율을 살핌 퍼널 최적화가 필요함 : 유저의 여정, 제품 내 퍼널의 어느 단계에서 유저 이탈이 심한 지 찾고 그 이유를 찾아 문제를 정의하고 개선해야 함 즉, 퍼널 최적화는 '유저의 제품 내 특정 전환율 증진'을 위한 하나의 방법임 ✔️ 퍼널 최적화를 위한 접근 2가지 1. 진입률 높이기 : 해당 기능 화면까지의 진입률(퍼널 유입량)을 높이는 방법 2. 진입 이후 전환율 높이기 : 해당 기능 내에서의 전환율(퍼널 내 전환율, 완수율)을 높이는 방법 🚨 해석 시 유의할 점은, 대부분의 기능이 출시 직후 '진입률'이 낮을 것이라는 점이다. 따라서 진입 대비 전환율은 새로운 기능에 관심이 많은 소수 유저들이 만든 .. 2024. 3. 11.
[그로스 해킹 시작하기 2] 성장실험 - A/B 테스트 A/B 테스트 설계하기 가설 예시 : 서비스 소개를 텍스트로 보여주는 화면보다 이미지로 보여주는 화면에서의 가입 전환율이 높을 것이다 독립변수와 종속변수가 무엇인지를 정의하고 종속변수의 목표 수준을 정하는 형태 실험 집단, 통제 집단 통제 변수 관리와 엄격한 기준에 따른 샘플링이 중요 사용자들을 어떤 기준으로 구분하고, 어떤 비율로 할당할 것이냐 🚨 통제 변수 : 독립변수가 아니지만 종속변수에 영향을 미칠 수 있는 제3의 변수 위의 가설에서는 가입 경로(유료 광고, 친구 추천 등)와 같은 것이 대표적인 통제 변수 샘플 크기 : 통계적 유의도를 확보하기 위한 숫자를 고려해서 실험 전에 미리 정할 것 실험 기간 : 샘플 크기를 고려했을 때 가설 검증을 위한 데이터를 수집하는 데 필요한 기간 A/B 테스트 설.. 2024. 3. 9.
728x90