본문 바로가기

Machine Learning/Statistics4

Wilcoxon rank sum test (윌콕슨 순위 합 검정) 🎯 윌콕슨 순위 합 검정윌콕슨 순위합 검정(종종 윌콕슨 맨-휘트니 검정)이라고도 불리며, 두 독립적인 그룹 간의 차이를 평가하기 위한 비모수적 방법이다.데이터를 정규분포로 가정하지 않고, 데이터의 순위를 사용하여 두 그룹간 차이를 검정한다.주로 두 그룹의 중앙값의 차이를 비교하는데 사용된다. 보통 많은 경우, 샘플 데이터들이 정규 분포로부터 추출되었다고 보거나, 샘플 수가 많으면 샘플 평균은 정규 분포를 따르기 때문에(중심극한정리에 따라) t-test나 ANOVA가 널리 쓰인다.그런데, 이런 가정을 만족하지 못하는 경우에는 모수 검정법이 아닌 비모수 검정법을 사용해야 한다.  ▶︎ 모집단의 분포가 정규 분포라고 확신하기 어려운 경우▶︎ 데이터 샘플 수가 너무 적은 경우 이런 경우 independent.. 2024. 5. 20.
[기초 통계] 분산분석(Analysis of Variance, ANOVA) 분산분석이란? 세 개 이상의 그룹 간의 평균 차이를 비교하고, 이들의 차이가 우연적인 변동에 기인하는지, 진짜 차이에 기인하는지 통계적으로 판단하는 기법 그룹 간의 분산과 그룹 내의 분산을 비교하여 평균 차이의 통계적 유의성을 평가 즉, 주요 목적은 다수 그룹 간에 존재하는 차이를 확인하며, 실제로 그룹 간 차이가 우연적인 것이 아닌지 판단하는 것 언제 사용할까? 1. 세 개 이상의 그룹 간 평균 비교 2. 그룹 간 차이의 통계적 유의성 확인 3. 예를 들어 실험군과 대조군, 다수의 처리 그룹 등 간의 차이를 비교하고자 할 때 ANOVA의 유형 1. 일원배치 분산분석(One-way ANOVA) : 하나의 독립 변수(그룹)에 대해 세 개 이상의 수준을 비교. 하나의 요인을 가진 실험 또는 관찰에 주로 사용.. 2023. 8. 14.
[기초 통계] 대응표본 T-검정 👀 통계 검정 접근 단계 1. 가설 설정 2. 특정 검정을 하기 전, 필요한 가정이 뭔지 파악해야함(예: 정규성, 등분산성 등) 대응표본 T-검정이란? 실험단위를 동질적인 쌍으로 묶은 다음, 각 쌍에서 관측값의 차를 이용하여 두 모평균의 차이에 관한 추론 실험 이전의 집단과 실험 이후의 집단이 동일한 경우 사용하는 검정(쌍체비교) 가설 귀무가설 : 실험전후 평균의 차이는 0이다 대립가설 : 실험전후 평균의 차이는 0이 아니다 가정 독립성 정규성 데이터 확인 운동&식단 프로그램 진행 전, 후의 근육량에 대한 데이터 import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/ethanweed/pythonbook/main/Data/chico.. 2023. 8. 14.
[기초 통계] 독립표본 T-검정 가설 설정 귀무가설 : 그룹 1의 평균과 그룹 2의 평균은 같다. 대립가설 : 그룹 1의 평균과 그룹 2의 평균은 같지 않다. 가정 독립성 정규성 : 각 그룹의 표본수가 𝑁 ≤ 30 이하일 때, 검정해야 함 Shapiro-Wilk tests로 확인 분산의 동질성(등분산성) 실습 데이터 : toothgrowth.csv 기니피그 60마리의 치아 길이, 투여한 비타민 C 종류, 투여량이 저장 len : 치아의 길이 supp : 투여한 약제(VC: 아스코르브산, OJ: 오렌지주스) does : 투여량 t-test 미션 오렌지주스를 투여받은 기니피그의 치아 길이 평균이 아스코르브산을 투여받은 기니피그의 치아 길이 평균과 일치하는지 t-검정(Two Sample t-test)를 통해 확인 1. 데이터 확인 impor.. 2023. 8. 14.
728x90