분산분석이란?
- 세 개 이상의 그룹 간의 평균 차이를 비교하고, 이들의 차이가 우연적인 변동에 기인하는지, 진짜 차이에 기인하는지 통계적으로 판단하는 기법
- 그룹 간의 분산과 그룹 내의 분산을 비교하여 평균 차이의 통계적 유의성을 평가
- 즉, 주요 목적은 다수 그룹 간에 존재하는 차이를 확인하며, 실제로 그룹 간 차이가 우연적인 것이 아닌지 판단하는 것
언제 사용할까?
1. 세 개 이상의 그룹 간 평균 비교
2. 그룹 간 차이의 통계적 유의성 확인
3. 예를 들어 실험군과 대조군, 다수의 처리 그룹 등 간의 차이를 비교하고자 할 때
ANOVA의 유형
1. 일원배치 분산분석(One-way ANOVA) : 하나의 독립 변수(그룹)에 대해 세 개 이상의 수준을 비교. 하나의 요인을 가진 실험 또는 관찰에 주로 사용됨
2. 이원배치 분산분석 (Two-way ANOVA): 두 개의 독립 변수(요인)에 대해 분산분석을 수행하여 그룹 간의 차이를 확인. 두 요인의 상호작용도 평가할 수 있음
3. 다원배치 분산분석 (N-way ANOVA): 세 개 이상의 독립 변수에 대해 분산분석을 수행. 복잡한 실험 또는 조사에서 사용됨.
결과 해석
- F-비율이라는 통계량을 사용하여 검정
- 만약 그룹 간의 분산이 그룹 내 분산에 비해 통계적으로 유의미한 차이를 보인다면, 그룹 간에 적어도 하나 이상의 평균이 유의미하게 다른 것으로 판단할 수 있음
728x90
'Machine Learning > Statistics' 카테고리의 다른 글
Wilcoxon rank sum test (윌콕슨 순위 합 검정) (0) | 2024.05.20 |
---|---|
[기초 통계] 대응표본 T-검정 (0) | 2023.08.14 |
[기초 통계] 독립표본 T-검정 (0) | 2023.08.14 |