본문 바로가기
Machine Learning/Statistics

[기초 통계] 분산분석(Analysis of Variance, ANOVA)

by ISLA! 2023. 8. 14.

분산분석이란?

 

  • 세 개 이상의 그룹 간의 평균 차이를 비교하고, 이들의 차이가 우연적인 변동에 기인하는지, 진짜 차이에 기인하는지 통계적으로 판단하는 기법
  • 그룹 간의 분산과 그룹 내의 분산을 비교하여 평균 차이의 통계적 유의성을 평가
  • 즉, 주요 목적은 다수 그룹 간에 존재하는 차이를 확인하며, 실제로 그룹 간 차이가 우연적인 것이 아닌지 판단하는 것

 

 

언제 사용할까?

 

1. 세 개 이상의 그룹 간 평균 비교

2. 그룹 간 차이의 통계적 유의성 확인

3. 예를 들어 실험군과 대조군, 다수의 처리 그룹 등 간의 차이를 비교하고자 할 때

 

ANOVA의 유형

 

1. 일원배치 분산분석(One-way ANOVA) : 하나의 독립 변수(그룹)에 대해 세 개 이상의 수준을 비교. 하나의 요인을 가진 실험 또는 관찰에 주로 사용됨

2. 이원배치 분산분석 (Two-way ANOVA): 두 개의 독립 변수(요인)에 대해 분산분석을 수행하여 그룹 간의 차이를 확인. 두 요인의 상호작용도 평가할 수 있음

3. 다원배치 분산분석 (N-way ANOVA): 세 개 이상의 독립 변수에 대해 분산분석을 수행. 복잡한 실험 또는 조사에서 사용됨.

 

결과 해석

 

  • F-비율이라는 통계량을 사용하여 검정
  • 만약 그룹 간의 분산이 그룹 내 분산에 비해 통계적으로 유의미한 차이를 보인다면, 그룹 간에 적어도 하나 이상의 평균이 유의미하게 다른 것으로 판단할 수 있음
728x90