본문 바로가기
Machine Learning

결정계수(coefficient of determination )

by ISLA! 2023. 9. 1.

결정계수(R-squared)란?

 

  • 회귀모델의 적합도를 측정하는 지표
  • 종속변수의 변동성을 독립변수로 설명하는 비율로, 모델이 얼마나 데이터의 변동성을 설명하는지를 나타냄
  • 0과 1 사이의 범위를 가지며, 1에 가까울수록 모델이 데이터 변동성을 더 잘 설명하고 있음을 의미
  • 예를 들어, 결정계수가 0.78 이라면, 모델이 종속 변수의 변동 중 약 78%를 설명할 수 있다는 것
  • 단, 결정계수는 단일 지표로서 모델의 전반적인 성능을 평가하기에는 제한적이므로 다른 평가 지표와 함께 고려하는 것이 좋음

 

결정 계수 구하기

 

  • SST : (실제값 - 평균값)을 제곱한 평균
  • SSR : (실제값 - 예측값)을 제곱한 평균
  • 결정 계수 구하는 코드 예시
import numpy as np

SSE = np.sum((val_y - pred)**2)
SST = np.sum((val_y - np.mean(val_y))**2 )
r_square = 1 - SSE/SST
print('r_square: ', r_square)
728x90