결정계수(R-squared)란?
- 회귀모델의 적합도를 측정하는 지표
- 종속변수의 변동성을 독립변수로 설명하는 비율로, 모델이 얼마나 데이터의 변동성을 설명하는지를 나타냄
- 0과 1 사이의 범위를 가지며, 1에 가까울수록 모델이 데이터 변동성을 더 잘 설명하고 있음을 의미
- 예를 들어, 결정계수가 0.78 이라면, 모델이 종속 변수의 변동 중 약 78%를 설명할 수 있다는 것
- 단, 결정계수는 단일 지표로서 모델의 전반적인 성능을 평가하기에는 제한적이므로 다른 평가 지표와 함께 고려하는 것이 좋음
결정 계수 구하기
- SST : (실제값 - 평균값)을 제곱한 평균
- SSR : (실제값 - 예측값)을 제곱한 평균
- 결정 계수 구하는 코드 예시
import numpy as np
SSE = np.sum((val_y - pred)**2)
SST = np.sum((val_y - np.mean(val_y))**2 )
r_square = 1 - SSE/SST
print('r_square: ', r_square)
728x90
'Machine Learning' 카테고리의 다른 글
[회귀] 회귀 모델의 R2(결정계수)를 올리는 방법 (0) | 2024.02.21 |
---|---|
[데이터 전처리] StandardScaler & MinMaxScaler (0) | 2023.09.27 |
statsmodels 회귀분석 (0) | 2023.09.01 |
object 로 된 숫자를 수치(정수)형으로 바꾸기 (0) | 2023.08.31 |
One-Hot Encoding(원-핫 인코딩) (0) | 2023.08.31 |