[Mini Project] 10. 매출의 분포 확인 (+ 이상치 제거 후 모델 성능 체크)
🌿 매출 분포 확인 모델링 진행 중, 종속변수인 매출의 분포를 체크해보았다. 가장 중요한 이 변수의 분포에 따라 모델 성능을 RMSE로 할지, MAE로 할지가 정해지기 때문이다. 만약 왜도가 높아 분포가 고르지 않다면, RMSE를 써야하고 그 반대의 경우는 MAE를 쓰는 것이 보다 직관적인 결과해석이 가능하다. ✔ 골목상권 매출 분포 왜도 값까지 출력할 수 있도록 코드를 작성하여 골목상권의 매출 분포를 히스토그램으로 그려보았다. fig, ax = plt.subplots(1, 1, figsize=(18,10)) g = sns.histplot(df_gol['매출'], color='b', label='Skewness : {:.2f}'.format(df_gol['매출'].skew()), ax=ax) g.lege..
2023. 9. 18.