[Mini Project] 10. ๋งค์ถ์ ๋ถํฌ ํ์ธ (+ ์ด์์น ์ ๊ฑฐ ํ ๋ชจ๋ธ ์ฑ๋ฅ ์ฒดํฌ)
๐ฟ ๋งค์ถ ๋ถํฌ ํ์ธ ๋ชจ๋ธ๋ง ์งํ ์ค, ์ข
์๋ณ์์ธ ๋งค์ถ์ ๋ถํฌ๋ฅผ ์ฒดํฌํด๋ณด์๋ค. ๊ฐ์ฅ ์ค์ํ ์ด ๋ณ์์ ๋ถํฌ์ ๋ฐ๋ผ ๋ชจ๋ธ ์ฑ๋ฅ์ RMSE๋ก ํ ์ง, MAE๋ก ํ ์ง๊ฐ ์ ํด์ง๊ธฐ ๋๋ฌธ์ด๋ค. ๋ง์ฝ ์๋๊ฐ ๋์ ๋ถํฌ๊ฐ ๊ณ ๋ฅด์ง ์๋ค๋ฉด, RMSE๋ฅผ ์จ์ผํ๊ณ ๊ทธ ๋ฐ๋์ ๊ฒฝ์ฐ๋ MAE๋ฅผ ์ฐ๋ ๊ฒ์ด ๋ณด๋ค ์ง๊ด์ ์ธ ๊ฒฐ๊ณผํด์์ด ๊ฐ๋ฅํ๋ค. โ ๊ณจ๋ชฉ์๊ถ ๋งค์ถ ๋ถํฌ ์๋ ๊ฐ๊น์ง ์ถ๋ ฅํ ์ ์๋๋ก ์ฝ๋๋ฅผ ์์ฑํ์ฌ ๊ณจ๋ชฉ์๊ถ์ ๋งค์ถ ๋ถํฌ๋ฅผ ํ์คํ ๊ทธ๋จ์ผ๋ก ๊ทธ๋ ค๋ณด์๋ค. fig, ax = plt.subplots(1, 1, figsize=(18,10)) g = sns.histplot(df_gol['๋งค์ถ'], color='b', label='Skewness : {:.2f}'.format(df_gol['๋งค์ถ'].skew()), ax=ax) g.lege..
2023. 9. 18.
[Mini Project] 8. Feature Engineering (์ด์์น์ ๋ถํฌ ํ์)
๐ฅ ์ค๋์ ๋ชฉํ_Featrue Engineering ์ต์ข
๋ฐ์ดํฐ์ ์ฃผ์ ์ปฌ๋ผ์ ๋ฉด์ ์ผ๋ก ๋๋์ด์, ๋ฉด์ ๋น n์ ์์ ๊ฐ๋
์ผ๋ก ์ค์ผ์ผ๋ง ์๋ ์ ์ฒด ์ปฌ๋ผ์ 3๊ฐ ํํธ๋ก ๋๋์ด์ ๊ฐ์ ํผ์ณ ์์ง๋์ด๋ง์ ๊ฐ๋จํ ์๋ํด๋ณด๊ธฐ๋ก ํ๋ค. ๋ํ, ์๊ถ์ ๊ณจ๋ชฉ์๊ถ๊ณผ ๋น๊ณจ๋ชฉ์๊ถ(๋ฐ๋ฌ์๊ถ ๋ฑ)์ผ๋ก ๋๋์ด ๋ถ์์ ์งํํ๊ธฐ๋ก ํ๋ค. ๋๋ ์ํํธ ๋จ์ง์์ ์ธ๋์, ๋ฐฐํ์ง ์ํํธ ๋จ์ง์์ ์ธ๋์๋ฅผ ๋ด๋นํ๋ค. ์ํํธ ๊ด๋ จ ์ปฌ๋ผ์ ๋ค์๊ณผ ๊ฐ์ผ๋ฉฐ, ๋ฐฐํ์ง ๋ฐ์ดํฐ๋ ๊ณจ๋ชฉ์๊ถ์๋ง ์กด์ฌํ๋ค. cols_gol = ['์ํํธ_๋จ์ง_์', '์ํํธ_๊ฐ๊ฒฉ_1_์ต_๋ฏธ๋ง_์ธ๋_์', '์ํํธ_๊ฐ๊ฒฉ_1_์ต_์ธ๋_์', '์ํํธ_๊ฐ๊ฒฉ_2_์ต_์ธ๋_์', '์ํํธ_๊ฐ๊ฒฉ_3_์ต_์ธ๋_์', '์ํํธ_๊ฐ๊ฒฉ_4_์ต_์ธ๋_์', '์ํํธ_๊ฐ๊ฒฉ_5_์ต_์ธ๋_์', '์..
2023. 9. 13.