๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Projects/๐Ÿช Convenience Store Location Analysis18

[์„ ๋ฐ• ๋Œ€๊ธฐ์‹œ๊ฐ„ ์˜ˆ์ธก] 2์ฐจ ์ „์ฒ˜๋ฆฌ : ์ค‘๋ณต ํ–‰ ์ •๋ฆฌ ํ˜ธ์ถœ๋ถ€ํ˜ธ(์„ ๋ฐ•ID) ๋ณ„๋กœ ์ž…ํ•ญ์ผ์‹œ๊ฐ€ ์—ฌ๋Ÿฌ๊ฐœ ์ฐํžˆ๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ๋‹ค. ์‚ฌ์šฉ๋ชฉ์ (์–‘ํ•˜, ์ ํ•˜, ์ ‘์•ˆ, ์ˆ˜๋ฆฌ ๋“ฑ)์— ๋”ฐ๋ผ ๊ฐ๊ฐ์˜ ์ผ€์ด์Šค๋ฅผ ๊ตฌ๋ถ„ํ•ด์„œ ๋ณ„๋„ Record๋กœ ๋ฐ์ดํ„ฐ๊ฐ€ ์ˆ˜์ง‘๋˜์–ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์ค‘๋ณต ํ–‰ ํ™•์ธ ๋จผ์ € ํ˜ธ์ถœ๋ถ€ํ˜ธ์™€ ์ž…ํ•ญ์ผ์‹œ ๊ธฐ์ค€์œผ๋กœ ์ค‘๋ณต ์ปฌ๋Ÿผ์„ ๋จผ์ € ํ™•์ธํ•œ๋‹ค. duplicate = df.duplicated(subset=['ํ˜ธ์ถœ๋ถ€ํ˜ธ', '์ž…ํ•ญ์ผ์‹œ']).sum() duplicate -- ๊ฒฐ๊ณผ : 71439 ์ค‘๋ณต ํ–‰ ํ™•์ธ 'ํ˜ธ์ถœ๋ถ€ํ˜ธ'์™€ '์ž…ํ•ญ์ผ์‹œ' ์—ด์„ ๊ธฐ์ค€์œผ๋กœ ์ค‘๋ณต๋œ ๋ชจ๋“  ํ–‰์„ ์›๋ณธ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์—์„œ ์„ ํƒํ•˜๊ณ , ์ด๋ฅผ duplicated_rows์— ์ €์žฅ ๐Ÿ‘‰ duplicated_rows์—๋Š” ์ค‘๋ณต๋œ ํ–‰๋“ค๋งŒ ํฌํ•จ๋˜์–ด ์žˆ๋Š” ์ƒํƒœ # ๋ชจ๋“  ์ค‘๋ณต ํ–‰์„ ์„ ํƒ(keep=False) duplicated_rows = df.. 2023. 11. 15.
[Mini Project] 11. Baseline Modeling (LightGBM + K-fold CV + RandomSearch) โœ” Process Check ์ง€๊ธˆ๊นŒ์ง€ ์ด์ƒ์น˜์™€ ๊ฒฐ์ธก์น˜ ๋“ฑ์„ ์ ๊ฒ€ํ•˜๋Š” EDA๋ฅผ ๋งˆ์นœ ํ›„, ํŒŒ์ƒ๋ณ€์ˆ˜๋ฅผ ์ƒ์„ฑํ–ˆ๋‹ค. ์ด์ œ ๋ชจ๋ธ๋ง์„ ํ†ตํ•ด ์œ ์˜๋ฏธํ•œ ํŒŒ์ƒ๋ณ€์ˆ˜๋ฅผ ์„ ํƒํ•˜๊ณ , ์ตœ์ข… ๋ชจ๋ธ๋ง์— ํ•„์š”ํ•œ ๋ณ€์ˆ˜๋ฅผ ์ฑ„ํƒํ•˜๋Š” ๊ณผ์ •์ด ๋‚จ์•˜๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์•„๋ž˜์™€ ๊ฐ™์ด LightGBM + K-fold CV + RandomSearch ์„ ํ™œ์šฉํ•œ ๋ชจ๋ธ๋ง ๋ฒ ์ด์Šค๋ผ์ธ ์ฝ”๋“œ๊ฐ€ ์™„์„ฑ๋˜์—ˆ๋‹ค. 1. ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ import numpy as np import pandas as pd import lightgbm as lgb from lightgbm import LGBMRegressor from sklearn.model_selection import KFold, train_test_split, RandomizedSearchCV from sklearn.. 2023. 9. 26.
[Mini Project] 10. ๋งค์ถœ์˜ ๋ถ„ํฌ ํ™•์ธ (+ ์ด์ƒ์น˜ ์ œ๊ฑฐ ํ›„ ๋ชจ๋ธ ์„ฑ๋Šฅ ์ฒดํฌ) ๐ŸŒฟ ๋งค์ถœ ๋ถ„ํฌ ํ™•์ธ ๋ชจ๋ธ๋ง ์ง„ํ–‰ ์ค‘, ์ข…์†๋ณ€์ˆ˜์ธ ๋งค์ถœ์˜ ๋ถ„ํฌ๋ฅผ ์ฒดํฌํ•ด๋ณด์•˜๋‹ค. ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ด ๋ณ€์ˆ˜์˜ ๋ถ„ํฌ์— ๋”ฐ๋ผ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ RMSE๋กœ ํ• ์ง€, MAE๋กœ ํ• ์ง€๊ฐ€ ์ •ํ•ด์ง€๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๋งŒ์•ฝ ์™œ๋„๊ฐ€ ๋†’์•„ ๋ถ„ํฌ๊ฐ€ ๊ณ ๋ฅด์ง€ ์•Š๋‹ค๋ฉด, RMSE๋ฅผ ์จ์•ผํ•˜๊ณ  ๊ทธ ๋ฐ˜๋Œ€์˜ ๊ฒฝ์šฐ๋Š” MAE๋ฅผ ์“ฐ๋Š” ๊ฒƒ์ด ๋ณด๋‹ค ์ง๊ด€์ ์ธ ๊ฒฐ๊ณผํ•ด์„์ด ๊ฐ€๋Šฅํ•˜๋‹ค. โœ” ๊ณจ๋ชฉ์ƒ๊ถŒ ๋งค์ถœ ๋ถ„ํฌ ์™œ๋„ ๊ฐ’๊นŒ์ง€ ์ถœ๋ ฅํ•  ์ˆ˜ ์žˆ๋„๋ก ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•˜์—ฌ ๊ณจ๋ชฉ์ƒ๊ถŒ์˜ ๋งค์ถœ ๋ถ„ํฌ๋ฅผ ํžˆ์Šคํ† ๊ทธ๋žจ์œผ๋กœ ๊ทธ๋ ค๋ณด์•˜๋‹ค. fig, ax = plt.subplots(1, 1, figsize=(18,10)) g = sns.histplot(df_gol['๋งค์ถœ'], color='b', label='Skewness : {:.2f}'.format(df_gol['๋งค์ถœ'].skew()), ax=ax) g.lege.. 2023. 9. 18.
[Mini Project] 9. ๋ชจ๋ธ๋ง ๋ฐ ํ”ผ์ณ(ํŒŒ์ƒ๋ณ€์ˆ˜) ์„ ํƒ ๐ŸŒฟ ๋ชจ๋ธ๋ง ์ง„ํ–‰์‚ฌํ•ญ ๋ชจ๋ธ๋ง ํ˜‘์—… ํŒ€์›์ด ๊ฐ„๋žตํžˆ ๊ณจ๋ชฉ/๋น„๊ณจ๋ชฉ ์ƒ๊ถŒ์„ ๋‚˜๋ˆ„์–ด์„œ ๋ชจ๋ธ๋ง์„ ์ง„ํ–‰ํ•œ ๊ฒฐ๊ณผ๊ฐ€ RMSE๊ฐ€ ๋‚ฎ์Œ์„ ํ™•์ธํ–ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ณจ๋ชฉ/๋น„๊ณจ๋ชฉ ์ƒ๊ถŒ๋ณ„๋กœ ๋ชจ๋ธ์„ ๊ฐ๊ฐ ์ง„ํ–‰ํ•˜๊ธฐ๋กœ ํ–ˆ๋‹ค. ํ˜„์žฌ ๋ชจ๋“  ํ”ผ์ณ๋ฅผ ์‚ด๋ ค ๋ชจ๋ธ๋งํ•˜๋ฉด RMSE(์‹œ์ž‘์ )๋Š” ์•ฝ 49906.78 ์ด๋‹ค. ์—ฌ๊ธฐ์„œ ํ”ผ์ณ ์—”์ง€๋‹ˆ์–ด๋ง์„ ๊ฑฐ์ณ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜์—ฌ RMSE๋ฅผ ๋‚ฎ์ถฐ๋ณด๊ธฐ๋กœ ํ–ˆ๋‹ค. 1. ํŒŒ์ƒ๋ณ€์ˆ˜ ๋ธŒ๋ ˆ์ธ์Šคํ† ๋ฐ ์˜์‚ฌ๊ฒฐ์ •ํŠธ๋ฆฌ ๊ธฐ๋ฐ˜ ์•™์ƒ๋ธ” ๋ชจ๋ธ์ธ LGBM์„ ์“ธ ์˜ˆ์ •์ด๋ผ, ์ •๊ทœํ™”(๋กœ๊ทธ๋ณ€ํ™˜, ํ‘œ์ค€ํ™” ๋ณ€ํ™˜), ์Šค์ผ€์ผ๋ง(min-max๋“ฑ)์€ ํ•„์š”ํ•˜์ง€ ์•Š๋‹ค๊ณ  ํ•œ๋‹จํ–ˆ๋‹ค. ๋‹ค์Œ ์Šคํ…์œผ๋กœ ํ”ผ์ณ๋ฅผ ํ•˜๋‚˜์”ฉ ์‚ดํŽด๋ณด๋ฉฐ ์–ด๋–ค ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ์ธ์ง€, ๊ฒฐํ•ฉํ•˜์—ฌ ์˜๋ฏธ์žˆ๋Š” ํŒŒ์ƒ๋ณ€์ˆ˜๋ฅผ ๋„์ถœํ•  ์—ฌ์ง€๊ฐ€ ์žˆ๋Š”์ง€๋ฅผ ์‚ดํ”ผ๊ณ  ์•„๋ž˜์™€ ๊ฐ™์ด ๋ธŒ๋ ˆ์ธ์Šคํ† ๋ฐ ๊ณผ์ •์„ ๊ธฐ๋กํ–ˆ๋‹ค. 2. ๊ฐ ํŒŒ์ƒ๋ณ€์ˆ˜๊ฐ€ ๋ชจ.. 2023. 9. 18.
[ํ”„๋กœ์ ํŠธ ์Šคํ„ฐ๋””] ํšŒ๊ท€ ๋ฌธ์ œ ํ‰๊ฐ€ ์ง€ํ‘œ LightGBM์€ ํšจ์œจ์ ์ธ ๋ถ€์ŠคํŒ… ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ด๋‹ค. ๋ณธ ์„ธ๋ฏธ ํ”„๋กœ์ ํŠธ๋Š” ํšŒ๊ท€ ๋ฌธ์ œ์— ํ•ด๋‹นํ•˜๋‹ˆ LightGBM์œผ๋กœ ๋ชจ๋ธ ํ•™์Šตํ•˜๊ณ , ํ‰๊ฐ€ ์ง€ํ‘œ๋ฅผ ์„ค์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ฐพ์•„๋ณด๊ธฐ๋กœ ํ–ˆ๋‹ค. LightGBM์˜ ํ‰๊ฐ€ ์ง€ํ‘œ ์ข…๋ฅ˜(ํšŒ๊ท€๋ฌธ์ œ) LightGBM์€ LightGBMRegressor ํด๋ž˜์Šค๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํšŒ๊ท€ ๋ชจ๋ธ์„ ํ•™์Šตํ•œ๋‹ค. ํšŒ๊ท€ ๋ฌธ์ œ์—์„œ ์‚ฌ์šฉ๋˜๋Š” ํ‰๊ฐ€์ง€ํ‘œ๋Š” ๋ฐ์ดํ„ฐ ํŠน์„ฑ์— ๋”ฐ๋ผ ์„ ํƒํ•  ์ˆ˜ ์žˆ์œผ๋‹ˆ, ์ ์ ˆํ•œ ํ‰๊ฐ€ ์ง€ํ‘œ๋กœ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€, ๋น„๊ตํ•˜์—ฌ ์ตœ์ ์˜ ๋ชจ๋ธ์„ ์„ ํƒํ•ด์•ผ ํ•œ๋‹ค. ๐Ÿฅ‘ ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ (MSE) ์˜ˆ์‹œ from lightgbm import LGBMRegressor from sklearn.metrics import mean_squared_error # LightGBM ํšŒ๊ท€ ๋ชจ๋ธ ์ƒ์„ฑ ๋ฐ .. 2023. 9. 14.
[ํ”„๋กœ์ ํŠธ ์Šคํ„ฐ๋””] Feature Scaling (Min-Max scaling) ๐Ÿ‘‰ ์ด ํฌ์ŠคํŒ…์—์„œ๋Š”.. ํ”„๋กœ์ ํŠธ๋ฅผ ์ง„ํ–‰ํ•˜๋ฉฐ, ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ๋กœ ํ”ผ์ฒ˜๋ฅผ ์ƒ์„ฑํ•˜๋‹ค๋ณด๋‹ˆ, ์„œ๋กœ ๋‹ค๋ฅธ ๋ฒ”์œ„์™€ ์ฒ™๋„๋ฅผ ๊ฐ€์กŒ๋‹ค๋Š” ๋ถ€๋ถ„์ด ๊ฑฑ์ •์ด ๋˜์—ˆ๋‹ค. ์ด์™€ ๊ด€๋ จํ•˜์—ฌ ์Šค์ผ€์ผ๋ง์— ๋Œ€ํ•ด ์Šค์ผ€์ผ๋งํ•˜๊ณ , ํ”„๋กœ์ ํŠธ์— ์ ์šฉํ•  ๋ฐฉ์•ˆ์„ ๊ณ ๋ฏผํ•ด๋ณด๊ธฐ๋กœ ํ–ˆ๋‹ค - ํ•ด๋‹น ํฌ์ŠคํŒ…์—์„œ๋Š” ํ”ผ์ฒ˜ ์Šค์ผ€์ผ๋ง์˜ ๊ธฐ๋ณธ์ ์ธ ๊ฐœ๋…๊ณผ ์˜ˆ์ œ๋ฅผ ํ†ตํ•ด ๋‹ค์–‘ํ•œ ์Šค์ผ€์ผ๋ง ๋ฒ•์„ ์ตํ˜€๋ณธ๋‹ค. ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ์‚ฌ์ดํ‚ท๋Ÿฐ์„ ์‚ฌ์šฉํ•œ๋‹ค. ๐Ÿง Feature Scaling์ด๋ž€? ๊ฐ’๋“ค์„ ๋™์ผํ•œ ๋ฒ”์œ„์™€ ์ฒ™๋„๋‚ด์— ๋„ฃ๋Š” ๊ฒƒ์œผ๋กœ, ํ•˜๋‚˜์˜ ๋ณ€์ˆ˜๊ฐ€ ๋‹ค๋ฅธ ๋ณ€์ˆ˜์— ์˜ํ•ด ์˜ํ–ฅ๋ ฅ์„ ๋ฐœํœ˜ํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒƒ์„ ๋ง‰๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค ๐Ÿง Scaling์ด ์™œ ํ•„์š”ํ• ๊นŒ? ๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ ๋ฐ์ดํ„ฐ ์…‹์€ ๊ฐ๊ฐ์˜ ๊ทœ๋ชจ(magnitude), ๋‹จ์œ„, ๋ฒ”์œ„๊ฐ€ ๋งค์šฐ ๋‹ค๋ฅผ ๊ฒƒ์ด๋‹ค ๋Œ€๋ถ€๋ถ„์˜ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋‘ ๋ฐ์ดํ„ฐ ๊ฐ„ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ •์‹œ, ์œ ํด๋ฆฌ๋””.. 2023. 9. 14.
[Mini Project] 8. Feature Engineering (์ด์ƒ์น˜์™€ ๋ถ„ํฌ ํƒ์ƒ‰) ๐Ÿฅ‘ ์˜ค๋Š˜์˜ ๋ชฉํ‘œ_Featrue Engineering ์ตœ์ข…๋ฐ์ดํ„ฐ์˜ ์ฃผ์š” ์ปฌ๋Ÿผ์„ ๋ฉด์ ์œผ๋กœ ๋‚˜๋ˆ„์–ด์„œ, ๋ฉด์ ๋‹น n์˜ ์ˆ˜์˜ ๊ฐœ๋…์œผ๋กœ ์Šค์ผ€์ผ๋ง ์‹œ๋„ ์ „์ฒด ์ปฌ๋Ÿผ์„ 3๊ฐœ ํŒŒํŠธ๋กœ ๋‚˜๋ˆ„์–ด์„œ ๊ฐ์ž ํ”ผ์ณ ์—”์ง€๋‹ˆ์–ด๋ง์„ ๊ฐ„๋‹จํžˆ ์‹œ๋„ํ•ด๋ณด๊ธฐ๋กœ ํ–ˆ๋‹ค. ๋˜ํ•œ, ์ƒ๊ถŒ์„ ๊ณจ๋ชฉ์ƒ๊ถŒ๊ณผ ๋น„๊ณจ๋ชฉ์ƒ๊ถŒ(๋ฐœ๋‹ฌ์ƒ๊ถŒ ๋“ฑ)์œผ๋กœ ๋‚˜๋ˆ„์–ด ๋ถ„์„์„ ์ง„ํ–‰ํ•˜๊ธฐ๋กœ ํ–ˆ๋‹ค. ๋‚˜๋Š” ์•„ํŒŒํŠธ ๋‹จ์ง€์ˆ˜์™€ ์„ธ๋Œ€์ˆ˜, ๋ฐฐํ›„์ง€ ์•„ํŒŒํŠธ ๋‹จ์ง€์ˆ˜์™€ ์„ธ๋Œ€์ˆ˜๋ฅผ ๋‹ด๋‹นํ–ˆ๋‹ค. ์•„ํŒŒํŠธ ๊ด€๋ จ ์ปฌ๋Ÿผ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์œผ๋ฉฐ, ๋ฐฐํ›„์ง€ ๋ฐ์ดํ„ฐ๋Š” ๊ณจ๋ชฉ์ƒ๊ถŒ์—๋งŒ ์กด์žฌํ•œ๋‹ค. cols_gol = ['์•„ํŒŒํŠธ_๋‹จ์ง€_์ˆ˜', '์•„ํŒŒํŠธ_๊ฐ€๊ฒฉ_1_์–ต_๋ฏธ๋งŒ_์„ธ๋Œ€_์ˆ˜', '์•„ํŒŒํŠธ_๊ฐ€๊ฒฉ_1_์–ต_์„ธ๋Œ€_์ˆ˜', '์•„ํŒŒํŠธ_๊ฐ€๊ฒฉ_2_์–ต_์„ธ๋Œ€_์ˆ˜', '์•„ํŒŒํŠธ_๊ฐ€๊ฒฉ_3_์–ต_์„ธ๋Œ€_์ˆ˜', '์•„ํŒŒํŠธ_๊ฐ€๊ฒฉ_4_์–ต_์„ธ๋Œ€_์ˆ˜', '์•„ํŒŒํŠธ_๊ฐ€๊ฒฉ_5_์–ต_์„ธ๋Œ€_์ˆ˜', '์•„.. 2023. 9. 13.
[ํ”„๋กœ์ ํŠธ ์Šคํ„ฐ๋””] Feature Engineering Feature Engineering ์ด๋ž€? ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ์—์„œ ์œ ์šฉํ•œ ํŠน์ง•(ํ”ผ์ณ, ๋ณ€์ˆ˜)์„ ์ถ”์ถœํ•˜๊ฑฐ๋‚˜ ๋ณ€ํ˜•ํ•˜๋Š” ๊ณผ์ • ์ œ๋Œ€๋กœ ์ˆ˜ํ–‰ํ•˜๋ฉด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ์˜ˆ์ธก ๋˜๋Š” ๋ถ„๋ฅ˜ ์ž‘์—…์„ ๋” ์ •ํ™•ํ•˜๊ฒŒ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Œ! ์ผ๋ฐ˜์ ์œผ๋กœ Feature Engineering์€ ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ์˜ ์ผ๋ถ€๋กœ ๊ณ ๋ ค๋จ ๋ฌธ์ œ์˜ ์„ฑ๊ฒฉ๊ณผ ๋ฐ์ดํ„ฐ ์ข…๋ฅ˜์— ๋”ฐ๋ผ ๋‹ค์–‘ํ•œ ๊ธฐ์ˆ ๊ณผ ์ „๋žต์„ ์‚ฌ์šฉํ•˜๋ฉฐ, ๊ฒฝํ—˜๊ณผ ๋„๋ฉ”์ธ ์ง€์‹์ด ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•œ๋‹ค ๐Ÿฅ‘ Feature Engineering ์ข…๋ฅ˜ โœ” ์˜๋ฏธ์žˆ๋Š” ์ •๋ณด ์ถ”์ถœ ๋ฐ์ดํ„ฐ์—์„œ ์˜๋ฏธ์žˆ๋Š” ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๊ฑฐ๋‚˜, ๋„๋ฉ”์ธ ์ง€์‹์„ ํ™œ์šฉํ•˜์—ฌ ์ƒˆ๋กœ์šด ํ”ผ์ณ๋ฅผ ์ƒ์„ฑ ์˜ˆ๋ฅผ ๋“ค์–ด, ๋‚ ์งœ์—์„œ ์š”์ผ์ด๋‚˜ ์‹œ๊ฐ„๋Œ€๋ฅผ ์ถ”์ถœํ•˜๊ฑฐ๋‚˜ / ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์—์„œ ์ค‘์š”ํ•œ ํ‚ค์›Œ๋“œ๋ฅผ ์ถ”์ถœ โœ” ์ฐจ์› ์ถ•์†Œ ๋ฐ์ดํ„ฐ์˜ ์ฐจ์›์„ ์ค„์ด๊ฑฐ๋‚˜ ์ค‘์š”ํ•œ ํ”ผ์ฒ˜๋งŒ ์„ .. 2023. 9. 13.
[Mini Project] 7. ๋ชจ๋ธ๋ง Baseline Code (feat. Trouble Shooting ๐Ÿคจ) ๐Ÿš€ ํšŒ๊ท€ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋ชจ๋ธ ์„ ์ • : LightGBM ์ด๋ก ์ ์œผ๋กœ ์ ์€ ๋ฐ์ดํ„ฐ ์…‹(ํ†ต์ƒ ํ–‰ ๊ฐœ์ˆ˜ 10,000๊ฐœ ์ดํ•˜)์— ๋Œ€ํ•œ ๊ณผ์ ํ•ฉ ์šฐ๋ ค๊ฐ€ ์žˆ๋Š” ๋ชจ๋ธ์ด์ง€๋งŒ, ํ˜„์žฌ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋Š” ์ธ๊ธฐ์žˆ๋Š” ๋ชจ๋ธ์ด๊ธฐ๋„ ํ•˜๋ฉฐ ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚˜ LightGBM์„ ๊ธฐ๋ณธ์ ์œผ๋กœ ์ฑ„ํƒ ์ดํ›„, ๊ฐ€๋Šฅํ•˜๋ฉด ๋‹ค๋ฅธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์„ ํƒํ•˜์—ฌ ์˜ˆ์ธก ์„ฑ๋Šฅ์„ ๋น„๊ตํ•ด ๋ณผ ์˜ˆ์ • โ–ถ๏ธŽ LightGBM์˜ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ ์„ ํƒ Gradient Boosting ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ํŠธ๋ฆฌ ๊ธฐ๋ฐ˜ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ, ๊ฒฐ์ •ํŠธ๋ฆฌ ๋ชจ๋ธ๊ณผ ๊ฐœ๋…์ด ์ด์–ด์ง€๋Š” ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ๋“ค์ด ๋‹ค์ˆ˜ ์กด์žฌํ•œ๋‹ค ๋ชจ๋ธ ์ตœ์ ํ™”๋ฅผ ์œ„ํ•ด ์ฃผ์š” ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํƒ์ƒ‰, ์„ ์ •ํ•˜๊ธฐ๋กœ ํ–ˆ๋‹ค (โœ” ๋œ ๊ฒƒ์ด ์ž ์ • ์ฑ„ํƒ๋œ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ!) ์„ ์ •๋œ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ๋Š” RandomSearchCV๋ฅผ ์ด์šฉํ•ด, ์ตœ์ ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋„์ถœํ•  ๊ฒƒ์ด.. 2023. 9. 12.
728x90