[Mini Project] 8. Feature Engineering (이상치와 분포 탐색)
🥑 오늘의 목표_Featrue Engineering 최종데이터의 주요 컬럼을 면적으로 나누어서, 면적당 n의 수의 개념으로 스케일링 시도 전체 컬럼을 3개 파트로 나누어서 각자 피쳐 엔지니어링을 간단히 시도해보기로 했다. 또한, 상권을 골목상권과 비골목상권(발달상권 등)으로 나누어 분석을 진행하기로 했다. 나는 아파트 단지수와 세대수, 배후지 아파트 단지수와 세대수를 담당했다. 아파트 관련 컬럼은 다음과 같으며, 배후지 데이터는 골목상권에만 존재한다. cols_gol = ['아파트_단지_수', '아파트_가격_1_억_미만_세대_수', '아파트_가격_1_억_세대_수', '아파트_가격_2_억_세대_수', '아파트_가격_3_억_세대_수', '아파트_가격_4_억_세대_수', '아파트_가격_5_억_세대_수', '아..
2023. 9. 13.