Projects31 [스마트 수거함 입지 선정] 5. Target 행정동 수거함 입지 선정 ♻️ 순환경제 활성화를 위한 서울시 스마트 수거함 입지 선정 화곡1동 스마트 수거함 입지 선정 프로세스 QGIS를 사용하여 행정동 경계 데이터 & 도로 데이터 전처리 1차 후보지 : 도로 위 200m 간격의 포인트 생성 2차 필터링 : 도로 폭 5 이상과 맞닿은 포인트만 필터링 3차 근접지 제거 : 50m 반경 내 후보 포인트가 겹칠 경우 인접 포인트 제거 입지 포인트 순위 선정 기준 : 상주인구 & 생활밀접시설 개수 📍[기준1] 반경 300m 이내 상주인구 주거인구가 많은 지역에 스마트 수거함을 우선 설치하여 활용성을 높이고자 함 반경 기준은 서울연구원,2014 도보권 개념을 참고함 데이터 수집 : 빅데이터 캠퍼스 상주인구 공간데이터를 QGIS로 전처리 📍[기준2] 반경 200m 이내 생활밀접시설 수 .. 2023. 12. 19. [스마트 수거함 입지 선정] 4. 행정동 별 입지 지수 선정(PCA) ♻️ 순환경제 활성화를 위한 서울시 스마트 수거함 입지 선정 PCA 목적 PCA Loading 값을 참고하여 Target Cluster(군집1)에 속하는 행정동 중 우선 설치가 필요한 행정동을 구분하기 위한 입지 지수를 선정하기 위함 PCA 절차 (1) 다중공선성 제거 높은 상관관계(VIF 10 이상)를 가지는 독립변수를 제거 상관계수(히트맵) 교차 확인 x_features = ['1인가구_비율','식품접객업','주점','연령대_2030_거주인구수_합', '주요경제활동인구_생활인구수', '수거함개수_당_거주인구수'] #'월평균_총생활인구수', '수거함_결핍률', '주점'] # x_features에 대한 VIF 계산을 위해 상수(intercept) 열을 추가 x_features_with_const = sm.. 2023. 12. 19. [스마트 수거함 입지 선정] 3. 행정동 군집화(K-means Clustering) ♻️ 순환경제 활성화를 위한 서울시 스마트 수거함 입지 선정 행정동 군집 분석 목적 서울시 전체 행정동 중 우선적으로 스마트 수거함 확대가 필요한 행정동 1차 추출을 위함 01. Feature 선정 가정을 세워 스마트 수거함 입지 선정에 중요한 요인으로 작용할 것이라 예상되는 변수를 선정 가정 1 : PET병 배출량이 많을수록 수거함은 더 많이 필요하다 가정 2 : 1인 가구는 PET병의 소단위 구매가 많아, 단위당 PET병 배출량이 많을 것이다 가정 3 : 재활용 및 분리배출은 전체 인구 중 생활인구 보다 거주인구 비율이 더 높을 것이다 👉 선정된 Feature : PET 예측량, 1인 가구수, 총 거주 인구수, 수거함 1개 당 거주인구수 02. K(군집 개수) 선정 Elbow Method, Silhi.. 2023. 12. 19. [스마트 수거함 입지 선정] 2. 행정동 PET 배출량 도출 ♻️ 순환경제 활성화를 위한 서울시 스마트 수거함 입지 선정 01. 전처리 : 자치구 기준 데이터 집계 행정동 단위 PET 배출량 데이터가 부재 ▶︎ 자치구별 데이터를 기반으로 '다중회귀분석'을 통해 행정동 배출량 예측 예정 자치구 단위 데이터 집계 feature : 거주인구 수 : 연령대 10대 이하 ~ 100세 이상 연령대별 거주인구수 생활인구 수 : 연령대별 생활인구 수 가구원 수 별 가구수 : 1인 가구 ~ 7인 가구 이상 거주인구 수 구별 페트병 배출량(자원순환정보시스템) : 2021년 전국 폐기물 발생 및 처리현황 참고 서울시 식품위생업소 및 공중위생업소 데이터 : 식품접객업 6종(휴게음식점, 일반음식점, 단란주점, 유흥주점, 위탁급식, 제과점) 수 02. 파생변수 생성 상관계수와 히트맵을 확.. 2023. 12. 19. [스마트 수거함 입지 선정] 1. 주제 선정 배경 및 개요 ♻️ 순환경제 활성화를 위한 서울시 스마트 수거함 입지 선정 스마트 수거함이란? 캔 또는 투명 페트병을 기계에 투입하면 포인트로 적립해 현금이나 모바일 쿠폰으로 보상받을 수 있는 제도 투명 페트병 분리수거 의무화를 위해 설치되었지만 인지도와 참여율이 저조한 편이며, 번거롭다는 인식이 많음 플라스틱병 보증금 반환 시스템은 독일, 북유럽 등 EU 내 9개 국가에서 이미 자리 잡음 주제 선정 배경 한국에서 매일 1만 톤 이상 배출되는 폐플라스틱의 재활용률이 50% 미만임 순환 경제와 탄소 중립 실현의 핵심 역할을 하는 폐 플라스틱을 정작 돈 주고 사와야하는 수급 불안을 겪고 있음 폐플라스틱의 환경 위협을 극복하고 새로운 성장동력으로 만들기 위해 폐플라스틱의 수거 시스템 개선이 필요함 기대효과 ▶︎ 행정동별 스.. 2023. 12. 19. [선박 대기시간 예측] 예측 결과 활용 예시 & 기대 효과 01. 예측 결과 활용 예시 궁극적으로 선박 대기 시간의 '분' 단위 예측을 통해 선박이 최대한 바로 서비스할 수 있는 시간에 입항할 수 있도록 하고자 한다. 다음 예시는 오전 7시에 입항 예정인 선박과 선석의 정보이며, 그때의 기상상태를 가상으로 만들었다. 아래와 같은 상황에서 예상 대기시간은 511분으로 예측되었다. 02. 기대효과 기대효과 1. 선박 비용 측면 오차가 적은 대기시간 예측은 불필요한 선박 대기 비용을 줄여준다. 실제 어느 정도의 대기비용 절감 효과가 나타날지 측정하기 위해 논문을 참고하여 대기비용 산출 식을 재구성했다. 기대효과 2. 대기오염 감소 측면 선박 대기시간 감소의 추가 효과로 대기오염물질 배출 감소가 있었다. 위와 동일하게 선박 대기시간이 감소했을 때 어느 정도의 배출 감소.. 2023. 12. 15. [선박 대기시간 예측] 파생변수 생성 + 선박 대기시간 예측 모델(LightGBM) 항만 대기시간 예측 및 운영시스템 개선을 위한 Feature Engineering + Model 구축 Feature Engineering 선박, 선석 기준으로 피쳐를 파악하고 나서 유의미한 파생변수를 만들고자 했다. 도메인 지식이 완전하지 않다고 여겨 논문들을 참고하여 총 6개 변수를 만들어 보았다. 변수 생성은 '선박'과 '선석'으로 기준을 나누어 진행했다. 1. 선박 일 별 누적입항 건수 선석 기준 변수로, 선박이 입항하고자 하는 선석에 그 전 시간대까지 몇 개의 선박이 입항했는지를 count 한다. df['이전_입항선박수'] = df.groupby(['ETA_Year', 'ETA_Month', 'ETA_Day', '계선장소명'])['호출부호'].cumcount() # 확인용 df[df['계선장소명.. 2023. 12. 15. [선박 대기시간 예측] 시계열/선석 기반 EDA 항만 대기시간 예측 및 운영시스템 개선을 위한 EDA 🎯 목표 : 시계열 데이터의 주기성을 확인하고, 시계열 예측 모델(Prophet)을 만들어 결과 확인하기 (데이터는 액체화물과 비액체화물로 나누어 진행) 01. 연도별 월 별 대기시간 시각화(액체화물) 👉 목표 : 시간대별 대기시간 평균 / 건 수의 분포를 살펴 '시계열' 모델을 사용할 만 한 지 판단하기로 함 👉 결과 : 대기시간 평균은 뚜렷한 주기성은 보이지 않으나, 대기 건수는 월별로 편차가 있느 경향을 확인함 liquid['Datetime'] = pd.to_datetime(liquid['Datetime']) # 월별 접안_대기시간_분(평균) temp = liquid[['Datetime', 'ETA_Year','ETA_Month', '접안_대기시.. 2023. 12. 15. [선박 대기시간 예측] 선박 기반 EDA target 항구인 울산항의 데이터를 종합하여 EDA 시행 01. 단순 EDA 접안 대기시간 유무 선박 용도별 접안대기 발생 비율 선박 용도별 접안 대기시간 평균 선박 용도별 대기율(방문순) 계선장소별 접안대기 발생비율(상위 10개) 상관 분석 Heatmap과 수치 (1) 접안 대기시간 유무 👉 전체 입항건 중 20%만 대기를 가지는 것으로 확인 # '접안_대기시간_분' 열이 0인 데이터와 0이 아닌 데이터의 갯수 계산 count_zero = (df['접안_대기시간_분'] == 0).sum() count_non_zero = (df['접안_대기시간_분'] != 0).sum() # Pretty colors colors = ['#FF9999', '#66B2FF'] # 막대 그래프 그리기 bars = plt.b.. 2023. 12. 15. 이전 1 2 3 4 다음 728x90