본문 바로가기

pandas3

[pandas] 결측치 처리하기 결측치 처리하기 [예제] 인구통계 컬럼에서 결측치 데이터 확인 1. 데이터 불러오기 DATA_PATH = './' covidtotals = pd.read_csv(DATA_PATH + "data/covidtotalswithmissings.csv") 2. 5가지 인구 통계를 나타내는 컬럼만 따로 객체에 저장 demovars = ['population','pop_density','median_age','gdp_per_capita', 'hosp_beds'] 3. 열 별로 결측치 수 파악 기본적으로 df['컬럼명'].isnull().sum() 을 사용한다 행/열 구분은 axis 로 하는데, axis = 0 이면 열 기준, axis = 1 이면 행 기준이다 # 열 별로 결측치 수 파악 covidtotals[demo.. 2023. 8. 9.
[pandas] 날짜 데이터 다루기 to_datetime 사용법 : pd.to_datetime(df) 문자열에 적용하면 timestamp 유형이 됨 리스트에 적용하면 datetime64 유형이 됨 #문자열에 to_datetime => timestamp date_string = "2023-03-02" print(type(date_string)) datetime_obj = pd.to_datetime(date_string) print(datetime_obj) print(type(datetime_obj)) #리스트에 to_datetime => datetime64 date_list = ["2023-03-02"] print(type(date_list)) datetime_obj = pd.to_datetime(date_list) print(datetim.. 2023. 8. 9.
[Django] 엑셀 데이터 출력 페이지 만들기(부록) - 결과값을 표로 깔끔하게 보여주기(pandas dataframe > django) 웹페이지에 엑셀 데이터의 값들을 요약해서 보여주는 것까지 완성했다. 그런데 좀 더 가독성있게 표로 제시하는 방법도 찾아보았다.👀 여기서는 pandas 데이터프레임을 django에서 html에 표시되게 하는 방법을 살펴본다. 1. result 함수 수정 calculate > views.py > calculate 함수 수정 기본적으로 result 함수에 출력되는 결과값을 데이터프레임으로 변환하고, 세션에 저장해야한다. 이를 위해 calculate 함수를 먼저 수정한다. grade 별 value 통계량 요약 groupby 함수를 사용 : grade 컬럼을 기준으로, value 값에 min, max, mean 함수를 적용 index를 새로고침하고, 컬럼 값을 재지정 깔끔한 출력을 위해 min, max, mean.. 2023. 8. 3.
728x90