주피터노트북에서 raw data를 확인하다보면 데이터 내용은 똑같은데 컬럼명이 다른 경우가 있다.
만약 추출하고 싶은 컬럼명이 2가지 버전이라면 try, except 를 사용하여 해당 컬럼을 추출 후, 컬럼명을 변경해준다.
요약
try 해보고, 에러뜨면 except 내용을 실행하라는 것
예시
doc = pd.read_csv(datafile.csv', encoding = 'utf-8-sig')
try:
doc = doc[['column1', 'column2', 'column3']] #원하는 컬럼만 추출하기(doc에)
except:
doc = doc[[''column01', 'column02', 'column3']] #컬럼명이 다른 경우에 동일 컬럼 추출하기
doc.columns = ['column1', 'column2', 'column3'] #컬럼명 변경하기
- 예시에서는 'column1', 'column2', 'column3' 세개의 컬럼을 데이터 프레임에서 추출하려고 한다.
- 그런데 1과 01 처럼 컬럼명이 다르게 들어간 경우가 있다. 그럼 Try에서 에러가 난다.
- 따라서 먼저 try 로 'column1', 'column2', 'column3' 의 컬럼명을 가진 경우를 추출하고
- 컬럼명이 달라 에러가 나는 경우 즉, except에 다른 컬럼명을 지정 추출 후, 컬럼명을 변경한다.
728x90
'Machine Learning' 카테고리의 다른 글
[pingouin] 통계분석 결과를 데이터프레임으로 확인할 수 있는 라이브러리 (0) | 2023.08.11 |
---|---|
[탐색적 데이터 분석] 위치 추정과 변이 추정 (0) | 2023.03.09 |
[주피터/파이썬] os.listdir() 함수 (0) | 2023.03.07 |
JSON 형식 파일 읽기 / json.load() (0) | 2023.03.06 |
[주피터] 파일 불러오기 - 상대 경로와 절대 경로 (0) | 2023.03.06 |