Python/Pandas
describe() : 범주형 변수에 적용하여 기술 통계량 확인
ISLA!
2023. 8. 17. 11:39
describe( )
- describe() 함수는 수치형 데이터의 기술통계량을 확인하는 것으로 많이 쓰이지만, 범주형 데이터의 통계값도 확인할 수 있다
- include 인자에 object를 할당해주면 된다
예제
train.describe(include="object")
👉 train 데이터프레임의 문자열(object) 타입의 열(column)에 대한 요약 통계가 출력됨
결과 해석
- count: type 열의 비어 있지 않은(non-null) 데이터의 개수
- 5497개
- unique: type 열에서 고유한(unique) 값의 개수
- 열에는 고유한(unique) 값이 2개 있음
- 즉, red와 white 두 가지 값으로 구성되어 있음
- top: type 열에서 가장 자주 나타나는 값
- 가장 빈도수가 높은 값은 white
- freq: type 열에서 가장 자주 나타나는 값의 빈도수
- white 값이 총 4159번 등장함을 의미
728x90