본문 바로가기
Python/Pandas

describe() : 범주형 변수에 적용하여 기술 통계량 확인

by ISLA! 2023. 8. 17.

describe( )

 

  • describe() 함수는 수치형 데이터의 기술통계량을 확인하는 것으로 많이 쓰이지만, 범주형 데이터의 통계값도 확인할 수 있다
  • include 인자에 object를 할당해주면 된다

예제

train.describe(include="object")

👉 train 데이터프레임의 문자열(object) 타입의 열(column)에 대한 요약 통계가 출력됨

 

결과 해석

 

  • count: type 열의 비어 있지 않은(non-null) 데이터의 개수
    • 5497개
  • unique: type 열에서 고유한(unique) 값의 개수
    • 열에는 고유한(unique) 값이 2개 있음
    • 즉, red와 white 두 가지 값으로 구성되어 있음
  • top: type 열에서 가장 자주 나타나는 값
    • 가장 빈도수가 높은 값은 white
  • freq: type 열에서 가장 자주 나타나는 값의 빈도수
    • white 값이 총 4159번 등장함을 의미
728x90