describe( )
- describe() 함수는 수치형 데이터의 기술통계량을 확인하는 것으로 많이 쓰이지만, 범주형 데이터의 통계값도 확인할 수 있다
- include 인자에 object를 할당해주면 된다
예제
train.describe(include="object")
👉 train 데이터프레임의 문자열(object) 타입의 열(column)에 대한 요약 통계가 출력됨
결과 해석
- count: type 열의 비어 있지 않은(non-null) 데이터의 개수
- 5497개
- unique: type 열에서 고유한(unique) 값의 개수
- 열에는 고유한(unique) 값이 2개 있음
- 즉, red와 white 두 가지 값으로 구성되어 있음
- top: type 열에서 가장 자주 나타나는 값
- 가장 빈도수가 높은 값은 white
- freq: type 열에서 가장 자주 나타나는 값의 빈도수
- white 값이 총 4159번 등장함을 의미
728x90
'Python > Pandas' 카테고리의 다른 글
[Pandas] cut(), qcut()을 이용한 데이터 구간화 (0) | 2023.09.07 |
---|---|
[Pandas] groupby , 다중 열 정렬 (0) | 2023.09.07 |
display() 함수 : 여러 개 데이터프레임 동시에 확인 (0) | 2023.08.14 |
[pandas] pd.qcut() 과 pd.crosstab() (0) | 2023.08.09 |
Index Alignment란? (0) | 2023.08.09 |