범주형 데이터 종류
(1) 명목형 데이터 : 카테고리, 항목 등 분류되어 이미 정해진 값이 있는 데이터, 그 값을 수준(Level)이라고 함.
(2) 순서형 데이터 : 정해진 값 사이에 순서 관계가 있는 데이터
범주형 데이터 파악 순서
- 수준별 데이터 분류하고, 각 갯수 세기
- 절대빈도 : 절대적인 갯수
- 막대그래프로 확인
- 상대빈도 : 각 수준별 비율(%)
- 원그래프로 확인
- 절대빈도 : 절대적인 갯수
수준별 데이터 갯수 세기
- Series 형 데이터 파악하는 것과 동일한 방법 사용(컬럼별로)
- size : 전체 사이즈
- count() : 데이터 없는 경우를 제외한 사이즈
- unique() : 유일한 값만
- value_counts() : 데이터 없는 경우를 제외한, 각 값의 갯수
df['A'].value_counts() #A컬럼의 데이터 없는 경우를 뺀 전체 값의 수
df['A'].unique() #A컬럼에서 각 값의 종류를 중복없이 확인 가능!
iplot으로 막대그래프 그리기
df1.iplot(kind = 'bar)
plotly.graph_objects로 막대 그래프 그리기
import plotly.graph_objs as go
fig = go.Figure()
fig.add_trace(
go.Bar(
x = df1.index, y = df1['A'], name = 'name'))
iplot으로 원그래프 그리기
유의사항 : labels, values 지정 필수!
df1.iplot('pie', labels = '분류된 컬럼명', values='합산하여 상대적으로 보여줄 값')
plotly.graph_objects로 원그래프 그리기
fig = go.Figure()
fig.add_trace(
go.Pie(
labels=df1['분류된 항목'], values=df1['각 항목별 카운트']))
728x90
'Python > Data Visualization' 카테고리의 다른 글
상관관계를 확인하는 그래프 - Heatmap & Scatter 그래프 (0) | 2023.03.12 |
---|---|
[탐색적 데이터 분석] 테이블 데이터와 시계열 데이터 (0) | 2023.03.12 |
[탐색적 데이터 분석] 수치형 데이터의 이해, 그래프로 표현하기 (0) | 2023.03.09 |
plotly를 활용한 데이터시각화 : plotly.graph_objects (막대 그래프) (0) | 2023.03.09 |
plotly를 활용한 데이터시각화 : plotly.graph_objects (꺾은선 그래프) (0) | 2023.03.09 |