본문 바로가기
Python/Data Visualization

[탐색적 데이터 분석] 수치형 데이터의 이해, 그래프로 표현하기

by ISLA! 2023. 3. 9.

범주형 데이터 종류

(1) 명목형 데이터 : 카테고리, 항목 등 분류되어 이미 정해진 값이 있는 데이터, 그 값을 수준(Level)이라고 함.

(2) 순서형 데이터 : 정해진 값 사이에 순서 관계가 있는 데이터

 

 

범주형 데이터 파악 순서

  • 수준별 데이터 분류하고, 각 갯수 세기
    • 절대빈도 : 절대적인 갯수
      • 막대그래프로 확인
    • 상대빈도 : 각 수준별 비율(%)
      • 원그래프로 확인

 

수준별 데이터 갯수 세기

  • Series 형 데이터 파악하는 것과 동일한 방법 사용(컬럼별로)
    • size  : 전체 사이즈
    • count() : 데이터 없는 경우를 제외한 사이즈
    • unique() : 유일한 값만 
    • value_counts() : 데이터 없는 경우를 제외한, 각 값의 갯수
df['A'].value_counts() #A컬럼의 데이터 없는 경우를 뺀 전체 값의 수
df['A'].unique() #A컬럼에서 각 값의 종류를 중복없이 확인 가능!

 

iplot으로 막대그래프 그리기

df1.iplot(kind = 'bar)

plotly.graph_objects로 막대 그래프 그리기

import plotly.graph_objs as go
fig = go.Figure()
fig.add_trace(
    go.Bar(
        x = df1.index, y = df1['A'], name = 'name'))

 

iplot으로 원그래프 그리기

유의사항 : labels, values 지정 필수!

df1.iplot('pie', labels = '분류된 컬럼명', values='합산하여 상대적으로 보여줄 값')

 

plotly.graph_objects로 원그래프 그리기

fig = go.Figure()
fig.add_trace(
    go.Pie(
        labels=df1['분류된 항목'], values=df1['각 항목별 카운트']))
728x90