π₯ pandas_profiling λΌμ΄λΈλ¬λ¦¬ λ€μ΄λ‘λ
!pip install -U pandas-profiling
- λ°μ΄ν° λΆμ λ° νμμ μν Python λΌμ΄λΈλ¬λ¦¬
- λ°μ΄ν°νλ μμ κΈ°λ°μΌλ‘ νμ¬ λ°μ΄ν°μ ν΅κ³μ μμ½κ³Ό μκ°ν, λ°μ΄ν° νμ§ νκ° λ±μ μλννμ¬ λ°μ΄ν°λ₯Ό λΉ λ₯΄κ² μ΄ν΄νκ³ λ°μ΄ν° λΆμ νλ‘μΈμ€λ₯Ό κ°μννλλ° λμμ μ£Όμ΄, μκ°νλ€
- ꡬ체μ μΌλ‘ λ€μκ³Ό κ°μ κΈ°λ₯μ΄ μλ€.
π λ°μ΄ν° κ°μ λ° ν΅κ³ μμ½ : κ° μ΄μ λν ν΅κ³ μμ½(νκ· , μ€μκ°, νμ€νΈμ°¨ λ±)
π λ°μ΄ν° νμ§ νκ° : nan κ°μ λΉμ¨κ³Ό μ€λ³΅λ λ μ½λμ μλ₯Ό νμΈνκ³ , μ΄μμ μ κ°μ§
π μκ°ν : λ°μ΄ν°μ λν λ€μν μκ°ν κ·Έλν μμ±
π μκ΄κ΄κ³ λΆμ : μ΄ κ°μ μκ΄κ΄κ³ λΆμ λ° μκ°ν
π λ³μκ° κ΄κ³ νμ
π λ³΄κ³ μ μμ± : HTML λλ μΉ κΈ°λ° λνν λ³΄κ³ μλ₯Ό μμ±
π₯ λΌμ΄λΈλ¬λ¦¬ μν¬νΈ
import pandas_profiling
π λ°μ΄ν° λ‘λ ν, κΈ°μ΄ νꡬ
train = pd.read_csv('./train.csv')
pr = train.profile_report()
pr.to_file('pr_report.html')
pr
π κ²°κ³Ό νμΈ
μ¬κΈ°κΉμ§ μ 체μ μΈ νΌμ³λ€μ νμνκ³ , ꡬ체μ μΈ EDAμ λ°μ΄ν° λΆμμ λ€μ ν¬μ€ν μμ μ΄μ΄μ ν΄λ³΄μ!
728x90
'Machine Learning > Case Study π©π»βπ»' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[π¦ κ² λμ΄ μμΈ‘(2)] Baseline Modeling(Gradient Boosting) (0) | 2023.09.24 |
---|---|
[π¦ κ² λμ΄ μμΈ‘(1)] λ°μ΄ν° νμ & EDA (0) | 2023.09.24 |
[μ€κ³ μ°¨ κ°κ²© μμΈ‘(2)] EDA (0) | 2023.09.17 |
[ν΄μΈ λΆλμ° μμΈ μμΈ‘(2)] One-Hot Encoding & Ridge Regression (0) | 2023.09.15 |
[ν΄μΈ λΆλμ° μμΈ μμΈ‘(1)] κΈ°λ³Έμ μΈ EDA μ°μ΅ (0) | 2023.09.15 |