Machine Learning/Case Study π©π»π»
[μ€κ³ μ°¨ κ°κ²© μμΈ‘(1)] pandas_profiling μ μ΄μ©ν νΌμ³ μμ½ νμΈ
ISLA!
2023. 9. 17. 20:35
π₯ pandas_profiling λΌμ΄λΈλ¬λ¦¬ λ€μ΄λ‘λ
!pip install -U pandas-profiling
- λ°μ΄ν° λΆμ λ° νμμ μν Python λΌμ΄λΈλ¬λ¦¬
- λ°μ΄ν°νλ μμ κΈ°λ°μΌλ‘ νμ¬ λ°μ΄ν°μ ν΅κ³μ μμ½κ³Ό μκ°ν, λ°μ΄ν° νμ§ νκ° λ±μ μλννμ¬ λ°μ΄ν°λ₯Ό λΉ λ₯΄κ² μ΄ν΄νκ³ λ°μ΄ν° λΆμ νλ‘μΈμ€λ₯Ό κ°μννλλ° λμμ μ£Όμ΄, μκ°νλ€
- ꡬ체μ μΌλ‘ λ€μκ³Ό κ°μ κΈ°λ₯μ΄ μλ€.
π λ°μ΄ν° κ°μ λ° ν΅κ³ μμ½ : κ° μ΄μ λν ν΅κ³ μμ½(νκ· , μ€μκ°, νμ€νΈμ°¨ λ±)
π λ°μ΄ν° νμ§ νκ° : nan κ°μ λΉμ¨κ³Ό μ€λ³΅λ λ μ½λμ μλ₯Ό νμΈνκ³ , μ΄μμ μ κ°μ§
π μκ°ν : λ°μ΄ν°μ λν λ€μν μκ°ν κ·Έλν μμ±
π μκ΄κ΄κ³ λΆμ : μ΄ κ°μ μκ΄κ΄κ³ λΆμ λ° μκ°ν
π λ³μκ° κ΄κ³ νμ
π λ³΄κ³ μ μμ± : HTML λλ μΉ κΈ°λ° λνν λ³΄κ³ μλ₯Ό μμ±
π₯ λΌμ΄λΈλ¬λ¦¬ μν¬νΈ
import pandas_profiling
π λ°μ΄ν° λ‘λ ν, κΈ°μ΄ νꡬ
train = pd.read_csv('./train.csv')
pr = train.profile_report()
pr.to_file('pr_report.html')
pr
π κ²°κ³Ό νμΈ
μ¬κΈ°κΉμ§ μ 체μ μΈ νΌμ³λ€μ νμνκ³ , ꡬ체μ μΈ EDAμ λ°μ΄ν° λΆμμ λ€μ ν¬μ€ν μμ μ΄μ΄μ ν΄λ³΄μ!
728x90