π§ μΈμ½λ©μ μ νμν κΉ?
- μ¬μ΄ν·λ°μ λ¨Έμ λ¬λ μκ³ λ¦¬μ¦μ λ¬Έμμ΄ κ°μ μ λ ₯κ°μΌλ‘ νμ©νμ§ μλλ€.
- λ°λΌμ λͺ¨λ λ¬Έμμ΄ κ°μ μΈμ½λ© λμ μ«μ νμΌλ‘ λ³νν΄μΌ νλ€.
- λ¬Έμμ΄ νΌμ²λ μΌλ°μ μΌλ‘ μΉ΄ν κ³ λ¦¬ν νΌμ²μ ν μ€νΈν νΌμ²λ₯Ό μλ―Ένλ©°, μ¬κΈ°μλ μΉ΄ν κ³ λ¦¬ν νΌμ³ μΈμ½λ©μ λν΄ μ΄ν΄λ³Έλ€.
- μΉ΄ν κ³ λ¦¬ν νΌμ³ μΈμ½λ©μλ λνμ μΌλ‘ λ μ΄λΈ μΈμ½λ©κ³Ό, μ-ν« μΈμ½λ©μ΄ μλ€.
π§π» λ μ΄λΈ μΈμ½λ© μ μμ
- λͺλͺ ML μκ³ λ¦¬μ¦μμλ μ«μ κ°μ ν¬κ³ μμμ λν νΉμ±μ΄ μμ©νμ¬, μμΈ‘ μ±λ₯μ΄ λ¨μ΄μ§ μ μλ€.
- λ°λΌμ μ ν νκ·μ κ°μ ML μκ³ λ¦¬μ¦μλ μ μ©νμ§ μμμΌ νλ€.
- νΈλ¦¬ κ³μ΄μ ML μκ³ λ¦¬μ¦μ μ«μμ μ΄λ¬ν νΉμ±μ λ°μνμ§ μμΌλ―λ‘ λ μ΄λΈ μΈμ½λ©λ λ³ λ¬Έμ κ° μλ€!
π λ μ΄λΈ μΈμ½λ© μμ
- λ μ΄λΈ μΈμ½λ©μ μ¬μ΄ν·λ°μ LabelEncoder ν΄λμ€λ‘ ꡬννλ€.
- LabelEncoder κ°μ²΄ μμ± β‘ fit() β‘ transfrom() μ νΈμΆν΄ λ μ΄λΈ μΈμ½λ© μν
- μλ μμ λ₯Ό μ΄ν΄λ³΄μ
from sklearn.preprocessing import LabelEncoder
items = ['λμ₯κ³ ', 'TV', 'μ μλ μΈμ§', 'μ νκΈ°', 'TV']
encoder = LabelEncoder()
encoder.fit(items)
labels = encoder.transform(items)
print('μΈμ½λ© λ³νκ°: ', labels)
μΈμ½λ© λ³νκ°: [1 0 3 2 0]
π μΈμ½λ© μμ±(classes) νμΈ
- μ μμ λ λ°μ΄ν°κ° μμμ κ°λ¨ν μ΄λ€ λ¬Έμμ΄μ΄ μ΄λ€ μ«μ κ°μΌλ‘ μΈμ½λ© λλμ§ μ§κ΄μ μΌλ‘ μκΈ° μ΄λ ΅λ€.
- μ΄ κ²½μ°, λ€μκ³Ό κ°μ΄ classes_ μμ±κ°μΌλ‘ νμΈνλ€.
print('μΈμ½λ© ν΄λμ€: ', encoder.classes_)
μΈμ½λ© ν΄λμ€: ['TV' 'λμ₯κ³ ' 'μ νκΈ°' 'μ μλ μΈμ§']
π λμ½λ©
- inverse_transform() μ ν΅ν΄ μΈμ½λ©λ κ°μ λ€μ λμ½λ© ν μ μλ€.
- μ΄λ inverse_transfrom() μμ± μμ μΈμ½λ©λ κ°λ€μ λ£μ΄μ£Όμ΄μΌ νλ€.
print('λμ½λ© μλ³Έκ°: ', encoder.inverse_transform([1, 0, 3, 2, 0]))
λμ½λ© μλ³Έκ°: ['λμ₯κ³ ' 'TV' 'μ μλ μΈμ§' 'μ νκΈ°' 'TV']
728x90
'Machine Learning > scikit-learn' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[μ΄μ§ λΆλ₯_μ±λ₯ νκ° μ§ν] F1 μ€μ½μ΄ / ROC곑μ (0) | 2023.09.28 |
---|---|
[λ°μ΄ν° μ μ²λ¦¬] One-Hot Encoding(μ-ν« μΈμ½λ©) (0) | 2023.09.27 |
[κ΅μ°¨ κ²μ¦] cross_val_score() (0) | 2023.09.26 |
[μμλΈ] XGBoost κ°λ κ³Ό μ¬μ΄ν·λ° λνΌ μμ (0) | 2023.08.30 |
[μμλΈ νμ΅] LightBGM (0) | 2023.08.22 |