DecisionTreeRegressor
- 의사 결정 나무 알고리즘을 기반으로 하며, 회귀 문제를 해결하는 데 사용됨
- 의사 결정 나무 : 특성들의 조건에 따라 데이터를 분할하여 결정 경계를 형성하는 모델
- 회귀 트리 모델은 입력 특성에 따라 종속 변수의 값을 예측하기 위해 이러한 결정 경계를 사용
- DecisionTreeRegressor 객체를 생성하고 적절한 매개변수를 설정하여 모델을 초기화한 후에는 데이터를 모델에 적합시키고 예측을 수행
사용 예시
from sklearn.tree import DecisionTreeRegressor
- scikit-learn 라이브러리에서 DecisionTreeRegressor 클래스(class)를 가져오기
model = DecisionTreeRegressor(random_state=42)
- DecisionTreeRegressor 클래스를 사용하여 회귀 모델 객체 model을 생성
- random_state 매개변수 : 모델의 무작위성을 제어 👉 특정 값으로 설정하면 모델이 동일한 예측 결과를 재현할 수 있음
model.fit(train_x, train_y)
- fit(독립변수, 종속변수) 메서드를 사용해서 모델을 학습시킴
- model.fit(train_x, train_y) 코드는 독립 변수 train_x와 종속 변수 train_y를 학습하여 모델을 훈련시킴
💌 fit() 이 어떻게 모델을 훈련시킬까?
* fit()은 독립 변수와 종속 변수 간의 관계를 학습하고, 모델의 내부 매개변수를 조정하여 최적의 예측 모델을 생성함
* 학습 과정에서 모델은 주어진 입력 데이터에 대한 예측을 수행하고, 실제 출력 데이터와 비교하여 오차를 계산하고 이를 최소화하는 방향으로 내부 매개변수를 조정
* 이러한 반복 과정을 통해 모델은 데이터의 패턴과 관계를 학습하여 예측 성능을 향상시킴!
728x90
'Machine Learning' 카테고리의 다른 글
데이터 분리 : train 데이터와 Validation 데이터 (0) | 2023.08.17 |
---|---|
[Decision Tree] 의사결정나무 모델 (0) | 2023.08.15 |
[pingouin] 통계분석 결과를 데이터프레임으로 확인할 수 있는 라이브러리 (0) | 2023.08.11 |
[탐색적 데이터 분석] 위치 추정과 변이 추정 (0) | 2023.03.09 |
[주피터/파이썬] os.listdir() 함수 (0) | 2023.03.07 |