본문 바로가기

gridsearchcv2

54일차 머신러닝 랜덤 포레스트 실습 / JSP 게시판페이지 21.05.27 Machine Learning @Ensemble % Bagging 53일차에 했던 내용 이어서 진행한다. Bagging 방법 중 하나 의 예로 랜덤 포레스트라는 방법이 있다. %Random Forest - 랜덤 포레스트 => 결국 요약하자면 랜덤 포레스트( Random Forest )는 결정 트리( Decision Tree )를 기반으로, 여러개의 결정트리 "Classifier"를 생성 한다. 그리고 각 트리별 다른 Sample 데이터를 학습하여 최종적 Voting을 통해 모델을 생성한다. % 주요 매개변수 ( Hyperparameter ) "n_estimators" 옵션은 Default 값이 100개로, 위와 같이 결정 트리 분류 모델의 수를 결정한다. "random_state"는 내가.. 2021. 5. 27.
52일차 머신러닝 - 교차검증, GridSearchCV / JSP - 로그인페이지 21.05.25 Machine Learning @과대or과소 적합 과대 적합 : 훈련 데이터에 너무 잘맞아버려서 일반성이 떨어지는 것 ( = 복잡도가 높은 모델 을 만든 것. ) -> Train Data에 너무 적응 해버려서 Test Data에서 높은 성능을 보여줄 수 없다. -> Train Data 이외의 다양한 변수에 대응하기 힘들다. ( = 새로운 데이터에 대응할 수 없다 . ) 예로 주어진 학습(Train) 데이터에서 만든 모델에 대한 성능을 올리기 위해 여러 규칙을 만들었다. ( 복잡도 증가 ) "A는 1보다 높고..", "B는 모두 Yes이며..", "C는 no인 경우.." 이런식으로 규칙을 늘린다면 성능은 높아질 것이다. 단, Train Data 한정 해서. 때문에, 새로운 데이터( Test.. 2021. 5. 25.