Sangwon Coding
프로젝트로 배우는 데이터 사이언스 - 모델과 파라미터 찾기 본문
1. Random Forest
트리를 앙상블 기법(여러 기법을 섞어서 사용하는 기법)에 사용할 수 있습니다.
Random Forest는 샘플링하여 여러 데이터를 만들며, 이 샘플은 부트스트랩이라고 합니다.
이를 통해 오버피팅을 방지할 수 있습니다.
2. Gradient Boosting
boosting은 트리에 가중치를 부여합니다.
RamdomSearchCV를 사용해서 여러 알고리즘 속에 최적의 하이퍼 파라미터를 찾아봅니다.




맨 위에서부터 차례대로 높은 정확도를 가집니다.
'부스트코스 > 프로젝트로 배우는 데이터 사이언스' 카테고리의 다른 글
프로젝트로 배우는 데이터 사이언스 - 프로젝트 A 리뷰 결과 (0) | 2020.06.29 |
---|---|
프로젝트로 배우는 데이터 사이언스 - 탐색한 데이터로 모델성능 개선 (0) | 2020.06.23 |
프로젝트로 배우는 데이터 사이언스 - EDA를 통해 데이터 탐색하기 (0) | 2020.06.22 |
프로젝트로 배우는 데이터 사이언스 - 분류모델 기초 (0) | 2020.06.21 |