Sangwon Coding
프로젝트로 배우는 데이터 사이언스 - 분류모델 기초 본문
의사결정나무 알고리즘으로 간단한 분류 예측 모델을 만들었습니다.
데이터 셋은 당뇨병 데이터셋을 사용하였습니다.
https://www.kaggle.com/uciml/pima-indians-diabetes-database
Pima Indians Diabetes Database
Predict the onset of diabetes based on diagnostic measures
www.kaggle.com



실제 정답과 예측한 정답의 차를 합하여 diff_count 변수에 넣습니다.
전체 중에서 44개가 정답과 다릅니다.
모델의 옵션에서 다양한 값들이 랜덤하게 들어가므로 수치가 다를 수 있습니다.
71%의 예측도를 보입니다.
'부스트코스 > 프로젝트로 배우는 데이터 사이언스' 카테고리의 다른 글
프로젝트로 배우는 데이터 사이언스 - 프로젝트 A 리뷰 결과 (0) | 2020.06.29 |
---|---|
프로젝트로 배우는 데이터 사이언스 - 모델과 파라미터 찾기 (0) | 2020.06.23 |
프로젝트로 배우는 데이터 사이언스 - 탐색한 데이터로 모델성능 개선 (0) | 2020.06.23 |
프로젝트로 배우는 데이터 사이언스 - EDA를 통해 데이터 탐색하기 (0) | 2020.06.22 |
Comments