Sangwon Coding

프로젝트로 배우는 데이터 사이언스 - 분류모델 기초 본문

부스트코스/프로젝트로 배우는 데이터 사이언스

프로젝트로 배우는 데이터 사이언스 - 분류모델 기초

SW1 2020. 6. 21. 13:26

의사결정나무 알고리즘으로  간단한 분류 예측 모델을  만들었습니다.

데이터 셋은 당뇨병  데이터셋을 사용하였습니다.

 

https://www.kaggle.com/uciml/pima-indians-diabetes-database

 

Pima Indians Diabetes Database

Predict the onset of diabetes based on diagnostic measures

www.kaggle.com

 

 

실제 정답과 예측한 정답의 차를 합하여 diff_count 변수에 넣습니다.

전체 중에서 44개가 정답과 다릅니다.

모델의 옵션에서 다양한 값들이 랜덤하게 들어가므로 수치가 다를 수 있습니다.

71%의 예측도를 보입니다.

Comments