프로젝트로 배우는 데이터 사이언스

Notice

Archives

관리 메뉴

Sangwon Coding

부스트코스/프로젝트로 배우는 데이터 사이언스

SW1 2020. 6. 21. 13:26

의사결정나무 알고리즘으로 간단한 분류 예측 모델을 만들었습니다.

데이터 셋은 당뇨병 데이터셋을 사용하였습니다.

Pima Indians Diabetes Database

Predict the onset of diabetes based on diagnostic measures

www.kaggle.com

실제 정답과 예측한 정답의 차를 합하여 diff_count 변수에 넣습니다.

전체 중에서 44개가 정답과 다릅니다.

모델의 옵션에서 다양한 값들이 랜덤하게 들어가므로 수치가 다를 수 있습니다.

71%의 예측도를 보입니다.

프로젝트로 배우는 데이터 사이언스 - 프로젝트 A 리뷰 결과 (0)	2020.06.29
프로젝트로 배우는 데이터 사이언스 - 모델과 파라미터 찾기 (0)	2020.06.23
프로젝트로 배우는 데이터 사이언스 - 탐색한 데이터로 모델성능 개선 (0)	2020.06.23
프로젝트로 배우는 데이터 사이언스 - EDA를 통해 데이터 탐색하기 (0)	2020.06.22