Sangwon Coding
프로젝트로 배우는 데이터 사이언스 - 탐색한 데이터로 모델성능 개선 본문
여러가지의 모델성능 개선 방법을 알 수 있었습니다.
1. Feature Engineering
2. One Hot Encoding
3. 결측치 값 대체하기(평균값, 중앙값)
4. 수치형 변수 정규분포 형태로 만들기(log)
5. 상관분석을 통해 파생변수 만들기
6. 이상치 다루기
7. Feature Scaling
최종적으로는 71%였던 정확도가 90%까지 올랐습니다.
이 개선한 데이터 셋을 다시 CSV파일로 저장하였습니다.
'부스트코스 > 프로젝트로 배우는 데이터 사이언스' 카테고리의 다른 글
프로젝트로 배우는 데이터 사이언스 - 프로젝트 A 리뷰 결과 (0) | 2020.06.29 |
---|---|
프로젝트로 배우는 데이터 사이언스 - 모델과 파라미터 찾기 (0) | 2020.06.23 |
프로젝트로 배우는 데이터 사이언스 - EDA를 통해 데이터 탐색하기 (0) | 2020.06.22 |
프로젝트로 배우는 데이터 사이언스 - 분류모델 기초 (0) | 2020.06.21 |
Comments