Sangwon Coding
프로젝트로 배우는 데이터 사이언스 - 탐색한 데이터로 모델성능 개선 본문
여러가지의 모델성능 개선 방법을 알 수 있었습니다.
1. Feature Engineering

2. One Hot Encoding

3. 결측치 값 대체하기(평균값, 중앙값)

4. 수치형 변수 정규분포 형태로 만들기(log)

5. 상관분석을 통해 파생변수 만들기

6. 이상치 다루기


7. Feature Scaling

최종적으로는 71%였던 정확도가 90%까지 올랐습니다.
이 개선한 데이터 셋을 다시 CSV파일로 저장하였습니다.

'부스트코스 > 프로젝트로 배우는 데이터 사이언스' 카테고리의 다른 글
프로젝트로 배우는 데이터 사이언스 - 프로젝트 A 리뷰 결과 (0) | 2020.06.29 |
---|---|
프로젝트로 배우는 데이터 사이언스 - 모델과 파라미터 찾기 (0) | 2020.06.23 |
프로젝트로 배우는 데이터 사이언스 - EDA를 통해 데이터 탐색하기 (0) | 2020.06.22 |
프로젝트로 배우는 데이터 사이언스 - 분류모델 기초 (0) | 2020.06.21 |