Sangwon Coding

프로젝트로 배우는 데이터 사이언스 - 탐색한 데이터로 모델성능 개선 본문

부스트코스/프로젝트로 배우는 데이터 사이언스

프로젝트로 배우는 데이터 사이언스 - 탐색한 데이터로 모델성능 개선

SW1 2020. 6. 23. 01:30

여러가지의 모델성능 개선 방법을 알 수 있었습니다.

 

1. Feature Engineering

 

 

2. One Hot Encoding

 

 

3. 결측치 값 대체하기(평균값, 중앙값)

 

 

4. 수치형 변수 정규분포 형태로 만들기(log)

 

 

5. 상관분석을 통해 파생변수 만들기

 

 

6. 이상치 다루기

 

 

7. Feature Scaling

 

 

최종적으로는 71%였던 정확도가 90%까지 올랐습니다.

이 개선한 데이터 셋을 다시 CSV파일로 저장하였습니다.

 

 

Comments