Skip to content

smu-kaggle-coding-club/titanic

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

titanic

Goal

  • Titanic tutorial(Random Forest 사용) 의 성능인 0.77511 보다 좋은 성능 내기

1. 데이터 읽기

  • Pandas, Numpy, Matplotlib 익숙해지기

2. 데이터 분석

  • 눈으로 분석
  • Correlation
  • PCA
  • Visualization

3. 데이터 전처리

  • train, test set으로 나누기.
  • NaN값 처리
  • 데이터의 유형 파악
    • Numerical
    • Categirical
  • 중요한 것은 Vectorization
  • Normalization

4. 학습

  • K-Fold 학습
    • train, validation set 나누기
  • Overfitting, Underfitting 이해하기
  • 다양한 모델 공부하기
    • Linear Models
    • Decision Tree Models
    • Clustering Models
    • Boosting Models
    • Deep Learning Models

5. 결과 제출

  • 결과 해석 및 개선 여지 파악

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published