해당 분석은 여러 변수를 활용하여 "종류"를 예측하는 이진분류 모델을 voting classifier를 통해 구현해 본 것입니다.
순서는 아래와 같습니다.
Step 1.
전처리
Step 2.
모델링
Step 3.
모델 서빙
데이터 import 진행
데이터 split 진행
데이터의 outlier를 잡기 위하여
min-max가 아닌 robust scaling을 진행
타겟 변수인 예측을 위한 모델링 진행
이전 실험에서 가장 높은 정확도를 보인
Random Forest와 XGBoost에 대한 cross validation 진행
SVM / RF / XGB에 대한 grid search와
"soft" voting classifier 구현
"soft" voting classifier 구현 - 확률을 예측할 것이기 때문
sql server와 연동하여 model serving
- 예측치(확률)을 결과값으로 받을 수 있게
'데이터분석 > with Python' 카테고리의 다른 글
Confusion matrix와 Precision, Recall, F1-score의 이해 (0) | 2018.12.13 |
---|---|
[Python] seaborn을 사용한 데이터 시각화 (2) (0) | 2018.08.19 |
[Python] seaborn을 사용한 데이터 시각화 (1) (0) | 2018.08.19 |
[Python] fbprophet를 사용한 시계열 데이터 예측 (0) | 2018.07.29 |
Batch, Mini-Batch, SGD 정의와 설명 및 예시 (5) | 2018.07.22 |