• 해당 분석은 여러 변수를 활용하여 "종류"를 예측하는 이진분류 모델을 voting classifier를 통해 구현해 본 것입니다.

  • 순서는 아래와 같습니다.


Step 1.

전처리


Step 2. 

모델링


Step 3. 

모델 서빙



데이터 import 진행


데이터 split 진행





데이터의 outlier를 잡기 위하여 

min-max가 아닌 robust scaling을 진행 




타겟 변수인 예측을 위한 모델링 진행




이전 실험에서 가장 높은 정확도를 보인 

Random Forest와 XGBoost에 대한 cross validation 진행


SVM / RF / XGB에 대한 grid search와 

"soft" voting classifier 구현 




"soft" voting classifier 구현 - 확률을 예측할 것이기 때문



sql server와 연동하여 model serving

- 예측치(확률)을 결과값으로 받을 수 있게



+ Recent posts