정의
- 데이터의 편향 방지 + 편향된(잘못된) 모델 생성 방지
- 모집단의 특정 변수 비율에 맞추어 모집단을 쪼개어 해당 비율만큼 가지고 오는것(표본추출) = 비율을 맞춰줌
- 층 내는 동질하게, 층끼리는 이질적이게
- 전체 모집단 및 층별 특성도 효과적으로 추정가능
- 데이터 셋의 특성 분포를 고르게 해준다
구현
- 파이선 sklearn 모델을 통한 구현
- StratifiedshuffleSplit 함수 이용
'데이터분석 > with Python' 카테고리의 다른 글
[Python] SVM 서포트 백터 머신의 정의 및 예시 코드(sklearn) (2) (0) | 2018.04.15 |
---|---|
[Python] SVM 서포트 백터 머신의 정의 및 예시 코드(sklearn) (1) (0) | 2018.04.15 |
[Python] 비트파이넥스(Bitfinex) API를 활용한 비트코인 가격 데이터 수집 (0) | 2018.03.06 |
[Python] LSTM을 활용한 비트코인 가격 예측 및 결과측정 (1) | 2018.03.06 |
[Python] 비트코인 가격예측을 위한 학습 데이터 전처리 (3) (0) | 2018.03.06 |