Intro
오늘 포스팅에서 다룰 주제는 Facebook에서 공개한 FBprophet 라이브러리를 활용한 시계열 데이터 예측입니다.
해당 라이브러리에 대한 자료는 아리 링크에서 확인하실수 있습니다.
https://facebook.github.io/prophet/docs/quick_start.html
해당 데이터는 캐글에 공개된 아보카도의 가격 관련 데이터입니다.
https://www.kaggle.com/neuromusic/avocado-prices
오늘 사용할 데이터 셋의 구성과 설명은 아래와 같습니다.
예측 진행 과정
FBprophet 라이브러리는 학습을 위해서
- 시간(Timeline)
- 예측값
데이터를 필요로 합니다.
따라서 아래와 같이 Date 칼럼과 오늘의 예측값인 AveragePrice를 준비해 줍니다.
- region을 grouping하여 해당 그룹들을 기준으로 Data에 따른 AveragePrice를 가지고 옴
- 여기선 TotalUS(즉 모든 그룹들)의 자료를 가지고 옴
결과 해석
- 모델을 불러온 후 위에서 처리한 data_price를 파라미터로 줌
- make_future_dataframe를 통해 기간 설정하며 predict를 통해 예측 진행 - periods=365는 향후 365일을 예측하겠다는 뜻
- 위 그래프를 통해 가격에 대한 향휴 365일의 예측값을 확인할 수 있음.
- 중간 그래프를 통해 큰 틀에서의 트랜드를, 아래 그래프를 통해 최근 1년동안의 트랜드를 파악할수 있음
'데이터분석 > with Python' 카테고리의 다른 글
[Python] seaborn을 사용한 데이터 시각화 (2) (0) | 2018.08.19 |
---|---|
[Python] seaborn을 사용한 데이터 시각화 (1) (0) | 2018.08.19 |
Batch, Mini-Batch, SGD 정의와 설명 및 예시 (5) | 2018.07.22 |
[Python] Voting Classifiers(다수결 분류)의 정의와 구현 (0) | 2018.07.09 |
[Python] 공공자전거 수요 예측 모델 만들기 (캐글 Bike Sharing Demand) (4) (0) | 2018.07.04 |