AutoGluon-TimeSeries PlatoBlockchain Data Intelligence를 통한 쉽고 정확한 예측. 수직 검색. 일체 포함.

AutoGluon-TimeSeries로 쉽고 정확한 예측

AutoGluon-TimeSeries는 AutoGluon의 최신 추가 기능으로 XNUMX줄의 코드만으로 강력한 시계열 예측 모델을 쉽게 구축할 수 있습니다.

시계열 예측은 다양한 산업 분야와 과학 분야에서 흔히 볼 수 있는 작업입니다. 공급, 수요 또는 용량에 대한 신뢰할 수 있는 예측에 액세스하는 것은 비즈니스 계획에 매우 중요합니다. 그러나 시계열 예측은 특히 전자 상거래의 대규모 카탈로그 판매 또는 수백 개의 운영 사이트 용량과 같이 잠재적으로 관련된 수천 개의 시계열을 사용할 수 있는 경우 어려운 문제입니다.

간단한 통계 또는 판단 기반 예측 방법은 새로운 기계 학습(ML) 방법으로 개선하기 어려운 이미 강력한 기준선인 경우가 많습니다. 또한 최근 ML의 발전을 예측에 적용하는 방법은 다양하며 다음과 같은 몇 가지 방법이 있습니다. DeepAR [1] 또는 Temporal Fusion Transformers [2]가 대중적인 선택으로 떠오르고 있습니다. 그러나 이러한 방법은 프로덕션에서 교육, 조정 및 배포하기가 어려우며 ML 및 시계열 분석에 대한 전문 지식이 필요합니다.

AutoML은 ML 내에서 빠르게 성장하는 주제로, 기능 전처리, 모델 선택, 모델 튜닝, 앙상블 및 배포를 포함하여 ML 파이프라인의 일반적인 작업 자동화에 중점을 둡니다. AutoGluon-TimeSeries는 오토글루온, 선도적인 오픈 소스 AutoML 솔루션 중 하나이며 예측 작업에서 AutoML을 위한 AutoGluon의 강력한 프레임워크를 기반으로 합니다. AutoGluon-TimeSeries는 최소 XNUMX줄의 코드로 강력한 예측 시스템을 구축하도록 설계되어 기능 전처리, 모델 선택, 모델 튜닝 및 배포 용이성 문제를 완화합니다.

AutoGluon-TimeSeries의 간단한 호출로 TimeSeriesPredictor, AutoGluon은 사용자가 지정한 시간 예산 내에서 간단한 순진한 기준선에서 시작하여 강력한 글로벌 신경망 및 강화된 트리 기반 방법으로 이동하는 피팅 모델의 직관적인 우선 순위를 따릅니다. 관련 시계열(시변 공변량 또는 외생 변수) 또는 항목 메타데이터(정적 기능)를 사용할 수 있는 경우 AutoGluon-TimeSeries는 이를 예측에 반영합니다. 또한 라이브러리는 하이퍼파라미터 튜닝을 위한 베이지안 최적화를 활용하여 복잡한 모델을 튜닝하여 최상의 모델 구성에 도달합니다. 마지막으로 AutoGluon-TimeSeries는 최고의 통계 및 ML 기반 방법을 당면한 문제에 최적화된 모델 앙상블에 결합합니다.

이 게시물에서는 AutoGluon-TimeSeries의 강력한 예측기를 빠르게 구축하는 데 사용하기 쉬운 방법을 보여줍니다.

AutoGluon-TimeSeries 시작하기

시작하려면 UNIX 셸에서 pip를 사용하여 쉽게 수행할 수 있는 AutoGluon을 설치해야 합니다.

pip install "autogluon>=0.6"

AutoGluon-TimeSeries는 TimeSeriesDataFrame 여러 관련 시계열을 포함하는 데이터 세트(패널 데이터 세트라고도 함)로 작업하기 위한 클래스입니다. 이러한 데이터 프레임은 시계열 ID와 타임스탬프가 행으로 정렬된 소위 긴 형식 데이터 프레임에서 만들 수 있습니다. 다음은 M4 경쟁[3]에서 가져온 그러한 데이터 예입니다. 여기서, item_id 열은 여러 제품의 일일 판매 데이터에 대한 제품 ID와 같은 단일 시계열의 고유 식별자를 지정합니다. 그만큼 target 열은 AutoGluon-TimeSeries가 예측하는 방법을 학습할 관심 값입니다. weekend 관찰이 주말인지 여부를 표시하기 위해 생성한 추가 시변 공변량입니다.

우리는 쉽게 새로운 것을 생산할 수 있습니다 TimeSeriesDataFrame 이 데이터 세트에서 from_data_frame 건설자. 다음 Python 코드를 참조하십시오.

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

일부 시계열 데이터에는 예측 모델 교육에 사용할 수 있는 시간에 따라 변하지 않는 기능(정적 기능 또는 항목 메타데이터)이 있습니다. 예를 들어 M4 데이터 세트는 각 시계열에 대한 범주 변수를 제공합니다. 다음 항목에 추가할 수 있습니다. TimeSeriesDataFrame ~을 설정하여 static_features 새로운 데이터 프레임이 있는 변수.

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence를 통한 쉽고 정확한 예측. 수직 검색. 일체 포함.

다음 코드를 사용하십시오.

df.static_features = raw_static_features

TimeSeriesPredictor 교육

마지막으로 호출할 수 있습니다. TimeSeriesPredictor 정확한 예측 시스템을 구축하기 위해 다양한 예측 모델에 적합합니다. 다음 코드를 참조하십시오.

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

여기에서 우리는 TimeSeriesPredictor 다음 XNUMX개 기간을 예측하는 모델을 생성하고 평균 절대 척도 오차를 사용하여 최상의 모델을 판단해야 합니다(마세). 또한, 우리는 시간에 따라 변하는 공변량을 나타냅니다. weekend 데이터 세트에서 사용할 수 있습니다. 이제 예측 객체를 TimeSeriesDataFrame 이전에 생산:

predictor.fit(df, presets="medium_quality", time_limit=1800)

교육 데이터를 제공하는 것 외에도 예측기에 다음을 사용하도록 요청합니다. “medium_quality” 프리셋. AutoGluon-TimeSeries에는 고려할 모델의 하위 집합을 선택하고 모델을 조정하는 데 소요되는 시간을 선택하여 훈련 속도와 정확도 간의 절충안을 관리할 수 있는 여러 사전 설정이 함께 제공됩니다. 사전 설정 외에도 경험이 많은 사용자는 다음을 사용할 수 있습니다. hyperparameters 구성 요소 모델과 모델에 설정할 하이퍼파라미터를 정확하게 지정하는 인수입니다. 또한 1,800초의 시간 제한을 지정하고 그 후에 예측기가 훈련을 중지합니다.

내부적으로 AutoGluon-TimeSeries는 순진하지만 강력한 기준선에서 시작하여 부스트 트리 및 신경망 모델을 기반으로 하는 더 복잡한 예측자를 향해 작업하면서 지정된 시간 프레임 내에서 가능한 한 많은 모델을 교육합니다. 전화로 predictor.leaderboard(), 훈련한 모든 모델의 목록과 각각의 정확도 점수 및 훈련 시간을 볼 수 있습니다. 모든 AutoGluon-TimeSeries 모델은 "높을수록 좋음" 형식으로 오류를 보고합니다. 즉, 보고될 때 대부분의 예측 오류 측정값에 -1을 곱합니다. 다음 예를 참조하십시오.

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

TimeSeriesPredictor를 사용한 예측

마지막으로 예측기를 사용하여 모든 시계열을 예측할 수 있습니다. TimeSeriesDataFrame, 7일 후의 미래. 미래에 알려질 것으로 가정되는 시변 공변량을 사용했기 때문에 이러한 공변량도 예측 시간에 지정해야 합니다. 다음 코드를 참조하십시오.

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

기본적으로 AutoGluon-TimeSeries는 대상 값의 포인트 예측과 확률적(분위수) 예측을 모두 제공합니다. 확률적 예측은 많은 계획 작업에서 필수적이며 간격을 유연하게 계산하는 데 사용할 수 있으므로 재고 및 용량 계획과 같은 다운스트림 작업을 가능하게 합니다.

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence를 통한 쉽고 정확한 예측. 수직 검색. 일체 포함.

다음은 포인트 예측 및 예측 구간을 보여주는 샘플 예측 도표입니다.

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence를 통한 쉽고 정확한 예측. 수직 검색. 일체 포함.

결론

AutoGluon-TimeSeries는 예측가와 데이터 과학자에게 강력한 예측 모델을 구축할 수 있는 빠르고 쉬운 방법을 제공합니다. AutoGluon-TimeSeries는 이 게시물에 소개된 라이브러리의 일반적으로 사용되는 일부 기능 외에도 고급 사용자를 위해 예측을 구성하는 일련의 방법을 제공합니다. 또한 예측자는 쉽게 교육, 배포 및 제공할 수 있습니다. 아마존 세이지 메이커, AutoGluon 딥 러닝 사용 용기.

AutoGluon 사용에 대한 자세한 내용, 예제, 자습서 및 표 형식 또는 다중 모달 데이터 학습과 같은 AutoGluon이 다루는 기타 작업은 다음을 방문하십시오. 오토글루온. AutoGluon-TimeSeries 사용을 시작하려면 다음을 확인하십시오. 빠른 시작 튜토리얼 또는 우리 심층 튜토리얼 라이브러리가 제공하는 모든 기능을 자세히 살펴보십시오. AutoGluon 팔로우 트위터, 그리고 우리를 스타 GitHub의 최신 업데이트를 알려드립니다.

전용 컴퓨팅 및 워크플로, 엔터프라이즈 수준 지원, 예측 설명 기능 등을 통해 규모에 맞게 예측하려면 다음을 확인하십시오. 아마존 예측.

참고자료

[1] Salinas, David, Valentin Fluunkert, Jan Gasthaus, Tim Januschowski. "DeepAR: 자동 회귀 순환 네트워크를 사용한 확률적 예측." 국제예측저널 36. 3(2020): 1181-1191.

[2] Lim, Bryan, Sercan O Arik, Nicolas Loeff 및 Tomas Pfister. "해석 가능한 다중 수평 시계열 예측을 위한 시간 융합 변환기." 국제예측저널 37.4 (2021) : 1748 - 1764.

[3] Makridakis, Spyros, Evangelos Spiliotis 및 Vassilios Assimakopoulos. "M4 경쟁: 100,000개의 시계열 및 61가지 예측 방법." 국제예측저널 36.1 (2020) : 54 - 74.


저자 소개

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence를 통한 쉽고 정확한 예측. 수직 검색. 일체 포함.카네르 투르크멘 Amazon Web Services의 응용 과학자로서 AutoGluon-TimeSeries 개발 외에도 기계 학습과 예측의 교차점에서 문제를 연구합니다. AWS에 합류하기 전에는 경영 컨설팅 업계에서 데이터 과학자로 근무하면서 전 세계 프로젝트에서 금융 서비스 및 통신 업계에 서비스를 제공했습니다. Caner의 개인 연구 관심 분야는 예측, 인과 관계 추론, AutoML을 비롯한 다양한 주제입니다.

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence를 통한 쉽고 정확한 예측. 수직 검색. 일체 포함.올렉산드르 슈추르 Amazon Web Services의 응용 과학자로서 AutoGluon-TimeSeries에서 시계열 예측 작업을 합니다. AWS에 합류하기 전에는 이벤트 데이터에 대한 확률 모델에 대한 연구를 수행하면서 독일 뮌헨 공과대학에서 기계 학습 박사 학위를 취득했습니다. 그의 연구 관심 분야는 시간 데이터 및 생성 모델링을 위한 기계 학습입니다.

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence를 통한 쉽고 정확한 예측. 수직 검색. 일체 포함.닉 에릭슨 Amazon Web Services의 선임 응용 과학자입니다. 그는 University of Minnesota Twin Cities에서 컴퓨터 과학 및 공학 석사 학위를 취득했습니다. 그는 오픈 소스 AutoML 프레임워크인 AutoGluon의 공동 저자이자 수석 개발자입니다. 2018년에 개인 경쟁 ML 도구 키트로 시작한 Nick은 AutoGluon의 기능을 지속적으로 확장하고 2019년에 Amazon AI에 합류하여 프로젝트를 오픈 소스로 만들고 AutoML의 최신 기술을 발전시키기 위해 풀타임으로 작업했습니다.

타임 스탬프 :

더보기 AWS 기계 학습