AutoGluon-TimeSeries PlatoBlockchain Data Intelligence による簡単かつ正確な予測。垂直検索。あい。

AutoGluon-TimeSeries による簡単で正確な予測

AutoGluon-TimeSeries は AutoGluon に追加された最新の機能で、わずか XNUMX 行のコードで強力な時系列予測モデルを簡単に構築できます。

時系列予測は、さまざまな業界や科学分野で一般的なタスクです。 供給、需要、またはキャパシティの信頼できる予測にアクセスできることは、ビジネスの計画に不可欠です。 ただし、時系列の予測は困難な問題です。特に、e コマースの大規模なカタログの売上高や数百の運用サイトのキャパシティなど、関連する可能性のある数千の時系列が利用可能な場合はなおさらです。

単純な統計的または判断ベースの予測方法は、多くの場合、新しい機械学習 (ML) 方法で改善するのが困難な強力なベースラインです。 さらに、ML の最近の進歩の予測への応用はさまざまで、次のような方法はほとんどありません。 DeepAR [1] または Temporal Fusion Transformers [2] が一般的な選択肢として浮上しています。 ただし、これらの方法は、本番環境でのトレーニング、調整、デプロイが難しく、ML と時系列分析の専門知識が必要です。

AutoML は ML 内で急成長しているトピックであり、機能の前処理、モデルの選択、モデルの調整、アンサンブル、デプロイなど、ML パイプラインの一般的なタスクの自動化に焦点を当てています。 AutoGluon-TimeSeries は、 オートグルオンは、主要なオープンソース AutoML ソリューションの XNUMX つであり、予測タスクにおける AutoML のための AutoGluon の強力なフレームワークに基づいています。 AutoGluon-TimeSeries は、わずか XNUMX 行のコードで強力な予測システムを構築するように設計されており、機能の前処理、モデルの選択、モデルの調整、および展開の容易さに関する課題を軽減します。

AutoGluon-TimeSeries の単純な呼び出しで TimeSeriesPredictor、AutoGluon は、モデルのフィッティングにおいて直感的な優先順位に従います。つまり、単純な単純なベースラインから始まり、強力なグローバル ニューラル ネットワークとブーストされたツリーベースの方法に移行します。これらはすべて、ユーザーが指定した時間枠内で行われます。 関連する時系列 (時変共変量または外生変数) またはアイテム メタデータ (静的特徴) が利用可能な場合、AutoGluon-TimeSeries はそれらを予測に考慮します。 このライブラリは、ハイパーパラメーターの調整にベイジアン最適化も利用し、複雑なモデルを調整することで最適なモデル構成に到達します。 最後に、AutoGluon-TimeSeries は、統計および ML ベースの方法の最良のものを、当面の問題に最適化されたモデル アンサンブルに結合します。

この投稿では、AutoGluon-TimeSeries の使いやすさを紹介し、強力な予測ツールをすばやく構築します。

AutoGluon-TimeSeries を使い始める

まず、AutoGluon をインストールする必要があります。これは、UNIX シェルで pip を使用して簡単に実行できます。

pip install "autogluon>=0.6"

AutoGluon-TimeSeries は、 TimeSeriesDataFrame 関連する複数の時系列を含むデータセット (パネル データセットと呼ばれることもあります) を操作するためのクラス。 これらのデータ フレームは、時系列 ID とタイムスタンプが行に配置された、いわゆるロング フォーマット データ フレームから作成できます。 以下は、M4 コンペティション [3] から取得した、そのようなデータの例の XNUMX つです。 ここで、 item_id 列は、複数の製品の日次売上データの製品 ID など、単一の時系列の一意の識別子を指定します。 の target column は、AutoGluon-TimeSeries が学習して予測する対象の値です。 weekend 観測が週末にあったかどうかをマークするために作成した追加の時変共変量です。

簡単に新しいものを作ることができます TimeSeriesDataFrame を使用してこのデータセットから from_data_frame コンストラクタ。 次の Python コードを参照してください。

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

一部の時系列データには、予測モデルのトレーニングに使用できる非時変機能 (静的機能またはアイテム メタデータ) があります。 たとえば、M4 データセットには、各時系列のカテゴリ変数があります。 これらは、 TimeSeriesDataFrame 設定することにより static_features 新しいデータ フレームを持つ変数。

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence による簡単かつ正確な予測。垂直検索。あい。

次のコードを使用します。

df.static_features = raw_static_features

TimeSeriesPredictor のトレーニング

最後に、 TimeSeriesPredictor 幅広い予測モデルに適合し、正確な予測システムを構築します。 次のコードを参照してください。

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

ここで、 TimeSeriesPredictor 次の XNUMX つの期間を予測するモデルを作成し、平均絶対スケーリング誤差を使用して最適なモデルを判断する必要があります (間瀬)。 さらに、時変共変量 weekend データセットで利用できます。 これで、予測オブジェクトを TimeSeriesDataFrame 以前に作成された:

predictor.fit(df, presets="medium_quality", time_limit=1800)

トレーニング データの提供とは別に、予測子に使用を依頼します。 “medium_quality” プリセット。 AutoGluon-TimeSeries には、考慮すべきモデルのサブセットを選択するための複数のプリセットが付属しており、トレーニング速度と精度の間のトレードオフを管理しながら、それらを調整するのにどれだけの時間を費やすことができます。 プリセットとは別に、経験豊富なユーザーは hyperparameters コンポーネント モデルと、それらに設定するハイパーパラメータを正確に指定するための引数。 また、1,800 秒の時間制限を指定します。その後、予測子はトレーニングを停止します。

内部的には、AutoGluon-TimeSeries は指定された時間枠内でできるだけ多くのモデルをトレーニングします。単純だが強力なベースラインから始まり、ブーストされたツリーとニューラル ネットワーク モデルに基づくより複雑な予測器に向かって作業します。 電話することで predictor.leaderboard()、トレーニングしたすべてのモデルのリストと、それぞれの精度スコアとトレーニング時間を確認できます。 すべての AutoGluon-TimeSeries モデルは、その誤差を「高いほど良い」形式で報告することに注意してください。これは、ほとんどの予測誤差測定値が報告されるときに -1 を掛けることを意味します。 次の例を参照してください。

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

TimeSeriesPredictor による予測

最後に、予測子を使用して、すべての時系列を予測できます。 TimeSeriesDataFrame、7 日後。 将来既知であると想定される時変共変量を使用したため、これらも予測時に指定する必要があることに注意してください。 次のコードを参照してください。

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

デフォルトでは、AutoGluon-TimeSeries は目標値のポイント予測と確率 (分位) 予測の両方を提供します。 確率的予測は、多くの計画タスクに不可欠であり、間隔を柔軟に計算するために使用できるため、在庫やキャパシティ プランニングなどのダウンストリーム タスクが可能になります。

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence による簡単かつ正確な予測。垂直検索。あい。

以下は、ポイント予測と予測間隔を示す予測プロットのサンプルです。

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence による簡単かつ正確な予測。垂直検索。あい。

まとめ

AutoGluon-TimeSeries は、予測担当者やデータ サイエンティストが強力な予測モデルを構築するための迅速かつ簡単な方法を提供します。 この投稿で紹介されているライブラリの一般的に使用される機能のいくつかに加えて、AutoGluon-TimeSeries には、上級ユーザー向けの予測を構成する一連の方法があります。 また、Predictor は簡単にトレーニング、デプロイ、および大規模なサービスを提供できます。 アマゾンセージメーカー、AutoGluonディープラーニングを使用 コンテナ.

AutoGluon の使用、例、チュートリアル、および表形式またはマルチモーダル データの学習など AutoGluon が取り組むその他のタスクの詳細については、次を参照してください。 オートグルオン. AutoGluon-TimeSeries の使用を開始するには、こちらをご覧ください クイックスタートチュートリアル または当社の 詳細なチュートリアル ライブラリが提供するすべての機能を詳しく調べるには。 AutoGluonをフォローする Twitter、そして私たちにスターをつけてください GitHubの 最新の更新情報を通知します。

専用のコンピューティングとワークフロー、エンタープライズ レベルのサポート、予測の説明可能性などを使用した大規模な予測については、こちらもご覧ください アマゾン予測.

参考文献

[1] サリナス、デビッド、バレンティン フランケルト、ヤン ガストハウス、ティム ヤヌショースキー。 「DeepAR: 自己回帰再帰型ネットワークによる確率的予測。」 予測の国際ジャーナル 36. 3 (2020): 1181-1191。

[2] リム、ブライアン、セルカン・オ・アリック、ニコラス・ロフ、トーマス・フィスター。 「解釈可能なマルチホライズン時系列予測のためのTemporal Fusion Transformers。」 予測の国際ジャーナル 37.4(2021):1748-1764。

[3] マクリダキス、スピロス、エヴァンゲロス・スピリオティス、ヴァシリオス・アシマコプロス。 「M4 コンペティション: 100,000 の時系列と 61 の予測方法。」 予測の国際ジャーナル 36.1(2020):54-74。


著者について

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence による簡単かつ正確な予測。垂直検索。あい。カネル・トルクメン アマゾン ウェブ サービスの応用科学者であり、AutoGluon-TimeSeries の開発に加えて、機械学習と予測が交差する問題に取り組んでいます。 AWS に入社する前は、経営コンサルティング業界でデータサイエンティストとして働き、世界中のプロジェクトで金融サービスおよび電気通信業界にサービスを提供していました。 Caner の個人的な研究対象は、予測、因果推論、AutoML など、さまざまなトピックに及びます。

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence による簡単かつ正確な予測。垂直検索。あい。オレクサンドル・シュクール アマゾン ウェブ サービスの応用科学者で、AutoGluon-TimeSeries の時系列予測に取り組んでいます。 AWS に入社する前は、ドイツのミュンヘン工科大学で機械学習の博士号を取得し、イベント データの確率モデルに関する研究を行っていました。 彼の研究対象には、時系列データの機械学習と生成モデリングが含まれます。

AutoGluon-TimeSeries PlatoBlockchain Data Intelligence による簡単かつ正確な予測。垂直検索。あい。ニック・エリクソン アマゾン ウェブ サービスの上級応用科学者です。 彼は、ミネソタ大学ツインシティーズ校でコンピューター サイエンスとエンジニアリングの修士号を取得しています。 彼は、オープンソースの AutoML フレームワーク AutoGluon の共著者であり、主任開発者でもあります。 Nick は 2018 年に個人競技用 ML ツールキットとして開始し、AutoGluon の機能を継続的に拡張し、2019 年に Amazon AI に参加してプロジェクトをオープンソース化し、AutoML の最先端を前進させるためにフルタイムで取り組んでいます。

タイムスタンプ:

より多くの AWS機械学習