Webトラフィックにリソースをより効率的に割り当てる場合でも、スタッフのニーズに対する患者の需要を予測する場合でも、企業の製品の売上を予測する場合でも、予測は多くのビジネスにとって不可欠なツールです。 として知られているXNUMXつの特定のユースケース コールドスタート予測は、小売業界で市場に参入したばかりの新製品など、既存の履歴データがほとんどまたはまったくない時系列の予測を作成します。 自己回帰和分移動平均(ARIMA)や指数平滑法(ES)などの従来の時系列予測方法は、個々の製品の過去の時系列に大きく依存しているため、コールドスタート予測には効果的ではありません。
この投稿では、を使用してコールドスタート予測エンジンを構築する方法を示します 時系列予測のためのAutoGluonAutoML、画像、テキスト、表形式、時系列データの機械学習(ML)を自動化するオープンソースのPythonパッケージ。 AutoGluonは、初心者から経験豊富なML開発者まで、エンドツーエンドの自動機械学習(AutoML)パイプラインを提供し、最も正確で使いやすい完全自動化ソリューションになります。 無料で利用しています AmazonSageMakerStudioラボ このデモンストレーションのためのサービス。
AutoGluon時系列の概要
オートグルオン は、テキスト、画像、表形式のデータ用のAutoMLの主要なオープンソースライブラリであり、XNUMX行のコードで生データから高精度のモデルを作成できます。 最近、チームはこれらの機能を時系列データに拡張するために取り組んでおり、で公開されている自動予測モジュールを開発しました。 GitHubのを選択します。 autogluon.forecasting
モジュールは、生の時系列データを適切な形式に自動的に処理し、さまざまな最先端の深層学習モデルをトレーニングおよび調整して、正確な予測を生成します。 この投稿では、使用方法を示します autogluon.forecasting
コールドスタート予測タスクに適用します。
ソリューションの概要
AutoGluonはオープンソースのPythonパッケージであるため、このソリューションを実装できます 局部的に ラップトップまたはAmazonSageMakerStudioLabで。 次の手順を実行します。
- Amazon SageMakerStudioLab用にAutoGluonをセットアップします。
- データセットを準備します。
- AutoGluonを使用してトレーニングパラメータを定義します。
- 時系列予測用のコールドスタート予測エンジンをトレーニングします。
- コールドスタート予測の予測を視覚化します。
コールドスタート予測の重要な前提は、次の図に示すように、同様の特性を持つアイテムが同様の時系列軌道を持つ必要があることです。これにより、コールドスタート予測で履歴データのないアイテムを予測できます。
ウォークスルーでは、電力消費量に基づく合成データセットを使用します。これは、370アイテムの時間ごとの時系列で構成され、それぞれに item_id
0〜369。 この合成データセット内で、それぞれ item_id
静的機能(時間の経過とともに変化しない機能)にも関連付けられています。 私たちは訓練します DeepAR AutoGluonを使用してモデル化し、類似したアイテムの典型的な動作を学習し、そのような動作を転送して新しいアイテムの予測を行います(item_id
370–373)過去の時系列データがありません。 静的機能をXNUMXつだけ使用するコールドスタート予測アプローチを示していますが、実際には、有益で高品質の静的機能を持つことが、優れたコールドスタート予測の鍵となります。
次の図は、ソリューションの概要を示しています。 オープンソースコードは、 GitHubレポ.
前提条件
このチュートリアルでは、次の前提条件を満たしている必要があります。
- An Amazon SageMakerStudioLabアカウント
- GitHubの アカウントへのアクセス
Amazon SageMaker Studio Labアカウントにログインし、ターミナルを使用して環境をセットアップします。
これらの手順は、Amazon SageMaker Studio Labにアクセスできない場合でも、ラップトップから機能するはずです(最初にラップトップにAnacondaをインストールすることをお勧めします)。
仮想環境が完全にセットアップされたら、ノートブックを起動します AutoGluon-cold-start-demo.ipynb
カスタム環境を選択します .conda-autogluon:Python
カーネル。
ターゲットの時系列とアイテムのメタデータセットを準備します
次のデータセットが含まれていない場合は、ノートブックインスタンスにダウンロードし、ディレクトリに保存します data/
。 これらのデータセットは、 GitHubレポ:
- テスト.csv.gz
- コールドスタートターゲットデータ.csv
- アイテムメタデータ.csv
次のスニペットを実行して、ターゲットの時系列データセットをカーネルにロードします。
AutoGluon時系列では、静的フィーチャを数値形式で表す必要があります。 これは、適用することで達成できます LabelEncoder()
静的機能について type
、ここで、A = 0、B = 1、C = 2、D = 3をエンコードします(次のコードを参照)。 デフォルトでは、AutoGluonは静的機能が通常またはカテゴリのいずれかであると推測します。 静的フィーチャ列をカテゴリフィーチャの場合はオブジェクト/文字列データ型に、順序フィーチャの場合は整数/フロートデータ型に変換することで、これを上書きすることもできます。
AutoGluonモデルトレーニングを設定して開始します
指定する必要があります save_path = ‘autogluon-coldstart-demo’
モデルアーティファクトフォルダー名として(次のコードを参照)。 また、 eval_metric
as 平均絶対パーセント率または ‘MAPE’
略して、私たちが定義した場所 prediction_length
24時間として。 指定されていない場合、AutoGluonはデフォルトで確率的予測を生成し、 加重分位損失。 私たちは見ているだけです DeepARモデル デモでは、DeepARアルゴリズムが設計によるコールドスタート予測を可能にすることがわかっているためです。 DeepARハイパーパラメータのXNUMXつを任意に設定し、そのハイパーパラメータを ForecastingPredictor().fit()
電話。 これにより、AutoGluonは指定されたモデルのみを調べることができます。 調整可能なハイパーパラメータの完全なリストについては、を参照してください。 gluonts.model.deeparパッケージ.
トレーニングには30〜45分かかります。 次の関数を呼び出すと、モデルの概要を取得できます。
コールドスタート項目の予測
これで、コールドスタートアイテムの予測を生成する準備が整いました。 それぞれに少なくともXNUMX行を設定することをお勧めします item_id
。 したがって、 item_id
観測値がXNUMXつ未満の場合は、NaNを入力します。 私たちのデモでは、両方 item_id
370と372の観測値はゼロであり、純粋なコールドスタートの問題ですが、他のXNUMXつにはXNUMXつのターゲット値があります。
次のコードを使用して、コールドスタートターゲット時系列データセットをロードします。
コールドスタートのターゲット時系列を、コールドスタートのアイテムメタデータセットとともにAutoGluonモデルにフィードします item_id
:
予測を視覚化する
次のグラフに示すように、プロット関数を作成して、コールドスタート予測の視覚化を生成できます。
クリーンアップ
リソースの使用を最適化するには、ノートブックを完全に調べた後、Amazon SageMakerStudioLabでランタイムを停止することを検討してください。
まとめ
この投稿では、Amazon SageMakerStudioLabの時系列データにAutoGluonAutoMLを使用してコールドスタート予測エンジンを構築する方法を示しました。 違いを知りたい方へ アマゾン予測 AutoGluon(時系列)であるAmazon Forecastは、機械学習(ML)を使用して、事前のMLの経験を必要とせずに、非常に正確な予測を生成する、完全に管理およびサポートされるサービスです。 AutoGluonは、最新の研究貢献でコミュニティがサポートするオープンソースプロジェクトです。 エンドツーエンドの例をウォークスルーして、時系列のAutoGluonが何を実行できるかを示し、データセットとユースケースを提供しました。
時系列データ用のAutoGluonはオープンソースのPythonパッケージであり、この投稿がコード例とともに、困難なコールドスタート予測の問題に取り組むための簡単なソリューションを提供することを願っています。 あなたは私たちの例全体にアクセスすることができます GitHubレポ。 試してみて、あなたの考えを教えてください!
著者について
イヴァン・クイ はAWSProfessional Servicesのデータサイエンティストであり、お客様がAWSで機械学習を使用してソリューションを構築およびデプロイするのを支援しています。 彼は、ソフトウェア、金融、製薬、ヘルスケアなど、さまざまな業界の顧客と協力してきました。 自由な時間には、読書を楽しんだり、家族と過ごしたり、株式ポートフォリオを最大限に活用したりしています。
ジョナス・ミューラー AWSのAIResearchand Educationグループのシニアアプライドサイエンティストであり、ディープラーニングを改善し、自動機械学習を開発するための新しいアルゴリズムを開発しています。 AWSに参加してMLを民主化する前に、彼はMITコンピューター科学人工知能研究所で博士号を取得しました。 余暇には、山やアウトドアを楽しむことができます。
ウェンミンイェ AWSAIのリサーチプロダクトマネージャーです。 彼は、オープンソースで最先端の機械学習テクノロジーを通じて、研究者や企業顧客がイノベーションを迅速に拡大できるよう支援することに情熱を注いでいます。 Wenmingは、Microsoft Research、SQLエンジニアリングチーム、および成功したスタートアップからの多様なR&D経験を持っています。
- "
- 100
- 9
- 私たちについて
- 絶対の
- アクセス
- 正確な
- 達成
- 越えて
- AI
- 愛の研究
- アルゴリズム
- アルゴリズム
- 許可
- しかし
- Amazon
- 適用
- アプローチ
- 人工の
- 人工知能
- 自動化
- 利用できます
- 平均
- AWS
- ビルド
- 構築します
- ビジネス
- コール
- 取得することができます
- 機能
- CD
- 変化する
- 注文
- コード
- コラム
- コミュニティ
- 会社の
- コンピュータサイエンス
- 消費
- Customers
- データ
- データサイエンティスト
- 需要
- 展開します
- 設計
- 開発する
- 発展した
- 開発者
- そうではありません
- 教育
- 効果的な
- 電気
- エンジニアリング
- 入力されました
- Enterprise
- 環境
- 本質的な
- 例
- 体験
- 経験豊かな
- 伸ばす
- 家族
- 特徴
- 特徴
- フィギュア
- ファイナンス
- 名
- フォロー中
- 形式でアーカイブしたプロジェクトを保存します.
- 無料版
- フル
- function
- 未来
- 生成する
- Gitの
- 良い
- グループ
- 持って
- ヘルスケア
- ことができます
- 非常に
- 歴史的
- 認定条件
- How To
- HTTPS
- 画像
- 実装する
- 改善します
- 含まれました
- 含めて
- 個人
- 産業
- 産業を変えます
- 統合された
- インテリジェンス
- IT
- キー
- 既知の
- ノートパソコン
- 最新の
- 起動する
- 主要な
- LEARN
- 学習
- 図書館
- LINE
- リスト
- 少し
- 負荷
- 機械
- 機械学習
- 作成
- マネージャー
- 市場
- Meta
- Microsoft
- マサチューセッツ工科大学(MIT)
- ML
- モデル
- 最も
- 移動する
- 新製品
- ノート
- オープンソースコード
- その他
- 屋外で
- 割合
- 薬剤
- ポートフォリオ
- 予測
- 問題
- 問題
- ラボレーション
- 作り出す
- プロダクト
- 製品
- プロ
- プロジェクト
- は、大阪で
- R&D
- Raw
- リーディング
- 推奨する
- 研究
- リソースを追加する。
- リソース
- 小売
- セールス
- 規模
- スケーリング
- 科学
- 科学者
- シリーズ
- サービス
- サービス
- セッションに
- ショート
- 同様の
- ソフトウェア
- ソリューション
- 支出
- start
- スタートアップ
- 株式
- 研究
- 成功した
- サポート
- ターゲット
- タスク
- チーム
- テクノロジー
- ターミナル
- 介して
- 時間
- 一緒に
- 伝統的な
- トラフィック
- トレーニング
- 列車
- us
- つかいます
- バーチャル
- 可視化
- ウェブ
- この試験は
- 誰
- 以内
- 無し
- 仕事
- 働いていました
- ワーキング
- ゼロ