小売業界での Amazon Forecast の実装: POC から本番環境の PlatoBlockchain データ インテリジェンスへの旅。垂直検索。あい。

小売業界での Amazon Forecast の実装: POC から本番環境への旅

アマゾン予測 は、統計および機械学習 (ML) アルゴリズムを使用して非常に正確な時系列予測を提供するフルマネージド サービスです。 最近、Amazon Forecast に基づいて、小売顧客の 8 社が 10 週間以内に正確な需要予測を達成するのを支援しました。 このソリューションは、手動予測を平均 XNUMX% 改善しました。 振る メトリック。 これにより、毎月 16 時間の労働時間を直接節約できます。 さらに、正しい数のアイテムをフルフィルメントすることで、売上が最大 11.8% 増加する可能性があると推定しました。 この投稿では、概念実証 (POC) から生産まで、小売業界の課題に焦点を当てた Amazon Forecast を使用した需要予測システムを実装するためのワークフローと重要な要素を紹介します。

小売業界における需要予測の背景と現在の課題

需要予測の目標は、履歴データから将来の需要を予測し、店舗の補充と容量の割り当てを支援することです。 需要予測により、小売業者はネットワーク内の各場所に適切な量の在庫を配置して、需要を満たすことができます。 したがって、正確な予測システムは、次のようなさまざまなビジネス機能にわたって幅広いメリットをもたらすことができます。

  • より良い製品の入手可能性による売上の増加と、店舗間の移動の無駄の労力の削減
  • より信頼性の高い洞察を提供して、容量の使用率を改善し、容量プロビジョニングのボトルネックを事前に回避します
  • 在庫と生産コストを最小限に抑え、在庫回転率を向上させます
  • 全体的に優れた顧客体験を提供する

ML 手法は、高品質のデータが大量に存在する場合に大きな価値を発揮します。 今日、経験ベースの補充管理または需要予測は、ほとんどの小売業者にとって依然として主流です。 カスタマー エクスペリエンスの向上を目標に、経験に基づく需要予測システムを ML ベースの予測に置き換えようとする小売業者がますます増えています。 ただし、小売業者は、ML ベースの需要予測システムを本番環境に実装する際に、複数の課題に直面しています。 さまざまな課題を、データの課題、ML の課題、運用の課題の XNUMX つのカテゴリにまとめます。

データの課題

大量のクリーンで高品質なデータは、正確な ML ベースの予測を推進するための重要な要件です。 過去の販売および販売関連データ (在庫、商品価格、プロモーションなど) を含む品質データを収集して統合する必要があります。 複数のリソースからのデータの多様性には、データ サイロを統合するための最新のデータ プラットフォームが必要です。 さらに、頻繁かつ詳細な需要予測を行うには、タイムリーにデータにアクセスする必要があります。

機械学習の課題

高度な ML アルゴリズムの開発には専門知識が必要です。 適切な問題に対して適切なアルゴリズムを実装するには、ドメインに関する深い知識と ML の能力の両方が必要です。 さらに、利用可能な大規模なデータセットから学習するには、スケーラブルな ML インフラストラクチャが必要です。 さらに、本番環境で ML アルゴリズムを維持するには、モデルの劣化の根本原因を分析し、モデルを正しく再トレーニングするために ML の能力が必要です。

実際のビジネス上の問題を解決するために、正確な予測を作成することは話の一部にすぎません。 意思決定者は、さまざまな分位点での確率的予測を必要とし、重要な顧客体験と財務結果のトレードオフの決定を行います。 また、利害関係者に予測を説明し、what-if 分析を実行して、さまざまなシナリオが予測結果にどのように影響するかを調査する必要もあります。

運用上の課題

費用対効果の高い予測システムを維持するための運用上の労力を削減することが、XNUMX つ目の主要な課題です。 需要予測の一般的なシナリオでは、各場所の各アイテムに独自の予測があります。 数十万の予測をいつでも管理できるシステムが必要です。 さらに、ビジネス エンド ユーザーは、既存のツールやプロセスを変更せずに ML ベースのシステムを使用できるように、既存のサプライ チェーン管理プラットフォームなどの既存のダウンストリーム システムに予測システムを統合する必要があります。

これらの課題は、ビジネスが大規模でダイナミックで成長している場合に特に深刻です。 これらの課題に対処するために、潜在的なビジネスの利益を迅速に検証する労力を削減するお客様の成功事例を共有します。 これは、基盤となるインフラストラクチャ リソースとアルゴリズムを管理する必要なく、正確な予測結果を提供するフルマネージド サービスである Amazon Forecast を使用したプロトタイピングによって実現されます。

Amazon Forecast を使用した ML ベースの予測システムのラピッド プロトタイピング

私たちの経験に基づくと、小売業のお客様は、販売データの概念実証を喜んで開始することがよくあります。 これは、ラピッド プロトタイピングの場合、数日から数週間の範囲内で実行できます。これは、データの複雑さと、モデル チューニング プロセスを反復するために利用できるリソースによって異なります。 プロトタイピング中は、スプリントを使用してプロセスを効果的に管理し、POC をデータ探索、反復改善、および自動化フェーズに分けることをお勧めします。

データの探索

データ探索では、多くの場合、データ サイエンティストやビジネス インテリジェンス アナリストとの激しい議論が行われ、在庫や過去の販売促進イベントなど、予測結果に影響を与える可能性のある過去の販売データセットや利用可能なデータ ソースに精通します。 最も効率的な方法の XNUMX つは、プロジェクトの初期段階でデータ ウェアハウスから売上データをターゲット データセットとして統合することです。 これは、予測結果がターゲット データセットのパターンによって支配されることが多いという事実に基づいています。 多くの場合、データ ウェアハウスには日々のビジネス データが格納されており、短期間で完全に理解することは難しく、時間がかかります。 私たちの提案は、ターゲット データセットの生成に集中し、このデータセットが正しいことを確認することです。 これらのデータ探索とベースラインの結果は、多くの場合、数日以内に達成できます。これにより、ターゲット データが正確に予測できるかどうかを判断できます。 この投稿の後半で、データの予測可能性について説明します。

繰り返し

ベースラインの結果が得られたら、引き続き関連データを追加して、これらが精度にどのように影響するかを確認できます。 これは多くの場合、追加のデータセットを深く掘り下げることによって行われます。 詳細については、を参照してください。 関連する時系列データセットの使用 & アイテム メタデータ データセットの使用.

場合によっては、同様に動作するデータセットのサブセットでモデルをトレーニングするか、データセットからまばらなデータを削除することで、Amazon Forecast の精度を向上できる場合があります。 この反復的な改善フェーズで難しいのは、すべての ML プロジェクトに当てはまることですが、現在の反復は前の反復の重要な調査結果と洞察に依存しているため、厳密な分析とレポートが成功の鍵となります。

分析は、定量的かつ経験的に行うことができます。 定量的側面とは、バックテスト中の評価と、次のような精度指標の比較を指します。 振る. 経験的側面とは、予測曲線と実際のターゲット データを視覚化し、ドメイン知識を使用して潜在的な要因を組み込むことを指します。 これらの分析は、予測結果とターゲット データの間のギャップを埋めるために、より迅速に反復するのに役立ちます。 さらに、そのような結果を週次レポートで提示することで、多くの場合、ビジネス エンド ユーザーに自信を与えることができます。

オートメーション

最後のステップでは、多くの場合、POC から生産手順および自動化までの議論が行われます。 ML プロジェクトはプロジェクトの合計期間によって制約されるため、すべての可能性を探るのに十分な時間がない場合があります。 したがって、プロジェクト中の調査結果を通じて潜在的な領域を示すことで、多くの場合、信頼を得ることができます。 さらに、自動化は、既存の予測子を使用して更新されたデータで予測を生成できるため、ビジネス エンド ユーザーが長期間にわたって Forecast を評価するのに役立ちます。

成功基準は、技術的観点とビジネス的観点の両方から、生成された結果で評価できます。 評価期間中に、次の潜在的なメリットを見積もることができます。

  • 予測精度の向上 (テクニカル) – 実際の販売データに関する予測精度を計算し、手動予測を含む既存の予測システムと比較します
  • 廃棄物の削減(事業) – 無駄を減らすために過剰な予測を減らす
  • 在庫率の向上(ビジネス) – 在庫率を改善するために、アンダー予測を減らします
  • 売上総利益(事業)の伸びの試算 – 無駄を減らし、在庫率を改善して、粗利益を増やします

次の図に、開発ワークフローをまとめます。

以下のセクションでは、実装時に考慮すべき重要な要素について説明します。

予測システムを開発するための段階的なワークフロー

ターゲット データセットの生成

最初のステップは、Forecast のターゲット データセットを生成することです。 小売業界では、これは小売品目 (SKU) の過去の時系列の需要と販売データを指します。 データセットを準備するときの重要な側面の XNUMX つは、粒度です。 ビジネス要件と技術要件の両方から、データの粒度を考慮する必要があります。

ビジネスは、本番システムでの予測結果を次のように定義します。

  • 地平線 – 予測される時間ステップの数。 これは、根本的なビジネス上の問題によって異なります。 毎週在庫レベルを補充したい場合は、週次予測または日次予測が適切と思われます。
  • 粒度 – 予測の粒度: 毎日または毎週などの時間頻度、さまざまな店舗の場所、同じアイテムのさまざまなサイズ。 最終的に、予測は、各店舗の SKU と毎日のデータ ポイントを組み合わせたものになります。

前述の予測期間と粒度は、ビジネス要件の優先順位を付けるために定義する必要がありますが、要件と実現可能性の間でトレードオフを行う必要がある場合があります。 一例としてフットウェア事業を考えてみましょう。 各店舗レベルで各サイズの靴の売上を予測したい場合、すぐにデータがまばらになり、パターンを見つけるのが難しくなります。 ただし、在庫を補充するには、この粒度を見積もる必要があります。 これを行うには、別のソリューションでは、異なる靴のサイズ間の比率を推定し、この比率を使用してきめ細かな結果を計算する必要がある場合があります。

多くの場合、ビジネス要件と、学習して予測に使用できるデータ パターンとのバランスを取る必要があります。 データ パターンの定量的な条件を提供するために、データの予測可能性を使用することを提案します。

データの予測可能性とデータ パターンの分類

ターゲット データセットから収集できる重要な洞察の XNUMX つは、品質予測を生成する能力です。 これは、ML プロジェクトの非常に早い段階で分析できます。 予測は、データが季節性、傾向、周期的パターンを示している場合に役立ちます。

予測可能性を判断するには、需要のタイミングの変動性と需要量の変動性の XNUMX つの主要な係数があります。 需要のタイミングの変動性とは、需要の XNUMX つのインスタンス間の間隔を意味し、時間における需要の規則性を測定します。 需要量の変動は、数量の変動を意味します。 次の図は、いくつかの異なるパターンを示しています。 予測精度は、製品の予測可能性に大きく依存します。 詳細については、次を参照してください。 需要分類: 予測可能性が重要な理由.

小売業界での Amazon Forecast の実装: POC から本番環境の PlatoBlockchain データ インテリジェンスへの旅。垂直検索。あい。この予測可能性分析は、細かい項目 (SKU-Store-Color-Size など) ごとに行われることに注意してください。 需要予測生産システムでは、さまざまなアイテムがさまざまなパターンに従うことはよくあることです。 したがって、異なるデータ パターンに従って項目を分離することが重要です。 典型的な例の XNUMX つは、動きの速いアイテムと動きの遅いアイテムです。 もう XNUMX つの例は、密なデータと疎なデータです。 さらに、きめの細かいアイテムは、でこぼこのパターンを生成する可能性が高くなります。 たとえば、衣料品店では、人気のある商品の販売は毎日順調に進んでいますが、その商品の販売をさらに色やサイズごとに分けると、すぐにまばらになります。 したがって、SKU-Store-Color-Size から SKU-Store に粒度を下げると、データ パターンがゴツゴツした状態から滑らかな状態に、またはその逆に変化する可能性があります。

また、すべての商品が同じように売上に貢献するわけではありません。 アイテムの貢献度は、多くの場合、トップのアイテムが売上の大部分に貢献するパレート分布に従うことがわかりました。 これらのトップアイテムの販売は、多くの場合、順調です。 販売実績が少ないアイテムは、ゴツゴツしていて不安定なことが多いため、見積もりが困難です。 これらのアイテムを追加すると、実際には販売上位アイテムの精度が低下する可能性があります。 これらの観察に基づいて、アイテムをさまざまなグループに分け、売上上位のアイテムで予測モデルをトレーニングし、売上の低いアイテムをコーナー ケースとして処理することができます。

データの強化と追加のデータセットの選択

追加のデータセットを使用して予測結果のパフォーマンスを向上させたい場合は、 時系列データセット & メタデータ データセット. 小売分野では、直観と分野の知識に基づいて、在庫、価格、プロモーション、冬または夏のシーズンなどの機能を関連する時系列としてインポートできます。 機能の有用性を識別する最も簡単な方法は、機能の重要度を使用することです。 Forecast では、これは説明可能性分析によって行われます。 天気 予測子の説明可能性 データセットの属性がターゲットの予測にどのように影響するかをよりよく理解するのに役立ちます。 予測では、影響スコアと呼ばれるメトリックを使用して、各属性の相対的な影響を定量化し、予測値が増加するか減少するかを判断します。 XNUMX つ以上の属性の影響スコアがゼロの場合、これらの属性は予測値に大きな影響を与えません。 このようにして、影響の少ない機能をすばやく削除し、潜在的な機能を繰り返し追加できます。 影響スコアは、他のすべての属性の影響スコアとともに正規化された属性の相対的な影響を測定することに注意することが重要です。

すべての ML プロジェクトと同様に、機能を追加して精度を向上させるには、反復実験が必要です。 モデルの精度に対する増分変更の影響を観察しながら、データセットの複数の組み合わせを試す必要があります。 Forecast コンソールまたは Forecast API を使用した Python ノートブック. さらに、オンボーディングすることができます AWS CloudFormation、AWS が提供する一般的なユースケース向けの既製のソリューションをデプロイします (たとえば、 機械学習ソリューションによる予測精度の向上)。 予測は、データセットを自動的に分離し、予測因子を評価するための精度指標を生成します。 詳細については、次を参照してください。 予測精度の評価. これにより、データ サイエンティストは反復処理を高速化して、最高のパフォーマンスを発揮するモデルを実現できます。

高度な改善とコーナーケースの処理

予測アルゴリズムは、データから季節性、傾向、周期的特徴を学習できると述べました。 これらの特性を持ち、適切なデータ密度とボリュームを備えたアイテムについては、Forecast を使用して見積もりを生成できます。 ただし、特にデータ量が少ない場合など、塊状のデータ パターンに直面した場合は、ルールセットに基づく経験的推定など、別の方法で処理する必要がある場合があります。

密度の高い SKU の場合、同様に動作する時系列データセットのサブセットを使用してモデルをトレーニングすることで、Forecast の精度をさらに向上させます。 使用したサブセット分離戦略は、ビジネス ロジック、製品タイプ、データ密度、およびアルゴリズムによって学習されたパターンです。 サブセットが生成されたら、さまざまなサブセットに対して複数の Forecast モデルをトレーニングできます。 そのような例については、次を参照してください。 Amazon Forecast で使用するクラスター時系列データ.

本番に向けて: データセットの更新、モニタリング、再トレーニング

次の図に示すように、Forecast を使用したアーキテクチャの例を見てみましょう。 エンドユーザーが新しいデータセットを統合するたびに Amazon シンプル ストレージ サービス (Amazon S3)、トリガーします AWSステップ関数 データセット インポート ジョブの作成、自動予測子の作成、予測の生成など、さまざまなコンポーネントを調整します。 予測結果が生成された後、予測エクスポートの作成ステップはそれらを下流の消費者のために Amazon S3 にエクスポートします。 この自動化されたパイプラインをプロビジョニングする方法の詳細については、次を参照してください。 AWS CloudFormation による自動化. CloudFormation スタックを使用して、データセットを S3 バケットに自動的にデプロイし、Forecast パイプラインをトリガーします。 同じ自動化スタックを使用して、独自のデータセットで予測を生成できます。

小売業界での Amazon Forecast の実装: POC から本番環境の PlatoBlockchain データ インテリジェンスへの旅。垂直検索。あい。

最近の傾向を予測システムに組み込む方法は XNUMX つあります。データの更新または予測子の再トレーニングです。

最近の傾向を反映した更新されたデータで予測を生成するには、更新された入力データ ファイルを S3 バケットにアップロードする必要があります (更新された入力データには既存のデータがすべて含まれている必要があります)。 更新されたデータセットをインポートしても、Forecast は予測子を自動的に再トレーニングしません。 あなたはできる 予測を生成する いつものように。 Forecast は、更新された入力データの最終日から始まる予測範囲を予測します。 したがって、最近の傾向は、Forecast によって生成される新しい推論に組み込まれます。

ただし、予測子を新しいデータからトレーニングする場合は、新しい予測子を作成する必要があります。 データ パターン (季節性、傾向、またはサイクル) が変化した場合は、モデルの再トレーニングを検討する必要がある場合があります。 で述べたように AmazonForecastを使用して予測子の精度を継続的に監視する、予測変数のパフォーマンスは、経済環境や消費者行動の変化などの要因により、時間とともに変動します。 したがって、予測子を再トレーニングするか、新しい予測子を作成して、非常に正確な予測が引き続き行われるようにする必要がある場合があります。 の助けを借りて 予測監視、Forecast は予測子の品質を追跡できるため、運用上の労力を削減しながら、予測子の保持、再トレーニング、または再構築についてより多くの情報に基づいた決定を下すことができます。

まとめ

Amazon Forecast は、ML に基づく時系列予測サービスであり、ビジネス指標分析用に構築されています。 過去の販売状況と、在庫、プロモーション、季節などの関連情報を組み合わせることで、需要予測予測を高精度に統合できます。 8 週間以内に、小売顧客の 10 社が正確な需要予測を達成するのを支援しました。これは、手動予測と比較して 16% の改善です。 これにより、毎月 11.8 労働時間が直接節約され、推定売上高は最大 XNUMX% 増加します。

この投稿では、予測プロジェクトを概念実証から本番環境に移行するための一般的なプラクティスを共有しました。 今すぐ始めましょう アマゾン予測 ビジネスの非常に正確な予測を実現します。


著者について

小売業界での Amazon Forecast の実装: POC から本番環境の PlatoBlockchain データ インテリジェンスへの旅。垂直検索。あい。ヤンウェイ・ツイ、PhDは、AWSの機械学習スペシャリストソリューションアーキテクトです。 彼はIRISA(Research Institute of Computer Science and Random Systems)で機械学習の研究を開始し、コンピュータービジョン、自然言語処理、オンラインユーザー行動予測における人工知能を利用した産業用アプリケーションの構築に数年の経験があります。 AWSで、彼はドメインの専門知識を共有し、顧客がビジネスの可能性を解き放ち、大規模な機械学習で実用的な結果を推進するのを支援します。 仕事以外では、読書や旅行を楽しんでいます。

小売業界での Amazon Forecast の実装: POC から本番環境の PlatoBlockchain データ インテリジェンスへの旅。垂直検索。あい。ゴードン・ワン アマゾン ウェブ サービスのプロフェッショナル サービス チームのシニア データ サイエンティストです。 彼は、メディア、製造、エネルギー、小売、ヘルスケアなど、多くの業界の顧客をサポートしています。 彼はコンピューター ビジョン、深層学習、MLOps に情熱を注いでいます。 余暇には、ランニングとハイキングが大好きです。

タイムスタンプ:

より多くの AWS機械学習