Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

Amazon SageMaker JumpStart ソリューションの機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します

Amazon SageMaker ジャンプスタート 機械学習 (ML) を使い始めるのに役立つ、さまざまな種類の問題に対応する事前トレーニング済みのオープンソース モデルを提供します。 JumpStart は、一般的なユース ケースのインフラストラクチャをセットアップするソリューション テンプレートと、ML 用の実行可能なサンプル ノートブックも提供します。 アマゾンセージメーカー.

ビジネス ユーザーは、JumpStart ソリューションを使用して次のことを行うことができます。

  • ソリューションを調べて、どれがビジネス ニーズに適しているかを評価してください。
  • ワンクリックでソリューションを起動 Amazon SageMakerスタジオ. これにより、 AWS CloudFormation テンプレートを使用して、必要なリソースを作成します。
  • 基礎となるノートブックおよびモデル資産にアクセスして、ニーズを満たすようにソリューションを変更します。
  • 取得したリソースは一度削除してください。

この投稿では、23 つの異なるビジネス課題に対処するために最近追加された XNUMX つの ML ソリューションに焦点を当てています。 これを書いている時点で、JumpStart は、金融取引における不正の検出から手書きの認識まで、XNUMX のビジネス ソリューションを提供しています。 JumpStart を通じて提供されるソリューションの数は、ソリューションが追加されるにつれて定期的に増加します。

ソリューションの概要

XNUMX つの新しいソリューションは次のとおりです。

  • 価格の最適化 – カスタマイズ可能な ML モデルを提供し、収益、利益、またはその他のカスタム指標の最大化などのビジネス目標を達成するために、製品またはサービスの価格を設定するための最適な決定を行うのに役立ちます。
  • 鳥種予測 – オブジェクト検出モデルをトレーニングして微調整する方法を示します。 トレーニング画像の拡張によるモデルの調整を示し、トレーニング ジョブの反復 (エポック) 全体で発生する精度の向上を示します。
  • 肺がん生存予測 – 2D および 3D の放射線特徴と患者の人口統計を ML アルゴリズムにフィードして、患者の肺がんの生存率を予測する方法を示します。 この予測の結果は、プロバイダーが適切な予防措置を講じるのに役立ちます。
  • 金融支払の分類 – ML モデルをトレーニングしてデプロイし、取引情報に基づいて金融取引を分類する方法を示します。 このソリューションは、不正検出、パーソナライゼーション、または異常検出の中間ステップとしても使用できます。
  • 携帯電話顧客の解約予測 – モバイル通話トランザクション データセットを使用して解約予測モデルを迅速に開発する方法を示します。 これは、ML を初めて使用するユーザー向けの簡単な例です。

前提条件

これらのソリューションを使用するには、SageMaker 機能を実行できる実行ロールで Studio にアクセスできることを確認してください。 Studio 内のユーザー ロールについては、 SageMaker プロジェクトと JumpStart オプションがオンになっています。

次のセクションでは、XNUMX つの新しいソリューションのそれぞれについて説明し、そのしくみについて詳しく説明し、独自のビジネス ニーズに合わせて使用​​する方法についていくつかの推奨事項を示します。

価格の最適化

ビジネスは、最良の結果を得るためにさまざまな手段を使用することを好みます。 たとえば、製品やサービスの価格は、ビジネスがコントロールできるレバーです。 問題は、利益や収益などのビジネス目標を最大化するために、製品やサービスの価格をどのように決定するかです。

このソリューションは、カスタマイズ可能な ML モデルを提供し、収益、利益、またはその他のカスタム指標の最大化などの目標を達成するために、製品またはサービスの価格を設定するための最適な決定を下すのに役立ちます。 このソリューションは、ML と因果推論のアプローチを使用して、過去のデータから価格と出来高の関係を学習し、動的な価格の推奨をリアルタイムで作成して、カスタムの目標指標を最適化することができます。

次のスクリーンショットは、サンプル入力データを示しています。

このソリューションには、次の XNUMX つの部分が含まれます。

  • 価格弾力性の推定 – これは、二重 ML アルゴリズムによる因果推論によって推定されます
  • ボリューム予測 – これは Prophet アルゴリズムを使用して予測されます
  • 価格の最適化 – これは、さまざまな価格シナリオによる what-if シミュレーションによって実現されます

このソリューションは、収益を最大化するための翌日の推奨価格を提供します。 また、出力には、出来高に対する価格の影響を示す値である推定価格弾力性と、翌日の出来高を予測できる予測モデルが含まれます。 次のチャートは、計算された価格弾力性を組み込んだ因果モデルが、時系列データを使用して出来高を予測するために Prophet を使用する予測モデルよりも、what-if 分析 (行動価格からの偏差が大きい) の下でどのように優れているかを示しています。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

このソリューションは、次のユース ケースのビジネスに適用できます。

  • 小売店の商品の最適な価格を決定する
  • 顧客の購入に対する割引クーポンの効果を推定する
  • あらゆるビジネスにおけるさまざまなインセンティブ手法の効果を予測する

鳥種予測

現在、ビジネス向けのコンピューター ビジョン (CV) アプリケーションがいくつかあります。 これらのアプリケーションの XNUMX つがオブジェクト検出です。これは、ML アルゴリズムが画像内のオブジェクトの位置を周囲に境界ボックスを描画することで検出し、オブジェクトの種類を識別します。 オブジェクト検出モデルを適用して微調整する方法を学ぶことは、CV を必要とする組織にとって大きな価値があります。

このソリューションは、画像を SageMaker アルゴリズムに提供するときに境界ボックスの仕様を変換する方法の例を提供します。 このソリューションは、水平方向に反転したトレーニング画像 (鏡像) を追加することで、オブジェクト検出モデルを改善する方法も示しています。

多数のクラス (200 種の鳥) がある場合にオブジェクト検出の課題を試すためのノートブックが用意されています。 ノートブックには、トレーニング ジョブのエポック全体で発生する精度の向上をグラフ化する方法も示されています。 次の画像は、鳥のデータセットからの画像の例を示しています。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

このソリューションには、次の XNUMX つの手順が含まれます。

  1. ダウンロードを含むデータの準備 RecordIO ファイルの生成。
  2. 物体検出モデルを作成してトレーニングします。
  3. エンドポイントをデプロイし、モデルのパフォーマンスを評価します。
  4. 拡張されたデータセットを使用して、オブジェクト検出モデルを再度作成してトレーニングします。
  5. エンドポイントをデプロイし、拡張モデルのパフォーマンスを評価します。

次の出力が得られます。

  • テスト画像に対する結合ボックスのオブジェクト検出結果
  • 訓練された物体検出モデル
  • 追加の拡張 (反転) データセットを使用したトレーニング済みオブジェクト検出モデル
  • 各モデルの XNUMX つで展開される XNUMX つの別個のエンドポイント

次のグラフは、トレーニング中のモデルの反復 (エポック) に対するモデルの改善を示しています。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

次の例は、XNUMX つのテスト イメージからの出力です。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

このソリューションは、次のユース ケースのビジネスに適用できます。

  • 包装業界のベルトコンベア上の物体を検出
  • ピザのトッピングを検出する
  • 物体検出を含むサプライ チェーン運用アプリケーションを実装する

肺がん生存予測

COVID-19 により、肺に関連する医学的課題がさらに注目されるようになりました。 また、病院、医師、看護師、放射線技師に多大な圧力をかけています。 ML を強力なツールとして適用して、医療従事者を支援し、業務をスピードアップできる可能性を想像してみてください。 このソリューションでは、2D および 3D の放射線特徴と患者の人口統計を ML アルゴリズムに入力して、患者の肺がんの生存率を予測する方法を示します。 この予測の結果は、プロバイダーが適切な予防措置を講じるのに役立ちます。

このソリューションは、非小細胞肺がん (NSCLC) のラジオゲノミクス データセット用のスケーラブルな ML パイプラインを構築する方法を示します。このデータセットは、RNA シーケンス データ、臨床データ (EHR データを反映)、および医療画像で構成されます。 複数の種類のデータを使用してマシン モデルを作成することを、 マルチモーダル ML。 このソリューションは、非小細胞肺がんと診断された患者の生存転帰を予測します。

次の画像は、非小細胞肺癌 (NSCLC) の Radiogenomics データセットからの入力データの例を示しています。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

ソリューションの一部として、腫瘍組織から全 RNA が抽出され、RNA シーケンス技術で分析されました。 元のデータには 22,000 を超える遺伝子が含まれていますが、特定され、公開されている遺伝子発現コホートで検証され、予後と相関する 21 の高度に共発現する遺伝子クラスター (メタ遺伝子) から 10 の遺伝子を保持しています。

臨床記録は CSV 形式で保存されます。 各行は患者に対応し、列には人口統計、腫瘍の病期、生存状態など、患者に関する情報が含まれています。

ゲノムデータについては、特定され、公開されている遺伝子発現コホートで検証され、予後と相関する 21 個の高度に共発現する遺伝子クラスター (メタ遺伝子) から 10 個の遺伝子を保持しています。

医用画像データについては、CT スキャンで観察された腫瘍のサイズ、形状、および視覚的属性を説明する患者レベルの 3D ラジオミクス機能を作成します。 患者の研究ごとに、次の手順が実行されます。

  1. CT スキャンと腫瘍セグメンテーションの両方の 2D DICOM スライス ファイルを読み取り、それらを 3D ボリュームに結合し、ボリュームを NIfTI 形式で保存します。
  2. CT ボリュームと腫瘍セグメンテーションを合わせて、腫瘍内の計算に集中できるようにします。
  3. pyradiomics ライブラリを使用して、腫瘍領域を記述する radiomic 機能を計算します。
  4. 関心のある腫瘍領域内の強度の分布と共起の統計的表現、腫瘍を形態学的に説明する形状ベースの測定など、120 つのクラスの XNUMX の放射線特徴を抽出します。

モデル トレーニング用に患者のマルチモーダル ビューを作成するために、95 つのモダリティからの特徴ベクトルを結合します。 その後、データを処理します。 まず、特徴スケーリングを使用して、独立した特徴の範囲を正規化します。 次に、特徴に対して主成分分析 (PCA) を実行して次元を削減し、データの XNUMX% の分散に寄与する最も特徴的な特徴を特定します。

これにより、教師あり学習者の特徴を構成する 215 の特徴から 45 の主成分に次元が削減されます。

このソリューションは、確率の形で NSCLC 患者の生存状態 (生死) を予測する ML モデルを生成します。 モデルと予測に加えて、モデルを説明するレポートも生成します。 医用画像処理パイプラインは、視覚化のために 3D 肺 CT ボリュームと腫瘍セグメンテーションを生成します。

このソリューションは、ヘルスケアおよびライフ サイエンスのユース ケースに適用できます。

金融支払区分

ビジネスまたは消費者のすべての金融取引を取り上げ、それらをさまざまなカテゴリに分類すると、非常に役立ちます。 これは、ユーザーがどのカテゴリにどれだけ費やしたかを知るのに役立ちます。また、特定のカテゴリのトランザクションまたは支出が予期せず増減したときにアラートを発することもできます。

このソリューションでは、ML モデルをトレーニングしてデプロイし、取引情報に基づいて金融取引を分類する方法を示します。 多くの銀行は、これをサービスとして提供して、エンドユーザーに支出習慣の概要を提供しています。 このソリューションは、不正検出、パーソナライゼーション、または異常検出の中間ステップとしても使用できます。 SageMaker を使用して、必要な基盤インフラストラクチャを備えた XGBoost モデルをトレーニングおよびデプロイします。

このソリューションをデモンストレーションする合成データセットには、次の機能があります。

  • トランザクションカテゴリ – 次の 19 のオプションからのトランザクションのカテゴリ: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Home, Pension and insurances.
  • Receiver_id – 受信側の識別子。 識別子は 16 個の数字で構成されています。
  • 送信者 ID – 送信側の ID。 識別子は 16 個の数字で構成されています。
  • – 転送される金額。
  • タイムスタンプ – YYYY-MM-DD HH:MM:SS 形式のトランザクションのタイムスタンプ。

データセットの最初の XNUMX つの観測値は次のとおりです。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

このソリューションでは、勾配ブースト ツリー アルゴリズムの一般的で効率的なオープン ソース実装である XGBoost を使用します。 勾配ブースティングは、より単純で弱いモデルのセットからの推定値のアンサンブルを組み合わせることによって、ターゲット変数を正確に予測しようとする教師あり学習アルゴリズムです。 その実装は、SageMaker 組み込みアルゴリズムで利用できます。

金融支払分類ソリューションには、次の XNUMX つのステップが含まれます。

  1. データを準備します。
  2. 機能ストアを構築します。
  3. XGBoost モデルを作成してトレーニングします。
  4. エンドポイントをデプロイし、モデルのパフォーマンスを評価します。

次の出力が得られます。

  • サンプル データセットに基づいてトレーニングされた XGBoost モデル
  • トランザクションカテゴリを予測できる SageMaker エンドポイント

このソリューションを実行すると、次のような分類レポートが表示されます。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

ビジネスで考えられるアプリケーションには、次のようなものがあります。

  • 小売および投資銀行におけるさまざまな金融アプリケーション
  • トランザクションをあらゆるユース ケース (金融だけでなく) で分類する必要がある場合

携帯電話顧客のチャーン予測

顧客離れの予測は、非常に一般的なビジネス ニーズです。 多数の調査によると、既存の顧客を維持するためのコストは、新規顧客を獲得するよりもはるかに少ないことが示されています。 この課題は、多くの場合、顧客が解約する理由を理解したり、解約を予測するモデルを構築したりするのに苦労している企業から生じます。

この例では、ML を初めて使用するユーザーは、モバイル通話トランザクション データセットを使用してチャーン予測モデルを迅速に開発する方法を体験できます。 このソリューションでは、SageMaker を使用して顧客プロファイル データセットで XGBoost モデルをトレーニングおよびデプロイし、顧客が携帯電話会社を離れる可能性があるかどうかを予測します。

このソリューションが使用するデータセットは公開されており、Daniel T. Larose 著の Discovering Knowledge in Data という本で言及されています。 著者は、カリフォルニア大学アーバイン校の機械学習データセットのリポジトリに帰属します。

このデータセットは、次の 21 の属性を使用して、不明な米国の携帯電話会社の顧客のプロファイルを記述します。

  • 州: 顧客が居住する米国の州。XNUMX 文字の省略形で示されます。 たとえば、OH または NJ
  • アカウントの長さ: このアカウントがアクティブであった日数
  • 市外局番: 対応する顧客の電話番号の XNUMX 桁の市外局番
  • 電話: 残りの XNUMX 桁の電話番号
  • 国際プラン: お客様が国際通話プランを持っているかどうか: はい/いいえ
  • VMail プラン: 顧客がボイス メール機能を持​​っているかどうか: はい/いいえ
  • VMail メッセージ: XNUMX か月あたりのボイスメール メッセージの平均数
  • Day Mins: XNUMX 日に使用された合計通話時間 (分)
  • Day Calls: XNUMX 日の間に発信された通話の総数
  • Day Charge: 日中の通話料金の請求額
  • Eve Mins、Eve Calls、Eve Charge: 夜間に発信された通話の請求料金
  • Night Mins、Night Calls、Night Charge: 夜間の通話料金
  • Intl Mins、Intl Calls、Intl Charge: 国際通話の請求額
  • CustServ Calls: カスタマー サービスにかけられた電話の数
  • Churn?: 顧客がサービスを離れたかどうか: true/false

このソリューションには、次の XNUMX つの段階が含まれます。

  1. データを準備します。
  2. XGBoost モデルを作成してトレーニングします。
  3. エンドポイントをデプロイし、モデルのパフォーマンスを評価します。

次の出力が得られます。

  • ユーザー チャーンを予測するために、サンプル データセットに基づいてトレーニングされた XGBoost モデル
  • ユーザー離れを予測できる SageMaker エンドポイント

このモデルは、5,000 人の携帯電話の顧客のうち、現在の携帯電話会社の使用をやめる可能性が高い人の数を推定するのに役立ちます。

次のグラフは、モデルからの出力としてチャーンの確率分布を示しています。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

これは、次のユース ケースのビジネスに適用できます。

  • 自社のビジネスにおける顧客離れを予測する
  • マーケティング E メールを開封する可能性のある顧客と開封しない顧客を分類する (二項分類)
  • コースを中退する可能性が高い学生を予測する

リソースをクリーンアップする

JumpStart でソリューションの実行が完了したら、必ず選択してください。 すべてのリソースを削除する そのため、プロセスで作成したすべてのリソースが削除され、請求が停止されます。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。

まとめ

この投稿では、JumpStart ソリューションに基づいて、ML を適用してさまざまなビジネス上の問題を解決する方法を紹介しました。 この投稿では、JumpStart に最近追加された 23 つの新しいソリューションに焦点を当てましたが、合計 XNUMX の利用可能なソリューションがあります。 Studio にログインして、JumpStart ソリューションを実際に見て、それらからすぐに価値を引き出すことをお勧めします。 詳細については、次を参照してください。 Amazon SageMakerスタジオ および SageMaker ジャンプスタート.

注: AWS リージョンの JumpStart コンソールに上記の XNUMX つのソリューションがすべて表示されない場合は、XNUMX 週間待ってからもう一度確認してください。 段階的にさまざまな地域にリリースしています。


著者について

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。 ラジュ・ペンマッチャ博士 AWS の AI プラットフォームの AI/ML スペシャリスト ソリューション アーキテクトです。 彼は、顧客が機械学習モデルとソリューションを簡単に構築およびデプロイできるようにする、SageMaker のローコード/ノーコード サービス スイートに取り組んでいます。 顧客をサポートしていないときは、新しい場所に旅行するのが好きです。

Amazon SageMaker JumpStart ソリューション PlatoBlockchain Data Intelligence の機械学習を通じて、ビジネス上の問題をエンドツーエンドで解決します。垂直検索。あい。マナンシャー アマゾン ウェブ サービスのソフトウェア開発マネージャーです。 彼は ML 愛好家であり、ノーコード/ローコード AI/ML 製品の構築に注力しています。 彼は、他の有能な技術者が優れたソフトウェアを構築できるように力を与えようと努力しています。

タイムスタンプ:

より多くの AWS機械学習