Amazon SageMakerオートパイロット データに基づいて最適な機械学習(ML)モデルを自動的に構築、トレーニング、調整すると同時に、完全な制御と可視性を維持できます。 最近発表しました オートパイロットでの時系列データのサポート。 オートパイロットを使用して、時系列データまたは一般的なシーケンスデータの回帰および分類タスクに取り組むことができます。 時系列データは、データポイントが一定の時間間隔で収集される特殊なタイプのシーケンスデータです。
データを手動で準備し、適切なMLモデルを選択し、そのパラメーターを最適化することは、専門家にとっても複雑な作業です。 最適なモデルとそのパラメータを見つけることができる自動化されたアプローチは存在しますが、これらは通常、ネットワークトラフィック、電力消費、または時間の経過とともに記録された家計費など、シーケンスとして提供されるデータを処理できません。 このデータは異なる時点で取得された観測の形式をとるため、連続した観測を互いに独立したものとして扱うことはできず、全体として処理する必要があります。 オートパイロットは、シーケンシャルデータを扱うさまざまな問題に使用できます。 たとえば、時間の経過とともに記録されたネットワークトラフィックを分類して、悪意のあるアクティビティを特定したり、個人が信用履歴に基づいて住宅ローンの資格があるかどうかを判断したりできます。 時系列データを含むデータセットを提供すると、オートパイロットが残りを処理し、特殊な機能変換を通じてシーケンシャルデータを処理し、ユーザーに代わって最適なモデルを見つけます。
オートパイロットは、MLモデルを構築する手間を省き、データに基づいて最適なMLモデルを自動的に構築、トレーニング、調整するのに役立ちます。 オートパイロットは、データに対していくつかのアルゴリズムを実行し、完全に管理されたコンピューティングインフラストラクチャでハイパーパラメータを調整します。 この投稿では、使用方法を示します オートパイロット 時系列データの分類と回帰の問題を解決します。 オートパイロットモデルの作成とトレーニングの手順については、を参照してください。 Amazon SageMakerAutopilotを使用した顧客チャーン予測.
オートパイロットを使用した時系列データ分類
実行例として、時系列のマルチクラス問題を検討します データセット UWaveGestureLibraryX、896つの事前定義された手のジェスチャーのXNUMXつを実行しながら、加速度センサーの等距離の読み取り値を含みます。 簡単にするために、加速度計のX寸法のみを考慮します。 タスクは、センサーの読み取り値から事前定義されたジェスチャに時系列データをマッピングする分類モデルを構築することです。 次の図は、CSV形式のデータセットの最初の行を示しています。 テーブル全体は、XNUMX行とXNUMX列で構成されています。最初の列はジェスチャラベルで、XNUMX番目の列はセンサー読み取り値の時系列です。
Amazon SageMakerDataWranglerを使用してデータを適切な形式に変換します
数値、カテゴリ、および標準のテキスト列を受け入れることに加えて、オートパイロットはシーケンス入力列も受け入れるようになりました。 時系列データがこの形式に準拠していない場合は、次の方法で簡単に変換できます。 AmazonSageMakerデータラングラー。 Data Wranglerは、MLのデータを集約して準備するのにかかる時間を数週間から数分に短縮します。 Data Wranglerを使用すると、データ準備と特徴エンジニアリングのプロセスを簡素化し、単一のビジュアルインターフェイスからのデータ選択、クレンジング、探索、視覚化など、データ準備ワークフローの各ステップを完了することができます。 たとえば、同じデータセットであるが入力形式が異なるとします。各ジェスチャ(IDで指定)は、加速度計の等距離測定のシーケンスです。 垂直方向に保存される場合、各行にはタイムスタンプとXNUMXつの値が含まれます。 次の図は、このデータを元の形式とシーケンス形式で比較しています。
このデータセットをデータラングラーを使用して前述の形式に変換するには、 Amazon シンプル ストレージ サービス (Amazon S3)。 次に、 時系列Groupbytransform、次のスクリーンショットに示すように、データをCSV形式でAmazonS3にエクスポートし直します。
データセットが指定された形式になっている場合は、自動操縦を続行できます。 データラングラーの他の時系列トランスフォーマーを確認するには、を参照してください。 Amazon SageMakerDataWranglerで時系列データを準備する.
AutoMLジョブを起動します
オートパイロットでサポートされている他の入力タイプと同様に、データセットの各行は異なる観測値であり、各列は機能です。 この例では、時系列データを含む単一の列がありますが、複数の時系列列を持つことができます。 時系列、テキスト、数値など、入力タイプが異なる複数の列を作成することもできます。
に オートパイロット実験を作成する、データセットをS3バケットに配置し、内に新しい実験を作成します Amazon SageMakerスタジオ。 次のスクリーンショットに示すように、実験の名前、データセットのS3の場所、出力アーティファクトのS3の場所、および予測する列の名前を指定する必要があります。
オートパイロットはデータを分析し、MLパイプラインを生成し、この分類タスクでハイパーパラメーター最適化のデフォルトの250回の反復を実行します。 次のモデルリーダーボードに示すように、オートパイロットは0.821の精度に達し、ワンクリックで最適なモデルを展開できます。
さらに、オートパイロットは データ探索レポート、データを視覚化して探索できる場所。
透明性はオートパイロットの基本です。 候補定義ノートブック内で生成されたMLパイプラインを検査および変更できます。 次のスクリーンショットは、オートパイロットが時系列トランスフォーマーを組み合わせてさまざまなパイプラインを推奨する方法を示しています TSFeatureExtractor
勾配ブースティング決定木や線形モデルなど、さまざまなMLアルゴリズムを使用します。 The TSFeatureExtractor
何百もの時系列特徴を抽出し、それをダウンストリームアルゴリズムに供給して予測を行います。 時系列機能の完全なリストについては、を参照してください。 抽出された特徴の概要.
まとめ
この投稿では、SageMaker Autopilotを使用して、数回クリックするだけで時系列の分類と回帰の問題を解決する方法を示しました。
オートパイロットの詳細については、を参照してください。 Amazon SageMakerオートパイロット。 SageMakerの関連機能を調べるには、を参照してください。 AmazonSageMakerデータラングラー.
著者について
ニキータ・イヴキン は、Amazon SageMakerDataWranglerの応用科学者です。
アン・ミルバート は、AmazonSageMaker自動モデルチューニングに取り組んでいるソフトウェア開発エンジニアです。
バレリオ・ペローネ は、AmazonSageMakerの自動モデルチューニングと自動操縦に取り組んでいる応用科学マネージャーです。
メガナサティシュ は、AmazonSageMaker自動モデルチューニングに取り組んでいるソフトウェア開発エンジニアです。
アリ・タクビリ はAI/MLスペシャリストのソリューションアーキテクトであり、機械学習を使用してAWSクラウドでのビジネス上の課題を解決することでお客様を支援します。
- "
- 100
- 私たちについて
- 取得
- 活動
- アルゴリズム
- 許可
- しかし
- Amazon
- 発表の
- 自動化
- AWS
- BEST
- ブーストされた
- ビルド
- 建物
- 構築します
- ビジネス
- 課題
- 分類
- クラウド
- コラム
- 複雑な
- 計算
- 連続した
- 消費
- 含まれています
- コントロール
- 作成
- クレジット
- Customers
- データ
- 取引
- 展開します
- 開発
- 異なります
- 次元
- そうではありません
- 簡単に
- 電気
- エンジニア
- エンジニアリング
- 例
- 経費
- 実験
- 探査
- 抽出物
- 特徴
- 特徴
- FRBは
- フィギュア
- 名
- フォロー中
- フォーム
- 形式でアーカイブしたプロジェクトを保存します.
- フル
- グループ
- ことができます
- history
- 家庭
- 認定条件
- How To
- HTTPS
- 何百
- 識別する
- 含めて
- 情報
- インフラ
- インタフェース
- IT
- 学習
- リスト
- 負荷
- 場所
- 機械
- 機械学習
- マネージャー
- 地図
- ML
- モデル
- ネットワーク
- ネットワークトラフィック
- ノート
- 最適化
- その他
- 予測
- 予測
- 問題
- 問題
- プロセス
- 提供します
- 範囲
- お勧めする
- REST
- ランニング
- 科学
- 科学者
- シリーズ
- 簡単な拡張で
- ソフトウェア
- ソフトウェア開発
- ソリューション
- 解決する
- 専門の
- ストレージ利用料
- サポート
- サポート
- タスク
- 介して
- 時間
- top
- トラフィック
- トレーニング
- 列車
- つかいます
- 値
- 視認性
- 可視化
- 以内
- ワーキング
- X