Amazon SageMaker 自動モデルチューニングがハイパーパラメータ最適化のための 3 つの新しい完了基準をサポートするようになりました

プラトン再発行

フォロワー： 0

アマゾンセージメーカー持っています発表の Amazon SageMaker の XNUMX つの新しい完了基準のサポート自動モデルチューニング、モデルに最適なハイパーパラメーター構成を見つけるときに、調整ジョブの停止基準を制御するための追加のレバーセットを提供します。

この投稿では、これらの新しい完了基準、それらをいつ使用するか、およびそれらがもたらす利点について説明します。

SageMaker自動モデル調整

自動モデル調整とも呼ばれます ハイパーパラメータ調整、選択したメトリックによって測定されたモデルの最適なバージョンを見つけます。選択したアルゴリズムと指定したハイパーパラメータ範囲を使用して、提供されたデータセットで多くのトレーニングジョブを起動します。各トレーニングジョブは、目標指標が大幅に改善されていない場合に早期に完了することができます。これは早期停止と呼ばれます。

これまで、トレーニングジョブの最大数を指定するなど、チューニングジョブ全体を制御する方法は限られていました。ただし、このパラメーター値の選択は、せいぜいヒューリスティックです。値を大きくするとチューニングコストが増加し、値を小さくすると常に最適なバージョンのモデルが得られるとは限りません。

SageMaker 自動モデル調整は、調整ジョブの複数の完了基準を提供することで、これらの課題を解決します。個々のトレーニングジョブレベルではなく、チューニングレベルで適用されます。つまり、より高い抽象化レイヤーで動作します。

ジョブ完了基準を調整する利点

チューニングジョブがいつ停止するかをより適切に制御することで、ジョブを長期間実行せず、計算コストが高くなるため、コスト削減のメリットが得られます。また、ジョブが早期に停止することがなく、目的を満たす十分に高品質のモデルを取得できることも意味します。一連の反復の後、モデルが改善されなくなった場合、または推定された残りの改善がコンピューティングリソースと時間を正当化できない場合は、チューニングジョブを停止することを選択できます。

既存のトレーニングジョブ完了基準の最大数に加えてトレーニングジョブの最大数、自動モデルチューニングには、最大チューニング時間、改善の監視、および収束検出に基づいてチューニングを停止するオプションが導入されています。

これらの各基準について見ていきましょう。

最大チューニング時間

以前は、トレーニングジョブの最大数をリソース制限設定として定義して、コンピューティングリソースに関してチューニングバジェットを制御するオプションがありました。ただし、これにより、トレーニング時間が必要以上に長くなったり短くなったりする可能性があります。

最大チューニング時間基準の追加により、チューニングジョブを実行する時間の観点からトレーニング予算を割り当て、秒単位で定義された指定時間後にジョブを自動的に終了できるようになりました。

"ResourceLimits": { "MaxParallelTrainingJobs": 10, "MaxNumberOfTrainingJobs": 100 "MaxRuntimeInSeconds": 3600
}

上記のように、 MaxRuntimeInSeconds チューニング時間を秒単位で定義します。チューニングの時間制限を設定すると、チューニングジョブの期間と実験の予測コストを制限するのに役立ちます。

契約上の割引前の総コストは、次の式で見積もることができます。
EstimatedComputeSeconds= MaxRuntimeInSeconds * MaxParallelTrainingJobs * InstanceCost

秒単位の最大実行時間は、コストと実行時間を制限するために使用できます。つまり、予算管理の完了基準です。

この機能はリソース制御基準の一部であり、モデルの収束は考慮されていません。この記事の後半で説明するように、この基準を他の停止基準と組み合わせて使用することで、精度を犠牲にすることなくコストを抑えることができます。

望ましい目標指標

以前に導入されたもう XNUMX つの基準は、目標とする目標を事前に定義することです。この基準は、特定の客観的メトリックに基づいて最適なモデルのパフォーマンスを監視し、モデルが指定された客観的メトリックに関連して定義されたしきい値に達すると、チューニングを停止します。

TargetObjectiveMetricValue 基準に従って、最適なモデルの客観的メトリクスが指定された値に達した後にモデルのチューニングを停止するよう SageMaker に指示できます。

{ "TuningJobCompletionCriteria": { "TargetObjectiveMetricValue": 0.95 }, "HyperParameterTuningJobObjective": { "MetricName": "validation:auc", "Type": "Maximize" }, }

この例では、最適なモデルの客観的メトリクスが 0.95 に達したときにモデルのチューニングを停止するように SageMaker に指示しています。

この方法は、特定のレベルの精度、精度、再現率、F1 スコア、AUC、対数損失など、モデルに到達させたい特定の目標がある場合に役立ちます。

この基準の典型的な使用例は、特定のしきい値でのモデルのパフォーマンスに既に精通しているユーザー向けです。探索フェーズのユーザーは、最初に大きなデータセットの小さなサブセットを使用してモデルを調整し、完全なデータセットを使用してトレーニングするときにターゲットとする満足のいく評価指標のしきい値を特定できます。

改善モニタリング

この基準は、各反復後にモデルの収束を監視し、定義された数のトレーニングジョブ後にモデルが改善されない場合は調整を停止します。次の構成を参照してください。

"TuningJobCompletionCriteria": { "BestObjectiveNotImproving":{ "MaxNumberOfTrainingJobsNotImproving":10 }, }

この場合、 MaxNumberOfTrainingJobsNotImproving つまり、10 回のトレーニングジョブの後、客観的なメトリックの改善が停止した場合、チューニングが停止され、最適なモデルとメトリックが報告されます。

改善の監視を使用して、モデルの品質と全体的なワークフロー期間の間のトレードオフを調整し、異なる最適化問題間で移行できるようにする必要があります。

収束検出

収束検出は、自動モデルチューニングがいつチューニングを停止するかを決定できるようにする完了基準です。通常、自動モデルチューニングは、大幅な改善が達成できないと推定されると、チューニングを停止します。次の構成を参照してください。

"TuningJobCompletionCriteria": { "ConvergenceDetected":{ "CompleteOnConvergence":"Enabled" },
}

この基準は、最初にどの停止設定を選択すればよいかわからない場合に最適です。

問題と手元のデータセットを考慮して適切な予測を行うには、どのターゲットオブジェクティブメトリックが適切かがわからず、改善が見られなくなったときにチューニングジョブを完了させたい場合にも役立ちます。

完了基準の比較を試す

この実験では、与えられた回帰タスクで、合計 3 のハイパーパラメータ構成を持つ 2 つのハイパーパラメータの検索空間内で最適なモデルを見つけるために、200 つの調整実験を実行します。ダイレクトマーケティングデータセット.

他のすべてが等しい場合、最初のモデルは BestObjectiveNotImproving 完了基準、XNUMX 番目のモデルは、 CompleteOnConvergence XNUMX 番目のモデルは、完了基準を定義せずに調整されました。

各ジョブを説明するとき、その設定を観察できます BestObjectiveNotImproving 基準により、実行されるジョブが大幅に少なくなり、目的の指標と比較して最適なリソースと時間がもたらされました。

　 CompleteOnConvergence 基準を設定すると、実験の途中で調整を停止することもでき、基準を設定しない場合と比較して、トレーニングジョブが少なくなり、トレーニング時間が短縮されました。

Amazon SageMaker 自動モデルチューニングは、ハイパーパラメーター最適化 PlatoBlockchain Data Intelligence の 3 つの新しい完了基準をサポートするようになりました。垂直検索。あい。

完了基準を設定しないと費用のかかる実験が行われましたが、 MaxRuntimeInSeconds リソース制限の一部として、コストを最小限に抑える方法の XNUMX つです。

上記の結果は、完了基準を定義するときに、モデルが現在の結果を超えて改善する可能性が低いことを検出すると、Amazon SageMaker が調整プロセスをインテリジェントに停止できることを示しています。

SageMaker 自動モデルチューニングでサポートされている完了基準は相互に排他的ではなく、モデルのチューニング時に同時に使用できることに注意してください。

複数の完了基準が定義されている場合、いずれかの基準が満たされたときにチューニングジョブが完了します。

たとえば、最大チューニング時間などのリソース制限基準と、改善の監視や収束検出などの収束基準を組み合わせることで、最適なコスト管理と最適な目標メトリックを生成できます。

まとめ

この投稿では、最大チューニング時間、改善モニタリング、収束検出など、SageMaker に新たに導入された一連の完了基準を選択することで、チューニングジョブをインテリジェントに停止する方法について説明しました。

イテレーション全体にわたる改善の観察に基づくインテリジェントな停止は、完了基準を定義しない場合と比較して、予算と時間の管理を大幅に最適化する可能性があることを実験で示しました。

また、これらの基準は相互に排他的ではなく、モデルを調整するときに同時に使用して、予算管理と最適な収束の両方を利用できることも示しました。

自動モデル調整を構成および実行する方法の詳細については、次を参照してください。ハイパーパラメータ調整ジョブ設定の指定.

著者について

ダグ・ムバヤ データと分析を専門とするシニアパートナーソリューションアーキテクトです。 Doug は AWS パートナーと緊密に連携し、クラウドでのデータおよび分析ソリューションの統合を支援しています。

Amazon SageMaker 自動モデルチューニングは、ハイパーパラメーター最適化 PlatoBlockchain Data Intelligence の 3 つの新しい完了基準をサポートするようになりました。垂直検索。あい。 カイトラマトゥール AWS のプリンシパルソリューションアーキテクトです。彼女は、高度にスケーラブルで信頼性が高く、安全で費用対効果の高いソリューションを AWS で構築する際に顧客とパートナーを導きます。彼女は機械学習に情熱を傾けており、顧客が ML のニーズを AWS AI/ML サービスを使用してソリューションに変換するのを支援しています。彼女は ML Specialty 認定を含む 5 つの認定を保持しています。余暇には、読書、ヨガ、娘たちとの時間を楽しんでいます。

iaroslav-画像 イロスラフ・シェルバティ AWS の機械学習エンジニアです。彼は主に、Amazon SageMaker プラットフォームの改善と、顧客がその機能を最大限に活用できるよう支援することに取り組んでいます。余暇には、ジムに行ったり、アイススケートやハイキングなどのアウトドアスポーツをしたり、新しい AI 研究に追いついたりするのが好きです。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
Platoblockchain。 Web3メタバースインテリジェンス。知識の増幅。こちらからアクセスしてください。
情報源： https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-automatic-model-tuning-now-supports-three-new-completion-criteria-for-hyperparameter-optimization/

タイムスタンプ： 2023 年 2 月 7 日

Amazon SageMaker Serverless Inference のプロビジョニングされた同時実行性の発表 | アマゾンウェブサービス

ソースクラスター：

AWS機械学習

ソースノード： 1835572

タイムスタンプ： 2023 年 5 月 9 日

Amazon SageMaker 自動モデル調整で、ハイパーパラメータ最適化のための XNUMX つの新しい完了基準がサポートされるようになりました

プラトン再発行

SageMaker自動モデル調整

ジョブ完了基準を調整する利点

最大チューニング時間

望ましい目標指標

改善モニタリング

収束検出

完了基準の比較を試す

まとめ

著者について

より多くの AWS機械学習

AWS DeepRacer を使用すると、あらゆるスキルレベルのビルダーがスキルを向上させ、機械学習を開始できるようになります。アマゾンウェブサービス

Amazon SageMaker での RStudio による並列データ処理

Amazon SageMaker と Amazon OpenSearch Service を使用して、CLIP モデルでテキストと画像の統合検索を実装する

AWS Inferentia2 で安定した拡散のパフォーマンスを最大化し、推論コストを削減 | アマゾンウェブサービス

The Chefz が Amazon Personalize を使用して完璧な食事を提供する方法

AmazonPollyで同じTTS音声ペルソナを使用して複数の言語でコンテンツのオーディオを作成する

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー