Amazon SageMakerスタジオ は、機械学習 (ML) 用の初の完全統合開発環境 (IDE) です。 Studio は、データの準備、モデルの構築、トレーニング、デプロイに必要なすべての ML 開発手順を実行できる単一の Web ベースのビジュアル インターフェイスを提供します。 ライフサイクル構成 新しい Studio ノートブックの開始など、Studio ライフサイクル イベントによってトリガーされるシェル スクリプトです。 ライフサイクル構成を使用して、Studio 環境のカスタマイズを自動化できます。 このカスタマイズには、カスタム パッケージのインストール、ノートブック拡張機能の構成、データセットのプリロード、ソース コード リポジトリのセットアップが含まれます。 たとえば、Studio ドメインの管理者は、次のことを行うことができます。 長時間非アクティブな状態が続くとノートブック アプリを自動的にシャットダウンすることでコストを節約します.
AWSクラウド開発キット (AWS CDK) は、コードを通じてクラウド インフラストラクチャを定義し、それをプロビジョニングするためのフレームワークです。 AWS CloudFormation スタックします。 スタックは、プログラムによって更新、移動、または削除できる AWS リソースのコレクションです。 AWS CDK 構成 は AWS CDK アプリケーションの構成要素であり、クラウド アーキテクチャを定義するための青写真を表しています。
この投稿では、AWS CDK を使用して Studio をセットアップし、Studio ライフサイクル設定を使用し、組織内のデータ サイエンティストや開発者がそのアクセスを有効にする方法を示します。
ソリューションの概要
ライフサイクル構成のモジュール性により、ライフサイクル構成をドメイン内のすべてのユーザーまたは特定のユーザーに適用できます。 このようにして、ライフサイクル構成をセットアップし、Studio で参照できるようになります。 カーネルゲートウェイまたはJupyterサーバー 迅速かつ一貫して。 カーネル ゲートウェイはノートブック インスタンスと対話するためのエントリ ポイントですが、Jupyter サーバーは Studio インスタンスを表します。 これにより、DevOps のベストプラクティスを適用し、すべての AWS アカウントとリージョンにわたって安全性、コンプライアンス、構成基準を満たすことができます。 この投稿では、Python をメイン言語として使用しますが、コードは AWS CDK でサポートされている他の言語に簡単に変更できます。 詳細については、以下を参照してください。 AWS CDK の使用.
前提条件
開始するには、次の前提条件があることを確認してください。
GitHubリポジトリのクローンを作成します
まず、 GitHubリポジトリ.
リポジトリのクローンを作成すると、次のディレクトリを持つクラシック AWS CDK プロジェクトがあることがわかります。 studio-lifecycle-config-construct
これには、ライフサイクル構成を作成するために必要な構成とリソースが含まれています。
AWSCDKコンストラクト
検査したいファイルは aws_sagemaker_lifecycle.py
。 このファイルには、 SageMakerStudioLifeCycleConfig
ライフサイクル構成のセットアップと作成に使用する構造。
SageMakerStudioLifeCycleConfig
コンストラクトは、カスタム コンポーネントを使用してライフサイクル構成を構築するためのフレームワークを提供します。 AWSラムダ ファイルから読み取られる関数とシェルコード。 この構造には次のパラメータが含まれます。
- ID – 現在のプロジェクトの名前。
- スタジオ_ライフサイクル_コンテンツ - base64 エンコードされたコンテンツ。
- Studio_lifecycle_tags – Amazon リソースを整理するために割り当てるラベル。 これらはキーと値のペアとして入力され、この構成ではオプションです。
- Studio_lifecycle_config_app_type –
JupyterServer
は固有のサーバー自体に対するものであり、KernelGateway
app は、実行中の SageMaker イメージ コンテナーに対応します。
Studio ノートブックのアーキテクチャの詳細については、以下を参照してください。 Amazon SageMakerStudioNotebooksアーキテクチャを深く掘り下げる.
以下は、Studio ライフサイクル構成構造のコード スニペットです (aws_sagemaker_lifecycle.py
):
コンストラクトをインポートしてインストールすると、それを使用できるようになります。 次のコード スニペットは、スタック内の構造を使用してライフサイクル構成を作成する方法を示しています。 app.py
または別の構成:
AWS CDK コンストラクトをデプロイする
AWS CDK スタックをデプロイするには、リポジトリのクローンを作成した場所で次のコマンドを実行します。
コマンドは次のとおりです。 python
python3
パス構成に応じて異なります。
- 仮想環境を作成します。
- macOS/Linux の場合は、次を使用します。
python3 -m venv .cdk-venv
. - Windowsの場合は、
python3 -m venv .cdk-venv
.
- macOS/Linux の場合は、次を使用します。
- 仮想環境をアクティブ化します。
- macOS/Linux の場合は、次を使用します。
source .cdk-venvbinactivate
. - Windowsの場合は、
.cdk-venv/Scripts/activate.bat
. - PowerShell の場合は、次を使用します。
.cdk-venv/Scripts/activate.ps1
.
- macOS/Linux の場合は、次を使用します。
- 必要な依存関係をインストールします。
pip install -r requirements.txt
pip install -r requirements-dev.txt
- この時点で、必要に応じて、このコードの CloudFormation テンプレートを合成できます。
- 次のコマンドを使用してソリューションをデプロイします。
aws configure
cdk bootstrap
cdk deploy
スタックが正常にデプロイされると、CloudFormation コンソールでスタックを表示できるようになります。
SageMaker コンソールでライフサイクル設定を表示することもできます。
ライフサイクル設定を選択すると、実行されるシェル コードと割り当てたタグが表示されます。
Studio ライフサイクル構成を添付する
ライフサイクル構成をアタッチするには複数の方法があります。 このセクションでは、XNUMX つの方法を紹介します。 AWSマネジメントコンソール、提供されたインフラストラクチャをプログラムで使用します。
コンソールを使用してライフサイクル構成をアタッチする
コンソールを使用するには、次の手順を実行します。
- SageMakerコンソールで、 ドメイン ナビゲーションペインに表示されます。
- 使用しているドメイン名と現在のユーザー プロファイルを選択し、 編集.
- 使用するライフサイクル構成を選択し、 添付する.
ここから、デフォルトとして設定することもできます。
ライフサイクル構成をプログラムでアタッチする
また、コンストラクトによって作成された Studio ライフサイクル構成の ARN を取得し、それをプログラムで Studio コンストラクトにアタッチすることもできます。 次のコードは、Studio コンストラクトに渡されるライフサイクル設定 ARN を示しています。
クリーンアップ
このセクションの手順を実行して、リソースをクリーンアップします。
Studio ライフサイクル構成を削除する
ライフサイクル構成を削除するには、次の手順を実行します。
- SageMakerコンソールで、 Studio のライフサイクル構成 ナビゲーションペインに表示されます。
- ライフサイクル構成を選択し、 削除.
AWS CDK スタックを削除する
作成したリソースの使用が完了したら、リポジトリのクローンを作成した場所で次のコマンドを実行して、AWS CDK スタックを破棄できます。
スタックの削除を確認するメッセージが表示されたら、次のように入力します。 yes
.
次の手順で、AWS CloudFormation コンソールでスタックを削除することもできます。
- AWS CloudFormationコンソールで、 スタック ナビゲーションペインに表示されます。
- 削除するスタックを選択します。
- スタックの詳細ペインで、 削除.
- 選択する スタックを削除 プロンプトが表示されたら
エラーが発生した場合は、アカウント構成によっては、一部のリソースを手動で削除する必要がある場合があります。
まとめ
この投稿では、Studio が ML ワークロードの IDE としてどのように機能するかについて説明しました。 Studio はライフサイクル構成サポートを提供します。これにより、カスタム シェル スクリプトをセットアップして自動タスクを実行したり、起動時に開発環境をセットアップしたりできます。 AWS CDK コンストラクトを使用して、カスタム リソースとライフサイクル設定のインフラストラクチャを構築しました。 コンストラクトは CloudFormation スタックに合成され、その後デプロイされて、Studio およびノートブック カーネルで使用されるカスタム リソースとライフサイクル スクリプトが作成されます。
詳細については、をご覧ください Amazon SageMakerスタジオ.
著者について
コリー・ヘアストン Amazon ML Solutions Lab のソフトウェア エンジニアです。 彼は現在、再利用可能なソフトウェア ソリューションの提供に取り組んでいます。
アレックスチラヤス Amazon ML Solutions Lab のシニア機械学習エンジニアです。 彼はデータ サイエンティストとエンジニアのチームを率いて、ビジネス ニーズに対応する AI アプリケーションを構築しています。
ゴーリ・パンデシュワール Amazon ML Solutions Lab のエンジニアマネージャーです。 彼とエンジニアのチームは、顧客のビジネスユースケースへの AWS AI/ML サービスの導入を促進する、再利用可能なソリューションとフレームワークの構築に取り組んでいます。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- EVMファイナンス。 分散型金融のための統一インターフェイス。 こちらからアクセスしてください。
- クォンタムメディアグループ。 IR/PR増幅。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 データ インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/use-the-aws-cdk-to-deploy-amazon-sagemaker-studio-lifecycle-configurations/
- :は
- :どこ
- $UP
- 100
- 12
- 14
- 7
- a
- できる
- 加速する
- アクセス
- アカウント
- 越えて
- 住所
- 養子縁組
- 後
- AI
- AI / ML
- すべて
- ことができます
- また
- Amazon
- Amazon MLソリューションラボ
- アマゾンセージメーカー
- Amazon SageMakerスタジオ
- Amazon Webサービス
- an
- および
- 別の
- どれか
- アプリ
- 申し込む
- アプリ
- 建築
- です
- AS
- 割り当てられた
- At
- アタッチ
- 自動化する
- 自動化
- 自動的に
- AWS
- AWS CloudFormation
- BE
- さ
- BEST
- ベストプラクティス
- ブロック
- ビルド
- 建物
- ビジネス
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 缶
- 例
- 変更
- 選択する
- クラシック
- クラウド
- クラウドインフラ
- コード
- コレクション
- COM
- コンプリート
- コンプライアンス
- 確認します
- 領事
- 構築する
- コンテナ
- 含まれています
- コンテンツ
- 対応する
- コスト
- 作ります
- 作成した
- 電流プローブ
- 現在
- カスタム
- カスタム化
- データ
- データセット
- 深いです
- デフォルト
- 定義
- によっては
- 展開します
- 展開
- 破壊する
- 細部
- 開発者
- 開発
- 議論する
- ドメイン
- ドメイン名
- 行われ
- ダウン
- 簡単に
- どちら
- enable
- 可能
- エンジニア
- エンジニア
- 入力します
- エントリ
- 環境
- 環境
- エラー
- イベント
- 例
- エクステンション
- File
- 名
- フォロー中
- フレームワーク
- フレームワーク
- から
- 完全に
- function
- ゲートウェイ
- 取得する
- GitHubの
- 持ってる
- 持って
- he
- 助けます
- こちら
- 彼の
- 認定条件
- How To
- HTML
- HTTP
- HTTPS
- ID
- 画像
- import
- in
- 含ま
- 情報
- インフラ関連事業
- install
- インストールする
- を取得する必要がある者
- 統合された
- 対話
- インタフェース
- に
- IT
- ITS
- 自体
- JPG
- ラボ
- ラベル
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 起動する
- リード
- 学習
- wifecycwe
- 場所
- 長い
- 機械
- 機械学習
- メイン
- make
- 管理
- マネージャー
- 手動で
- 五月..
- 大会
- メソッド
- ML
- モデル
- 他には?
- 移動
- の試合に
- 名
- ナビゲーション
- ニーズ
- 新作
- ノート
- 観察する
- of
- オファー
- on
- or
- 組織
- その他
- パッケージ
- 足
- ペイン
- パラメータ
- 渡された
- path
- 実行する
- 期間
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポイント
- ポスト
- PowerShellの
- プラクティス
- 準備
- 前提条件
- 現在
- プロフィール
- プロジェクト
- 提供
- は、大阪で
- 提供
- Python
- すぐに
- 読む
- 地域
- 倉庫
- 表します
- 表し
- の提出が必要です
- 要件
- リソースを追加する。
- リソース
- 再利用可能な
- ラン
- ランニング
- 安全性
- セージメーカー
- 科学者たち
- スコープ
- スクリプト
- セクション
- 自己
- シニア
- 仕える
- サービス
- セッションに
- 設定
- シェル(Shell)
- すべき
- 表示する
- 作品
- シャットダウン
- ソフトウェア
- ソフトウェアエンジニア
- 溶液
- ソリューション
- 一部
- ソース
- ソースコード
- 特定の
- スタック
- スタック
- 規格
- 開始
- 起動
- ステップ
- 研究
- 首尾よく
- そのような
- サポート
- サポート
- タスク
- チーム
- チーム
- template
- それ
- それら
- その後
- 彼ら
- この
- 介して
- 〜へ
- トレーニング
- トリガ
- 2
- ユニーク
- 更新しました
- つかいます
- 中古
- ユーザー
- users
- 詳しく見る
- バーチャル
- 訪問
- 欲しいです
- 仕方..
- 方法
- we
- ウェブ
- Webサービス
- ウェブベースの
- WELL
- いつ
- 一方
- which
- 意志
- ウィンドウズ
- ワーキング
- 作品
- You
- あなたの
- ゼファーネット