Amazon SageMaker モデルカード モデルの文書化方法を標準化できるため、設計、構築、トレーニング、評価に至るモデルのライフサイクルを可視化できます。 モデル カードは、監査と文書化の目的で確実に使用できる、モデルに関するビジネスおよび技術メタデータの信頼できる唯一の情報源となることを目的としています。 これらは、モデル ガバナンスにとって重要なモデルのファクトシートを提供します。
これまで、モデル カードは論理的にモデルに関連付けられていました。 Amazon SageMaker モデルレジストリ モデル名の一致を使用します。 ただし、機械学習 (ML) モデルを通じてビジネス上の問題を解決する場合、顧客は問題を反復するにつれて複数のバージョンのモデルを作成し、複数のモデル バージョンを運用および管理する必要があります。 したがって、モデル カードを特定のモデル バージョンに関連付ける機能が必要です。
この投稿では、デプロイされたモデル バージョン レベルでのモデル カードとモデル レジストリの統合をサポートする新機能について説明します。 モデル カードのバージョンを管理するためのソリューション アーキテクチャとベスト プラクティスについて説明し、モデル レジストリ内のモデル バージョンとモデル カードの統合を設定、運用、管理する方法について説明します。
ソリューションの概要
SageMaker モデル カードは、ガバナンスの観点からモデルの文書化を標準化するのに役立ち、SageMaker モデル レジストリは ML モデルのデプロイと運用化に役立ちます。 モデル レジストリは、モデル メタデータ情報を含む ML モデルを編成および保存するための階層構造をサポートします。
組織が顧客離れ予測などのビジネス上の問題を ML を使用して解決する場合、次の手順をお勧めします。
- 解決すべきビジネス上の問題のモデル カードを作成します。
- 解決すべきビジネス課題のモデルパッケージグループを作成します。
- モデル パッケージ バージョンの最初のバージョン (Customer Churn V1 など) を構築、トレーニング、評価、および登録します。
- モデル パッケージのバージョンをモデル カードにリンクして、モデル カードを更新します。
- 新しいモデル パッケージ バージョンを反復するときに、以前のバージョンからモデル カードのクローンを作成し、新しいモデル パッケージ バージョン (たとえば、Customer Churn V2) にリンクします。
次の図は、SageMaker モデル カードがモデル レジストリとどのように統合されるかを示しています。
上の図に示されているように、SageMaker モデル カードとモデル レジストリを統合すると、モデル カードをモデル レジストリ内の特定のモデル バージョンに関連付けることができます。 これにより、SageMaker でのモデルの移行のすべての段階にわたって包括的かつ標準化されたドキュメントを使用して、登録されたモデル バージョンの信頼できる単一の情報源を確立できるようになり、モデルのライフサイクル全体で発見しやすくなり、ガバナンス、コンプライアンス、説明責任が促進されます。
モデルカード管理のベストプラクティス
ガバナンスを備えた機械学習の運用は、今日の多くの企業組織、特に規制の厳しい業界にとって重要な要件です。 これらの要件の一部として、AWS は ML 環境の信頼性の高い運用を可能にするいくつかのサービスを提供します。
SageMaker モデル カードは、合理化されたガバナンスとレポート作成のために、ML モデルに関する重要な詳細を XNUMX か所に文書化します。 モデル カードは、モデルの使用目的とリスク評価、トレーニングの詳細とメトリック、評価結果と観察、考慮事項、推奨事項、カスタム情報などの追加のコールアウトなどの詳細を取得するのに役立ちます。
モデル カードは、開発プロセスの一環として管理および更新する必要があります。 ML ライフサイクル。 これらは、ML の継続的デリバリーとパイプラインの重要な部分です。 Well-Architected ML プロジェクトが MLOps の傘下で継続的インテグレーションと継続的デリバリー (CI/CD) を実装するのと同じように、継続的な ML 文書化プロセスは、多くの規制対象業界やリスクの高いユースケースにとって重要な機能です。 モデル カードは、責任ある透過的な ML 開発のベスト プラクティスの一部です。
次の図は、モデル カードが開発ライフサイクルにどのように含まれるかを示しています。
次のベスト プラクティスを検討してください。
- プロジェクトのライフサイクルの早い段階でモデル カードを作成することをお勧めします。 プロジェクトの最初のフェーズで作業しているとき、 ビジネス目標を特定する および ML 問題の枠組みを作る、モデル カードの作成を開始する必要があります。 ビジネス要件と重要なパフォーマンス メトリックのさまざまな手順を実行しながら、ドラフト ステータスでモデル カードを作成し、ビジネスの詳細と使用目的を決定できます。
- あなたの一部として モデル開発ライフサイクルフェーズの場合は、モデル レジストリを使用して、実稼働用のモデルをカタログ化し、モデルのバージョンを管理し、メタデータをモデルに関連付ける必要があります。 モデル レジストリにより系統追跡が可能になります。
- 反復が正常に完了し、モデルを実稼働環境にデプロイする準備ができたら、モデル カードを更新します。 の中に 導入ライフサイクルフェーズ, モデルカードのモデル詳細を更新できます。 また、トレーニングの詳細、評価の詳細、倫理的考慮事項、警告と推奨事項も更新する必要があります。
モデル カードにはバージョンが関連付けられています。 特定のモデル バージョンは、モデル カードのステータス以外のすべての属性にわたって不変です。 評価指標、説明、使用目的など、モデル カードにその他の変更を加えた場合、SageMaker は更新された情報を反映する新しいバージョンのモデル カードを作成します。 これは、作成されたモデル カードが改ざんできないようにするためです。 さらに、それぞれの一意のモデル名に関連付けられるモデル カードは XNUMX つだけであり、モデル カードの作成後に変更することはできません。
ML モデルは動的であり、ワークフロー自動化コンポーネントを使用すると、実稼働環境で数百のモデルを構築、トレーニング、テスト、デプロイする機能を簡単に拡張し、反復を高速化し、手動オーケストレーションによるエラーを削減し、反復可能なメカニズムを構築できます。
したがって、モデル カードのライフサイクルは次の図のようになります。 モデルのライフサイクルを通じてモデル カードを更新するたびに、新しいバージョンのモデル カードが自動的に作成されます。 新しいモデル バージョンを反復するたびに、以前のモデル バージョンのモデル カード情報の一部を継承し、同じライフサイクルに従うことができる新しいモデル カードを作成します。
前提条件
この投稿では、モデル レジストリにモデルがすでに存在していることを前提としています。 手順に従っていきたい場合は、GitHub にある次の SageMaker の例を使用してモデル レジストリを設定できます。 SageMaker PipelinesとModel MonitorおよびClarifyの統合.
モデルカードをモデルレジストリのモデルバージョンと統合します。
この例では、 model-monitor-clarify-group
パッケージはモデル レジストリにあります。
このパッケージでは、XNUMX つのモデル バージョンが利用可能です。
この例では、モデルのバージョン 1 を新しいモデル カードにリンクします。 モデル レジストリで、バージョン 1 の詳細を確認できます。
SageMaker Python SDK の新機能を使用できるようになりました。 から sagemaker.model_card ModelPackage
モジュールでは、モデル カードをリンクする特定のモデル バージョンをモデル レジストリから選択できます。
これで、モデル バージョン用の新しいモデル カードを作成し、 model_package_details
取得した以前のモデル パッケージのパラメータ。 必要なすべての追加詳細をモデル カードに入力する必要があります。 この投稿では、例として単純なモデル カードを作成します。
その後、その定義を使用して、SageMaker Python SDK を使用してモデル カードを作成できます。
モデルカードを再度ロードすると、関連するモデルが下に表示されます。 "__model_package_details"
.
既存のモデル カードを更新するオプションもあります。 model_package
以下のコード スニペットの例に示すように:
最後に、既存のモデル パッケージで新しいモデル パッケージ バージョンを作成または更新するときに、そのモデル パッケージ グループにモデル カードが既に存在する場合、ビジネスの詳細や使用目的などの一部の情報を新しいモデル カードに引き継ぐことができます。
クリーンアップ
前提条件セクションで説明されているノートブックを使用して作成されたリソースの場合、ユーザーはリソースをクリーンアップする責任があります。 ノートブックの指示に従ってリソースをクリーンアップしてください。
まとめ
この投稿では、SageMaker モデル カードをモデル レジストリ内のモデル バージョンと統合する方法について説明しました。 ソリューション アーキテクチャとモデル カードを実装するためのベスト プラクティスを共有し、モデル ガバナンス体制を改善するためにモデル カードを設定して運用する方法を示しました。 ぜひこのソリューションを試して、コメント セクションでフィードバックを共有することをお勧めします。
著者について
ラムヴィタル AWS のプリンシパル ML ソリューション アーキテクトです。 彼は、分散、ハイブリッド、クラウド アプリケーションの設計と構築に 20 年以上の経験があります。 彼は、安全でスケーラブルな AI/ML およびビッグ データ ソリューションを構築し、企業顧客のクラウド導入と最適化の取り組みを支援してビジネス成果を向上させることに情熱を注いでいます。 暇なときは、オートバイに乗って、2 歳のシープ・ア・ドゥードゥルと散歩しています。
ナターチャ フォート は、オーストラリアとニュージーランドの公共部門の政府データ サイエンス リードであり、AWS のプリンシパル SA です。 彼女は、組織が機械学習の取り組みを進めるのを支援し、機械学習の問題の枠組みから本番環境へのデプロイまでをサポートしながら、成功を確実にするためのベスト アーキテクチャ プラクティスが確実に導入されていることを確認します。 Natacha は、組織とともに MLOps と責任ある AI に焦点を当てています。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 自動車/EV、 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- ブロックオフセット。 環境オフセット所有権の近代化。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/integrate-amazon-sagemaker-model-cards-with-the-model-registry/
- :持っている
- :は
- $UP
- 1
- 100
- 20
- 20年
- 7
- 8
- a
- 能力
- 私たちについて
- 説明責任
- 達成する
- 越えて
- NEW
- さらに
- 養子縁組
- 後
- 再び
- AI
- AI / ML
- すべて
- ことができます
- 沿って
- 既に
- また
- Amazon
- アマゾンセージメーカー
- Amazon Webサービス
- an
- および
- どれか
- 建築
- です
- AS
- 仲間
- 関連する
- と仮定する
- At
- 属性
- 監査
- オーストラリア
- 自動的に
- オートメーション
- 利用できます
- AWS
- BE
- 以下
- BEST
- ベストプラクティス
- ビッグ
- ビッグデータ
- ビルド
- 建物
- ビジネス
- 缶
- 機能
- キャプチャー
- カード
- カード
- 実施
- 例
- カタログ
- 変更
- 変更
- クリーニング
- クラウド
- クラウドの採用
- コード
- 注釈
- コンプライアンス
- コンポーネント
- 包括的な
- 検討事項
- 連続的な
- 作ります
- 作成した
- 作成します。
- 作成
- 創造
- 重大な
- カスタム
- 顧客
- Customers
- データ
- データサイエンス
- 定義
- 配達
- 展開します
- 展開
- 展開する
- 記載された
- 説明
- 設計
- 細部
- 決定する
- 開発
- 異なります
- 話し合います
- 議論する
- 配布
- ドキュメント
- ドキュメント
- ドラフト
- 原因
- ダイナミック
- 各
- 早い
- 簡単に
- enable
- 可能
- 奨励する
- 確保
- Enterprise
- 環境
- エラー
- 確立する
- 倫理的な
- 評価する
- 評価
- あらゆる
- 例
- 既存の
- 存在
- 体験
- 容易化する
- 速いです
- 特徴
- フィードバック
- フィギュア
- 名
- 焦点を当てて
- フォロー中
- から
- GitHubの
- 与えられた
- ガバナンス
- 政府・公共機関
- グループ
- 持ってる
- he
- 助けます
- ことができます
- より高い
- 非常に
- 彼の
- 認定条件
- How To
- しかしながら
- HTML
- HTTPS
- 何百
- ハイブリッド
- if
- 説明する
- 不変
- 実装
- 実装する
- 重要
- 改善します
- in
- 産業
- 情報
- 開始する
- 説明書
- 統合する
- 統合する
- 統合
- 統合
- 意図された
- に
- IT
- 旅
- JPG
- つながる
- 学習
- レベル
- wifecycwe
- ような
- 系統
- LINK
- 連結
- ローディング
- 見て
- たくさん
- 機械
- 機械学習
- make
- 作成
- 管理します
- マネージド
- 管理する
- マニュアル
- 多くの
- 一致
- メカニズム
- 言及した
- メトリック
- ML
- MLOps
- モデル
- モジュール
- モニター
- オートバイ
- の試合に
- 名
- ナビゲート
- 必要
- 必要
- 新作
- ニュージーランド
- 特に
- ノート
- 今
- of
- on
- かつて
- ONE
- の
- 操作
- 最適化
- オプション
- or
- 編成
- 組織
- 組織
- 整理する
- その他
- 私たちの
- でる
- 成果
- が
- パッケージ
- パラメーター
- 部
- 特定の
- 情熱的な
- パフォーマンス
- 視点
- 相
- 場所
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- お願いします
- ポスト
- プラクティス
- 予測
- 前
- 校長
- 問題
- プロセス
- 生産
- プロジェクト
- 推進
- 提供します
- は、大阪で
- 公共
- 目的
- Python
- RAM
- 評価
- 準備
- 推奨する
- 提言
- 減らします
- 反映する
- 登録
- 登録された
- レジストリ
- 規制
- 規制産業
- 信頼性のある
- 繰り返し可能
- 各種レポート作成
- 要件
- 要件
- リソース
- 責任
- 結果
- リスク
- SA
- セージメーカー
- 同じ
- ド電源のデ
- 規模
- 科学
- SDDK
- セクション
- セクター
- 安全に
- サービス
- セッションに
- いくつかの
- シェアする
- shared
- 彼女
- すべき
- 示されました
- 示す
- 作品
- 簡単な拡張で
- スニペット
- 溶液
- ソリューション
- 解決する
- 解決
- 一部
- ソース
- 特定の
- ステージ
- Status:
- ステップ
- 保存
- 合理化された
- 構造
- 成功
- 首尾よく
- そのような
- 支援する
- サポート
- 確か
- 技術的
- test
- より
- それ
- アプリ環境に合わせて
- それら
- その後
- それによって
- したがって、
- 彼ら
- この
- それらの
- 介して
- 全体
- 時間
- 〜へ
- 今日
- 追跡
- トレーニング
- トレーニング
- トランスペアレント
- 真実
- 試します
- 2
- 傘
- 下
- ユニーク
- アップデイト
- 更新しました
- 更新
- つかいます
- 中古
- 使用されます
- v1
- バージョン
- バージョン
- 視認性
- 欲しいです
- 仕方..
- we
- ウェブ
- Webサービス
- した
- いつ
- while
- 意志
- 仕事
- ワークフロー
- ワーキング
- でしょう
- 年
- You
- あなたの
- ニュージーランド
- ゼファーネット