最近の進歩により、 generative AI、特定のビジネス上の問題を解決するために、さまざまな業界で生成 AI を使用する方法について多くの議論が行われています。 生成 AI は、会話、ストーリー、画像、ビデオ、音楽などの新しいコンテンツやアイデアを作成できる AI の一種です。 それはすべて、膨大な量のデータで事前トレーニングされた非常に大規模なモデルによって裏付けられており、一般的に「モデル」と呼ばれます。 基礎モデル (FM)。 これらの FM は、ブログ投稿の作成、画像の生成、数学の問題の解決、対話の実施、ドキュメントに基づいた質問への回答など、複数のドメインにまたがる幅広いタスクを実行できます。 FM はそのサイズと汎用性により、テキストの感情分析、画像の分類、傾向の予測などの特定のタスクを通常実行する従来の ML モデルとは異なります。
組織は、これらの FM の機能を利用したいと考えていますが、FM ベースのソリューションを独自の保護された環境で実行することも望んでいます。 グローバル金融サービス、ヘルスケア、ライフサイエンスなどの厳しく規制された分野で活動している組織には、VPC で環境を実行するための聴覚要件とコンプライアンス要件があります。 実際、多くの場合、これらの環境では、受信と送信の両方の意図しないトラフィックにさらされるのを避けるために、直接インターネット アクセスさえも無効になっています。
Amazon SageMaker ジャンプスタート は、アルゴリズム、モデル、ML ソリューションを提供する ML ハブです。 SageMaker JumpStart を使用すると、ML 実践者は、増え続ける最もパフォーマンスの高いオープンソース FM のリストから選択できます。 これらのモデルを独自の環境にデプロイする機能も提供します。 仮想プライベートクラウド(VPC).
この投稿では、JumpStart を使用して フラン-T5 XXL インターネット接続のない VPC 内のモデル。 次のトピックについて説明します。
- インターネットにアクセスできない VPC で SageMaker JumpStart を使用して基盤モデルをデプロイする方法
- VPC モードで SageMaker JumpStart モデルを介して FM をデプロイする利点
- JumpStart 経由で基礎モデルの展開をカスタマイズする別の方法
FLAN-T5 XXL とは別に、JumpStart はさまざまなタスク向けにさまざまな基礎モデルを提供します。 完全なリストについては、こちらをご覧ください Amazon SageMaker JumpStar の開始方法.
ソリューションの概要
解決策の一環として、次の手順を説明します。
- インターネット接続なしで VPC をセットアップします。
- セットアップ Amazon SageMakerスタジオ 作成した VPC を使用します。
- インターネットにアクセスできない VPC で JumpStart を使用して、生成 AI Flan T5-XXL 基礎モデルをデプロイします。
以下は、ソリューションのアーキテクチャ図です。
このソリューションを実装するためのさまざまな手順を見てみましょう。
前提条件
この記事を進めるには、次のものが必要です。
インターネット接続なしで VPC をセットアップする
新しい CloudFormation スタックを作成する 使用して、 01_ネットワーク.yaml レンプレート。 このテンプレートは、新しい VPC を作成し、インターネット接続のない XNUMX つのアベイラビリティーゾーンにまたがる XNUMX つのプライベート サブネットを追加します。 次に、アクセスするためのゲートウェイ VPC エンドポイントをデプロイします。 Amazon シンプル ストレージ サービス (Amazon S3) と、SageMaker およびその他のいくつかのサービス用のインターフェイス VPC エンドポイントにより、VPC 内のリソースが AWS サービスに接続できるようになります。 AWS プライベートリンク.
などのスタック名を指定します。 No-Internet
をクリックし、スタックの作成プロセスを完了します。
この投稿の手順に従う場合、CloudFormation テンプレートはコストを削減するために XNUMX つのサブネット内にのみインターフェイス VPC エンドポイントを作成するため、このソリューションの可用性は高くありません。
VPC を使用して Studio をセットアップする
次を使用して別の CloudFormation スタックを作成します 02_sagemaker_studio.yamlこれにより、Studio ドメイン、Studio ユーザー プロファイル、IAM ロールなどのサポート リソースが作成されます。 スタックの名前を選択します。 この投稿では、次の名前を使用します SageMaker-Studio-VPC-No-Internet
。 前に作成した VPC スタックの名前を指定します (No-Internet
)として CoreNetworkingStackName
パラメータを変更し、他のすべてをデフォルトのままにしておきます。
スタックの作成が完了したことが AWS CloudFormation から報告されるまで待ちます。 Studio ドメインが SageMaker コンソールで使用できることを確認できます。
Studio ドメイン ユーザーがインターネットにアクセスできないことを確認するには、次のようにします。 SageMaker コンソールを使用して Studio を起動する。 選択してください File, 新作, ターミナル、インターネット リソースへのアクセスを試みます。 次のスクリーンショットに示すように、端末はリソースを待ち続け、最終的にはタイムアウトになります。
これは、Studio がインターネットにアクセスできない VPC で動作していることを証明します。
JumpStart を使用して生成 AI 基盤モデル Flan T5-XXL をデプロイする
このモデルは、Studio 経由でも API 経由でもデプロイできます。 JumpStart は、Studio 内からアクセスできる SageMaker ノートブックを介してモデルをデプロイするためのすべてのコードを提供します。 この投稿では、Studio のこの機能を紹介します。
- Studio のようこそページで、 ジャンプスタート 事前に構築された自動化されたソリューションの下にあります。
- 以下からFlan-T5 XXLモデルを選択してください 基礎モデル.
- デフォルトでは、 配備します タブ。 を展開します。 展開構成 を変更するセクション
hosting instance
およびendpoint name
、または追加のタグを追加します。 を変更するオプションもありますS3 bucket location
エンドポイントを作成するためにモデル アーティファクトが保存される場所。 この投稿では、すべてをデフォルト値のままにします。 予測を行うためにエンドポイントを呼び出すときに使用するエンドポイント名をメモしておきます。
- 拡大する セキュリティの設定 セクションで、
IAM role
エンドポイントを作成するため。 を指定することもできますVPC configurations
提供することにより、subnets
およびsecurity groups
。 サブネット ID とセキュリティ グループ ID は、AWS CloudFormation コンソールの VPC スタックの [出力] タブから確認できます。 SageMaker JumpStart には、この構成の一部として少なくとも XNUMX つのサブネットが必要です。 サブネットとセキュリティ グループは、モデル コンテナーへのアクセスとモデル コンテナーからのアクセスを制御します。
注意: SageMaker JumpStart モデルが VPC にデプロイされているかどうかに関係なく、モデルは常にネットワーク分離モードで実行されます。これにより、モデル コンテナが分離されるため、モデル コンテナに対してインバウンドまたはアウトバウンドのネットワーク呼び出しを行うことができなくなります。 VPC を使用しているため、SageMaker は指定された VPC を通じてモデル アーティファクトをダウンロードします。 ネットワーク分離でモデルコンテナを実行しても、SageMaker エンドポイントが推論リクエストに応答することは妨げられません。 サーバー プロセスはモデル コンテナーと並行して実行され、推論リクエストを転送しますが、モデル コンテナーにはネットワーク アクセスがありません。
- 選択する 配備します モデルをデプロイします。 進行中のエンドポイント作成のほぼリアルタイムのステータスを確認できます。 エンドポイントの作成が完了するまでに 5 ~ 10 分かかる場合があります。
フィールドの値を観察します モデルデータの場所 このページで。 すべての SageMaker JumpStart モデルは、SageMaker が管理する S3 バケット (s3://jumpstart-cache-prod-{region}
)。 したがって、JumpStart からどのモデルが選択されるかに関係なく、モデルはパブリックにアクセス可能な SageMaker JumpStart S3 バケットからデプロイされ、トラフィックがモデルをダウンロードするためにパブリック モデル ズー API に送信されることはありません。 これが、インターネットに直接アクセスできない VPC にエンドポイントを作成している場合でも、モデル エンドポイントの作成が正常に開始された理由です。
モデル アーティファクトをプライベート モデル動物園または独自の S3 バケットにコピーして、モデル ソースの場所をさらに制御および保護することもできます。 次のコマンドを使用してモデルをローカルにダウンロードできます。 AWSコマンドラインインターフェイス (AWS CLI):
aws s3 cp s3://jumpstart-cache-prod-eu-west-1/huggingface-infer/prepack/v1.0.2/infer-prepack-huggingface-text2text-flan-t5-xxl.tar.gz .
- 数分後、エンドポイントが正常に作成され、ステータスが次のように表示されます。 サービスで。 選択してください
Open Notebook
セクションにUse Endpoint from Studio
セクション。 これは、エンドポイントを迅速にテストするために JumpStart エクスペリエンスの一部として提供されるサンプル ノートブックです。
- ノートブックで、次のように画像を選択します データサイエンス3.0 そしてカーネルは Pythonの3。 カーネルの準備ができたら、ノートブックのセルを実行してエンドポイントで予測を行うことができます。 ノートブックでは invoke_endpoint() からの API Python 用 AWS SDK 予測を立てるためです。 あるいは、 SageMaker Python SDKのpredict() 同じ結果を得る方法。
これで、インターネットにアクセスできない VPC 内で JumpStart を使用して Flan-T5 XXL モデルをデプロイする手順は終了です。
VPC モードで SageMaker JumpStart モデルをデプロイする利点
SageMaker JumpStart モデルを VPC モードでデプロイする利点の一部を以下に示します。
- SageMaker JumpStart は公開モデル動物園からモデルをダウンロードしないため、インターネットにアクセスできない完全にロックダウンされた環境でも使用できます。
- ネットワーク アクセスを制限し、SageMaker JumpStart モデルの範囲を絞ることができるため、チームが環境のセキュリティ体制を改善するのに役立ちます
- VPC 境界により、エンドポイントへのアクセスはサブネットとセキュリティ グループを介して制限することもでき、これにより追加のセキュリティ層が追加されます。
SageMaker JumpStart を介して基盤モデルのデプロイメントをカスタマイズする別の方法
このセクションでは、モデルをデプロイする別の方法をいくつか紹介します。
好みの IDE から SageMaker JumpStart API を使用する
SageMaker JumpStart によって提供されるモデルでは、Studio にアクセスする必要はありません。 のおかげで、任意の IDE から SageMaker エンドポイントにデプロイできます。 JumpStart API。 この投稿で前に説明した Studio のセットアップ手順をスキップし、JumpStart API を使用してモデルをデプロイすることもできます。 これらの API は、VPC 構成も指定できる引数を提供します。 API は、 SageMaker Python SDK 自体。 詳細については、以下を参照してください。 事前トレーニング済みモデル.
SageMaker Studio から SageMaker JumpStart によって提供されるノートブックを使用する
SageMaker JumpStart は、モデルを直接デプロイするためのノートブックも提供します。 モデルの詳細ページで、 ノートを開く エンドポイントをデプロイするコードを含むサンプル ノートブックを開きます。 ノートが使っているのは、 SageMaker JumpStart 業界 API これにより、モデルのリストとフィルター、アーティファクトの取得、エンドポイントのデプロイとクエリが可能になります。 ユースケース固有の要件に応じてノートブック コードを編集することもできます。
リソースをクリーンアップする
チェックアウトします クリーンアップ.md ファイルを参照して、この投稿の一部として作成された Studio、VPC、およびその他のリソースを削除する詳細な手順を見つけてください。
トラブルシューティング
CloudFormation スタックの作成中に問題が発生した場合は、次を参照してください。 CloudFormationのトラブルシューティング.
まとめ
大規模な言語モデルを活用した生成 AI は、人々が情報から洞察を取得して適用する方法を変えています。 ただし、厳しく規制された領域で活動する組織は、より迅速なイノベーションを可能にすると同時に、そのような機能へのアクセス パターンを簡素化できる方法で生成 AI 機能を使用する必要があります。
この投稿で提供されているアプローチを試して、生成 AI 機能を既存の環境に埋め込みながら、インターネットにアクセスできない独自の VPC 内に維持することをお勧めします。 SageMaker JumpStart 基盤モデルの詳細については、以下を確認してください。
著者について
ヴィケシュ・パンディ AWS の機械学習スペシャリスト ソリューション アーキテクトとして、金融業界の顧客による生成 AI と ML のソリューションの設計と構築を支援しています。 仕事以外でも、ヴィケシュはさまざまな料理を試したり、アウトドア スポーツを楽しんでいます。
メヘラン・ニコー は AWS のシニア ソリューション アーキテクトであり、英国のデジタル ネイティブ ビジネスと連携して目標達成を支援しています。 ソフトウェア エンジニアリングの経験を機械学習に応用することに情熱を持っており、エンドツーエンドの機械学習と MLOps の実践を専門としています。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 自動車/EV、 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- ブロックオフセット。 環境オフセット所有権の近代化。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/use-generative-ai-foundation-models-in-vpc-mode-with-no-internet-connectivity-using-amazon-sagemaker-jumpstart/
- :持っている
- :は
- :not
- :どこ
- $UP
- 100
- 7
- a
- 能力
- 私たちについて
- アクセス
- アクセス可能な
- アクセス
- 達成する
- 取得する
- 越えて
- 加えます
- NEW
- 追加
- 進歩
- 利点
- AI
- アルゴリズム
- すべて
- 許す
- ことができます
- 沿って
- 並んで
- また
- 常に
- Amazon
- アマゾンセージメーカー
- Amazon SageMaker ジャンプスタート
- Amazon Webサービス
- 金額
- an
- 分析する
- および
- 別の
- どれか
- API
- API
- 申し込む
- 適用
- アプローチ
- 建築
- です
- 引数
- AS
- At
- 自動化
- 賃貸条件の詳細・契約費用のお見積り等について
- 利用できます
- 避ける
- AWS
- AWS CloudFormation
- 支持された
- ベース
- BE
- なぜなら
- BEST
- ブログ
- ブログの投稿
- 両言語で
- 境界
- ビルド
- ビジネス
- ビジネス
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- コール
- 缶
- 機能
- 機能
- 細胞
- 変化する
- 変化
- チェック
- 選択する
- クラウド
- コード
- 一般に
- コンプリート
- コンプライアンス
- 確認します
- お問合せ
- 接続
- 接続性
- 領事
- コンテナ
- コンテンツ
- コントロール
- 会話
- コスト
- 可能性
- カバー
- 作ります
- 作成した
- 作成します。
- 作成
- 創造
- Customers
- カスタマイズ
- データ
- デフォルト
- 実証します
- 展開します
- 展開
- 展開する
- 展開
- 配備する
- 設計
- 詳細
- 詳細な
- 対話
- 異なります
- デジタル
- 直接
- 直接に
- 無効
- 話し合います
- 議論する
- 議論
- ドキュメント
- そうではありません
- ドメイン
- ドメイン
- ドント
- ダウン
- ダウンロード
- ダウンロード
- 前
- ほかに
- 埋め込みます
- 奨励する
- 端から端まで
- エンドポイント
- 魅力的
- エンジニアリング
- 環境
- 環境
- さらに
- 最終的に
- すべてのもの
- 既存の
- 詳細
- 体験
- 暴露
- 余分な
- 実際
- 速いです
- 少数の
- フィールド
- File
- filter
- ファイナンシャル
- 金融産業
- 金融業務
- もう完成させ、ワークスペースに掲示しましたか?
- フォロー中
- 発見
- Foundation
- から
- 完全に
- さらに
- ゲートウェイ
- 一般的用途
- 生成
- 生々しい
- 生成AI
- グローバル
- グローバルファイナンシャル
- 目標
- ゴエス
- グループ
- グループの
- 成長
- 出来事
- 持ってる
- he
- ヘルスケア
- 重く
- 助け
- ことができます
- 非常に
- 彼の
- 主催
- 認定条件
- How To
- しかしながら
- HTML
- HTTP
- HTTPS
- ハブ
- 考え
- イド
- 画像
- 画像
- 実装する
- 改善します
- in
- 含めて
- 産業
- 産業を変えます
- 情報
- 革新します
- 内部
- 洞察
- インタフェース
- インターネット
- インターネット・アクセス
- インターネット接続
- 無関係に
- 分離
- 問題
- IT
- ITS
- 自体
- JPG
- キープ
- 保管
- 言語
- 大
- 層
- 学習
- 最低
- コメントを残す
- 生活
- 生命科学
- ような
- 限定的
- LINE
- リスト
- 局部的に
- 場所
- 探して
- たくさん
- 機械
- 機械学習
- 製
- make
- 作成
- マネージド
- math
- 五月..
- 方法
- 分
- ML
- MLOps
- モード
- モデル
- 他には?
- の試合に
- 音楽を聴く際のスピーカーとして
- 名
- ネイティブ
- 自然
- 必要
- ネットワーク
- 決して
- 新作
- いいえ
- ノート
- of
- 提供すること
- on
- ONE
- の
- 開いた
- オープンソース
- 開きます
- オペレーティング
- オプション
- or
- 組織
- その他
- 私たちの
- でる
- 外側
- 自分の
- ページ
- パラメーター
- 部
- 情熱的な
- パターン
- のワークプ
- 以下のために
- 実行する
- 実行
- ピックアップ
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 再生
- ポスト
- 投稿
- 電力
- パワード
- プラクティス
- 予測する
- 予測
- Predictor
- 優先
- 防ぐ
- プライベート
- 問題
- プロセス
- プロフィール
- 進捗
- 保護された
- 証明する
- 提供します
- 提供
- は、大阪で
- 提供
- 公共
- 公然と
- Python
- 質問
- すぐに
- 範囲
- リーディング
- 準備
- 最近
- 減らします
- 言及
- 規制
- レポート
- リクエスト
- 必要とする
- の提出が必要です
- 要件
- 必要
- リソースを追加する。
- リソース
- 応答
- 結果
- 役割
- ラン
- ランニング
- runs
- セージメーカー
- 同じ
- 科学
- 科学
- SDDK
- セクション
- 安全に
- セキュリティ
- シニア
- 感情
- サービス
- シェアする
- ショーケース
- 示す
- 作品
- 簡単な拡張で
- サイズ
- So
- ソフトウェア
- ソフトウェア工学
- 溶液
- ソリューション
- 解決する
- 解決
- 一部
- ソース
- スペース
- スパン
- 専門家
- 専門にする
- 特定の
- 指定の
- スポーツ
- スタック
- スタック
- 開始
- Status:
- 手順
- ステップ
- まだ
- ストレージ利用料
- 保存され
- ストーリー
- 研究
- サブネット
- サブネット
- 首尾よく
- そのような
- 供給
- 支援する
- 取る
- タスク
- チーム
- template
- ターミナル
- test
- 感謝
- それ
- 英国
- アプリ環境に合わせて
- それら
- その後
- そこ。
- したがって、
- ボーマン
- 彼ら
- この
- 介して
- 時間
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- トピック
- 伝統的な
- トラフィック
- トレンド
- 試します
- 2
- type
- 一般的に
- Uk
- 下
- まで
- つかいます
- 中古
- ユーザー
- 使用されます
- 値
- 価値観
- さまざまな
- 広大な
- 確認する
- 非常に
- 、
- 動画
- 待っています
- 欲しいです
- 仕方..
- 方法
- we
- ウェブ
- Webサービス
- 歓迎
- WELL
- いつ
- かどうか
- which
- while
- なぜ
- ワイド
- 広い範囲
- Wikipedia
- 意志
- 以内
- 仕事
- ワーキング
- 書き込み
- ヤムル
- You
- あなたの
- ゼファーネット
- ゾーン
- ZOO