Amazon SageMaker JumpStart を使用して LLM と対話するための Web UI を作成する |アマゾンウェブサービス

プラトン再発行

フォロワー： 0

ChatGPT の発売と生成 AI の人気の高まりは、このテクノロジーを使用して、より会話的なエンタープライズチャットボットなどの新しい製品やサービスを AWS 上で作成する方法に興味を持つ顧客の想像力を魅了しました。この投稿では、チャットスタジオと呼ばれる Web UI を作成して、会話を開始し、で利用可能な基盤モデルと対話する方法を説明します。 Amazon SageMaker ジャンプスタート Llama 2、Stable Diffusion、その他のモデルが利用可能です。アマゾンセージメーカー。このソリューションをデプロイすると、ユーザーはすぐに使い始めて、Web インターフェイスを通じて会話型 AI の複数の基盤モデルの機能を体験できます。

Chat Studio は、ユーザーがメディアの表示をリクエストした場合、オプションで安定拡散モデルエンドポイントを呼び出して、関連する画像とビデオのコラージュを返すこともできます。この機能は、応答に付随する資産としてメディアを使用することで、ユーザーエクスペリエンスを向上させるのに役立ちます。これは、目標を達成するために追加の統合によって Chat Studio を強化する方法の一例にすぎません。

次のスクリーンショットは、ユーザーのクエリと応答がどのようなものかを示す例です。

Chat Studio 応答インターフェイス

大規模な言語モデル

ChatGPT などの生成 AI チャットボットは、大量のラベルのないテキストでトレーニングできる深層学習ニューラルネットワークに基づく大規模言語モデル (LLM) を利用しています。 LLM を使用すると、実際の人間とのやり取りによく似た、より良い会話体験が可能になり、つながりの感覚が育まれ、ユーザーの満足度が向上します。

SageMaker 基盤モデル

2021 年、スタンフォード人間中心人工知能研究所は、一部の LLM を次のように呼びました。 基礎モデル。基礎モデルは、大規模かつ広範な一般データのセットで事前トレーニングされており、デジタルアートの生成から多言語テキストの分類まで、幅広いユースケースでさらなる最適化のための基礎として機能することを目的としています。新しいモデルをゼロからトレーニングするには時間がかかり、費用がかかる可能性があるため、これらの基礎モデルは顧客に人気があります。 SageMaker JumpStart は、サードパーティのオープンソースおよび独自のプロバイダーが維持する何百もの基盤モデルへのアクセスを提供します。

ソリューションの概要

この投稿では、SageMaker を介して事前トレーニング済みおよびカスタム LLM をデプロイし、デプロイされたモデルとインターフェイスする Web UI を作成するためのローコードワークフローについて説明します。次の手順について説明します。

SageMaker 基盤モデルをデプロイします。
配備します AWSラムダおよび AWS IDおよびアクセス管理 (IAM) アクセス許可を使用する AWS CloudFormation.
ユーザーインターフェイスを設定して実行します。
必要に応じて、他の SageMaker 基盤モデルを追加します。このステップにより、Chat Studio の機能が拡張され、追加の基盤モデルと対話できるようになります。
必要に応じて、次を使用してアプリケーションをデプロイします。 AWS 増幅。この手順では、Chat Studio を Web にデプロイします。

ソリューションアーキテクチャの概要については、次の図を参照してください。

チャットスタジオソリューションのアーキテクチャ

前提条件

ソリューションをウォークスルーするには、次の前提条件が必要です。

An AWSアカウント十分な IAM ユーザー権限があること。
npm ローカル環境にインストールされます。インストール方法については、 npm、参照する Node.js と npm のダウンロードとインストール.
対応する SageMaker エンドポイントのサービスクォータは 1。 Llama 2 13b Chat の場合は ml.g5.48xlarge インスタンスを使用し、Stable Diffusion 2.1 の場合は ml.p3.2xlarge インスタンスを使用します。

サービスクォータの増加をリクエストするには、 AWS サービスクォータコンソール、案内する AWSサービス, セージメーカー、サービスクォータをエンドポイント使用量の ml.g1xlarge とエンドポイント使用量の ml.p5.48xlarge の値 3.2 に引き上げるよう要求します。

インスタンスタイプの可用性によっては、サービスクォータリクエストが承認されるまでに数時間かかる場合があります。

SageMaker 基盤モデルをデプロイする

SageMaker は、開発者が ML モデルを迅速に構築し、簡単にトレーニングできるフルマネージドの機械学習 (ML) サービスです。次の手順を実行して、Llama 2 13b Chat および Stable Diffusion 2.1 基盤モデルをデプロイします。 Amazon SageMakerスタジオ:

SageMaker ドメインを作成します。手順については、を参照してください。クイックセットアップを使用して Amazon SageMaker ドメインにオンボードする.

ドメインはすべてのストレージをセットアップし、SageMaker にアクセスするユーザーを追加できるようにします。

SageMakerコンソールで、 Studio ナビゲーションペインで、を選択します オープンスタジオ.
Studio を起動すると、 SageMaker ジャンプスタート ナビゲーションペインで、 モデル、ノートブック、ソリューション.
検索バーで「Llama 2 13b Chat」を検索します。
展開構成、用 SageMaker ホスティングインスタンス、選択する ml.g5.48xラージ とのために エンドポイント名、入る meta-textgeneration-llama-2-13b-f.
選択する 展開します。

SageMaker JumpStart デプロイメント構成

デプロイメントが成功すると、次のメッセージが表示されるはずです。 In Service 状態。

ラマモデルのステータス

ソフトウェア設定ページで、下図のように モデル、ノートブック、ソリューション ページで、Stable Diffusion 2.1 を検索します。
展開構成、用 SageMaker ホスティングインスタンス、選択する ml.p3.2xlarge とのために エンドポイント名、入る jumpstart-dft-stable-diffusion-v2-1-base.
選択する 配備します.

SageMaker JumpStart デプロイメント構成

デプロイメントが成功すると、次のメッセージが表示されるはずです。 In Service 状態。

安定した普及モデルのステータス

AWS CloudFormation を使用して Lambda と IAM 権限をデプロイする

このセクションでは、ユーザーリクエストを処理し、デプロイした SageMaker エンドポイントを呼び出し、必要なすべての IAM 権限をデプロイする Lambda 関数をデプロイする CloudFormation スタックを起動する方法について説明します。次の手順を実行します。

に移動します GitHubリポジトリ CloudFormation テンプレートをダウンロードします (lambda.cfn.yaml) をローカルマシンにコピーします。
CloudFormation コンソールで、 スタックを作成 ドロップダウンメニューから選択 新しいリソースを使用（標準）.
ソフトウェア設定ページで、下図のように テンプレートを指定 テンプレートファイルをアップロードする および ファイルを選ぶ.
選択する lambda.cfn.yaml ダウンロードしたファイルを選択し、 Next.
ソフトウェア設定ページで、下図のように スタックの詳細を指定する ページで、スタック名と前提条件で取得した API キーを入力し、選択します Next.
ソフトウェア設定ページで、下図のように スタックオプションを構成する ページ、選択 Next.
変更を確認して承認し、選択します送信.

Web UIをセットアップする

このセクションでは、Web UI (次を使用して作成) を実行する手順について説明します。 Cloudscape デザインシステム) ローカルマシン上:

IAM コンソールで、ユーザーに移動します。 functionUrl.
ソフトウェア設定ページで、下図のように セキュリティ資格情報 タブを選択 アクセスキーの作成.
ソフトウェア設定ページで、下図のように 主要なベストプラクティスと代替案にアクセスする コマンドラインインタフェース（CLI） 選択して Next.
ソフトウェア設定ページで、下図のように 説明タグを設定する ページ、選択 アクセスキーの作成.
アクセスキーとシークレットアクセスキーをコピーします。
選択する クリックします.
に移動します GitHubリポジトリダウンロードして react-llm-chat-studio コード。
好みの IDE でフォルダーを起動し、ターミナルを開きます。
MFAデバイスに移動する src/configs/aws.json 取得したアクセスキーとシークレットアクセスキーを入力します。
ターミナルに次のコマンドを入力します。
```
npm install npm start
```
Open http://localhost:3000 ブラウザでモデルとの対話を開始してください。

Chat Studio を使用するには、ドロップダウンメニューで基本モデルを選択し、テキストボックスにクエリを入力します。 AI が生成した画像を応答とともに取得するには、クエリの最後に「画像あり」というフレーズを追加します。

他の SageMaker 基盤モデルを追加する

このソリューションの機能をさらに拡張して、追加の SageMaker 基盤モデルを含めることができます。各モデルは SageMaker エンドポイントを呼び出すときに異なる入力および出力形式を想定しているため、モデルとインターフェースをとるために callSageMakerEndpoints Lambda 関数に変換コードを記述する必要があります。

このセクションでは、選択した追加モデルを実装するために必要な一般的な手順とコードの変更について説明します。ステップ 6 ～ 8 では、Python 言語の基本的な知識が必要であることに注意してください。

SageMaker Studio で、選択した SageMaker 基盤モデルをデプロイします。
選択する SageMaker ジャンプスタート および JumpStart アセットを起動する.
新しくデプロイされたモデルのエンドポイントを選択し、 ノートブックを開く.
ノートブックコンソールで、ペイロードパラメーターを見つけます。

これらは、新しいモデルが SageMaker エンドポイントを呼び出すときに予期するフィールドです。次のスクリーンショットは例を示しています。

SageMaker エンドポイントの設定

Lambda コンソールで、次の場所に移動します。 callSageMakerEndpoints.
新しいモデルにカスタム入力ハンドラーを追加します。

次のスクリーンショットでは、Falcon 40B Instruct BF16 と GPT NeoXT Chat Base 20B FP16 の入力を変換しました。指示に従ってカスタムパラメーターロジックを挿入し、コピーしたペイロードパラメーターを参照して入力変換ロジックを追加できます。

Lambda コードのスニペット

ノートブックのコンソールに戻り、 query_endpoint.

この関数は、モデルの出力を変換して最終的なテキスト応答を抽出する方法を示します。

SageMaker エンドポイントの設定

のコードを参照すると、 query_endpoint、新しいモデルのカスタム出力ハンドラーを追加します。
選択する 展開します。
IDE を開き、 react-llm-chat-studio コードを入力して、次の場所に移動します src/configs/models.json.
モデル名とモデルエンドポイントを追加し、ステップ 4 のペイロードパラメーターを入力します。 payload 次の形式を使用します。
```
"add_model_name": { "endpoint_name": "add_model_enpoint", "payload": { "add_payload_paramters_here"
}
},
```
ブラウザを更新して、新しいモデルとの対話を開始してください。

Amplify を使用してアプリケーションをデプロイする

Amplify は、アプリケーションを迅速かつ効率的にデプロイできる完全なソリューションです。このセクションでは、Chat Studio をアマゾンCloudFrontのアプリケーションを他のユーザーと共有したい場合は、Amplify を使用して配布します。

に移動します react-llm-chat-studio 先ほど作成した code フォルダー。
ターミナルに次のコマンドを入力し、セットアップ手順に従います。
```
npm install -g @aws-amplify/cli amplify configure
```
次のコマンドを使用して、新しい Amplify プロジェクトを初期化します。プロジェクト名を入力し、デフォルトの構成を受け入れ、選択します AWS アクセスキー 認証方法の選択を求められた場合。
```
amplify init
```
次のコマンドを使用して、Amplify プロジェクトをホストします。選ぶ Amazon CloudFront と S3 プラグインモードを選択するよう求められたら。
```
amplify hosting add
```
最後に、次のコマンドを使用してプロジェクトをビルドしてデプロイします。
```
amplify publish
```
デプロイが成功したら、ブラウザーで指定された URL を開いて、モデルとの対話を開始します。

クリーンアップ

今後の請求を回避するには、次の手順を実行します。

CloudFormation スタックを削除します。手順については、を参照してください。 AWSCloudFormationコンソールでスタックを削除する.
SageMaker JumpStart エンドポイントを削除します。手順については、を参照してください。エンドポイントとリソースの削除.
SageMaker ドメインを削除します。手順については、を参照してください。 AmazonSageMakerドメインを削除します.

まとめ

この投稿では、AWS にデプロイされた LLM とインターフェースするための Web UI を作成する方法を説明しました。

このソリューションを使用すると、LLM と対話し、ユーザーフレンドリーな方法で会話を行って、テストしたり、LLM に質問したり、必要に応じて画像やビデオのコラージュを取得したりできます。

このソリューションは、追加の基礎モデルを統合するなど、さまざまな方法で拡張できます。 Amazon Kendra との統合エンタープライズコンテンツなどを理解するための ML を利用したインテリジェントな検索を可能にします。

ぜひ実験してみてください AWS で利用可能なさまざまな事前トレーニング済み LLM、または SageMaker で独自の LLM を構築したり、独自の LLM を作成したりできます。コメントで質問や発見をお知らせください。楽しんでください。

著者について

Amazon SageMaker JumpStart を使用して LLM と対話するウェブ UI を作成する |アマゾンウェブサービス PlatoBlockchain データインテリジェンス。垂直検索。あい。 ジャレット・ヨー・シャンウェイ は、ASEAN 全体の公共部門をカバーする AWS プロフェッショナルサービスのアソシエイトクラウドアーキテクトであり、顧客の最新化とクラウドへの移行を支援する提唱者です。彼は 8 つの AWS 認定を取得しており、第 XNUMX 回 AI 国際会議で勾配ブースティングマシンアンサンブルに関する研究論文も発表しました。ジャレットは自由時間には AWS の生成 AI シーンに焦点を当て、貢献しています。

Amazon SageMaker JumpStart を使用して LLM と対話するウェブ UI を作成する |アマゾンウェブサービス PlatoBlockchain データインテリジェンス。垂直検索。あい。 タミー・リム・リー・シン AWS のアソシエイトクラウドアーキテクトです。彼女はテクノロジーを使用して、顧客がクラウド導入の過程で望ましい結果を実現できるよう支援しており、AI/ML に情熱を注いでいます。仕事以外では、旅行、ハイキング、家族や友人と時間を過ごすことが大好きです。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://aws.amazon.com/blogs/machine-learning/create-a-web-ui-to-interact-with-llms-using-amazon-sagemaker-jumpstart/

タイムスタンプ： 2023 年 12 月 12 日

タイムスタンプ： 2023 年 11 月 17 日

プラトン再発行

Bundesliga Match Fact Pressure Handling: AWS でのプレッシャーの高い状況でのプレーヤーのパフォーマンスの評価

Amazon Kinesis、AWS Glue、AmazonSageMakerを使用して予知保全ソリューションを構築します

Amazon Forecast を使用して食品廃棄物を削減し、小売業の持続可能性と財務結果を改善する

Amazon SageMaker Ground Truthを使用してカスタムQ＆Aデータセットを構築し、Hugging Face Q＆ANLUモデルをトレーニングします

人間の介入による Amazon SageMaker モデルレジストリの承認とプロモーションのワークフローを構築する |アマゾンウェブサービス

Amazon SageMaker Canvas によるノーコード機械学習を使用して、製造品質のためのコンピュータービジョンによる欠陥検出を民主化する | アマゾンウェブサービス

Amazon SageMaker のマルチフレームワークモデルによるコスト効率の高い ML 推論

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー