生成AI モデルには企業運営に革命をもたらす可能性がありますが、企業はデータの保護や AI 生成コンテンツの品質確保などの課題を克服しながら、その力を活用する方法を慎重に検討する必要があります。
検索拡張生成 (RAG) フレームワークは、ドキュメント リポジトリ、データベース、API などの複数のソースからの外部データでプロンプトを拡張し、ドメイン固有のタスクに効果的な基盤モデルを作成します。 この投稿では、RAG モデルの機能を紹介し、Vector Search 機能を備えた MongoDB Atlas の変革の可能性を強調します。
MongoDBアトラス は、データ駆動型アプリケーションの開発を加速および簡素化するデータ サービスの統合スイートです。 そのベクトル データ ストアは運用データ ストレージとシームレスに統合されているため、別個のデータベースが必要ありません。 この統合により、次のような強力なセマンティック検索機能が可能になります。 ベクトル検索、セマンティック検索と AI を活用したアプリケーションを迅速に構築する方法。
アマゾンセージメーカー 企業が機械学習 (ML) モデルを構築、トレーニング、展開できるようにします。 Amazon SageMaker ジャンプスタート ML を始めるのに役立つ事前トレーニングされたモデルとデータを提供します。 SageMaker JumpStart ランディング ページを通じて、事前トレーニングされたモデルとデータにアクセス、カスタマイズ、デプロイできます。 Amazon SageMakerスタジオ 数回クリックするだけで。
Amazon Lex は、企業が自然で本物のような対話を行うチャットボットや音声ボットを作成するのに役立つ会話型インターフェイスです。 Amazon Lex を生成 AI と統合することで、企業はユーザー入力が一貫性のあるコンテキストに関連した応答にシームレスに移行する総合的なエコシステムを作成できます。
ソリューションの概要
次の図は、ソリューションのアーキテクチャを示しています。
次のセクションでは、このソリューションとそのコンポーネントを実装する手順を説明します。
MongoDB クラスターをセットアップする
無料枠の MongoDB Atlas クラスターを作成するには、次の手順に従ってください。 クラスターを作成する。 データベースをセットアップする アクセス およびネットワーク アクセス.
SageMaker 埋め込みモデルをデプロイする
埋め込みモデル (ALL MiniLM L6 v2) を選択できます。 SageMaker JumpStart モデル、ノートブック、ソリューション ページで見やすくするために変数を解析したりすることができます。
選択する 配備します モデルをデプロイします。
モデルが正常にデプロイされていることを確認し、エンドポイントが作成されていることを確認します。
ベクトルの埋め込み
ベクトルの埋め込み テキストまたは画像をベクトル表現に変換するプロセスです。 次のコードを使用すると、SageMaker JumpStart でベクター埋め込みを生成し、ドキュメントごとに作成されたベクターでコレクションを更新できます。
payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name : embeddings[0]}}
collection.update_one(query, update)
上記のコードは、コレクション内の単一のオブジェクトを更新する方法を示しています。 すべてのオブジェクトを更新するには、次のようにします 説明書.
MongoDB ベクター データ ストア
MongoDB アトラス ベクトル検索 は、MongoDB にベクトル データを保存および検索できる新機能です。 ベクトル データは、高次元空間内の点を表すデータの一種です。 このタイプのデータは、ML および人工知能アプリケーションでよく使用されます。 MongoDB Atlas Vector Search は、と呼ばれる手法を使用します。 k最近傍 (k-NN) を使用して類似ベクトルを検索します。 k-NN は、指定されたベクトルに最も類似した k 個のベクトルを見つけることによって機能します。 最も類似したベクトルとは、ユークリッド距離の観点から指定されたベクトルに最も近いベクトルです。
ベクトル データを運用データの隣に保存すると、異なるストレージ システム間でデータを移動する必要性が減り、パフォーマンスが向上します。 これは、ベクトル データへのリアルタイム アクセスが必要なアプリケーションにとって特に有益です。
ベクトル検索インデックスを作成する
次のステップは、 MongoDB ベクトル検索インデックス 前のステップで作成したベクトルフィールド上で。 MongoDB は knnVector
ベクトル埋め込みのインデックスの型。 ベクトル フィールドは、数値の配列として表す必要があります (BSON int32、int64、または double データ型のみ)。
参照する knnVector タイプの制限を確認する の制限の詳細については、 knnVector
タイプ。
次のコードはインデックス定義のサンプルです。
{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}
ディメンションは埋め込みモデルのディメンションと一致する必要があることに注意してください。
ベクター データ ストアにクエリを実行する
次を使用してベクター データ ストアにクエリを実行できます。 ベクター検索集約パイプライン。 ベクトル検索インデックスを使用して、 セマンティック検索 ベクター データ ストア上にあります。
次のコードは、検索定義のサンプルです。
{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}
SageMaker の大規模言語モデルをデプロイする
SageMaker JumpStart 基盤モデル テキストの要約、質問応答、自然言語推論など、さまざまな自然言語処理 (NLP) タスクを解決するために使用される、事前トレーニングされた大規模言語モデル (LLM) です。 さまざまなサイズと構成が用意されています。 このソリューションでは、 ハグ顔 FLAN-T5-XLモデル。
SageMaker JumpStart で FLAN-T5-XL モデルを検索します。
選択する 配備します FLAN-T5-XL モデルをセットアップします。
モデルが正常にデプロイされ、エンドポイントがアクティブであることを確認します。
Amazon Lex ボットを作成する
Amazon Lex ボットを作成するには、次の手順を実行します。
- Amazon Lexコンソールで、選択します ボットを作成する.
- ボット名、名前を入力します。
- ランタイムの役割選択 基本的なAmazonLex権限を持つロールを作成します.
- 言語設定を指定し、選択します クリックします.
- サンプル発話を追加します
NewIntent
UIと選択 意図を保存. - に移動します
FallbackIntent
デフォルトで作成されたものを選択して切り替えます アクティブ セクションに フリフィルメント のセクションから無料でダウンロードできます。 - 選択する 完成に向けてあなたの背中を押してくれる、執筆のための持続可能で本物のモーメンタムを作り出す。 ビルドが成功したら、選択します ホイール試乗.
- テストする前に、歯車アイコンを選択します。
- 特定します AWSラムダ MongoDB Atlas および LLM と対話して応答を提供する関数。 ラムダ関数を作成するには次のようにします これらのステップ.
- これで、LLM と対話できるようになります。
クリーンアップ
リソースをクリーンアップするには、次の手順を実行します。
- Amazon Lex ボットを削除します。
- Lambda 関数を削除します。
- LLM SageMaker エンドポイントを削除します。
- エンベディング モデルの SageMaker エンドポイントを削除します。
- MongoDB Atlas クラスターを削除します。
まとめ
この投稿では、MongoDB Atlas セマンティック検索を使用し、SageMaker JumpStart のモデルと統合する単純なボットを作成する方法を示しました。 このボットを使用すると、MongoDB Atlas で生成されたコンテキストと組み合わせながら、SageMaker Jumpstart でさまざまな LLM とのユーザー操作のプロトタイプを迅速に作成できます。
いつものように、AWS はフィードバックを歓迎します。 フィードバックや質問をコメント欄に残してください。
著者について
イゴール・アレクゼーフ AWS のデータおよび分析ドメインのシニア パートナー ソリューション アーキテクトです。 彼の役割では、Igor は戦略的パートナーと協力して、AWS に最適化された複雑なアーキテクチャの構築を支援しています。 AWS に入社する前は、データ/ソリューション アーキテクトとして、Hadoop エコシステムのいくつかのデータ レイクを含む、ビッグ データ ドメインで多くのプロジェクトを実装しました。 データ エンジニアとして、AI/ML を不正検出やオフィス オートメーションに適用することに携わっていました。
バブスリニバサン MongoDB のシニア パートナー ソリューション アーキテクトです。 現在の役割では、AWS と協力して、AWS および MongoDB ソリューションの技術的統合と参照アーキテクチャを構築しています。 彼は、データベースおよびクラウド テクノロジで XNUMX 年以上の経験を持っています。 彼は、複数の地域にまたがる複数のグローバル システム インテグレータ (GSI) と連携する顧客に技術ソリューションを提供することに情熱を注いでいます。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/
- :持っている
- :は
- :どこ
- $UP
- 100
- 200
- 321
- 361
- 7
- 9
- a
- 私たちについて
- 上記の.
- 加速する
- アクセス
- 越えて
- アクティブ
- 後
- 凝集
- AI
- AI電源
- AI / ML
- すべて
- ことができます
- 常に
- Amazon
- Amazon Lex
- アマゾンセージメーカー
- Amazon SageMaker ジャンプスタート
- Amazon Webサービス
- an
- 分析論
- および
- API
- 適用
- 建築
- です
- 配列
- 人工の
- 人工知能
- AS
- At
- 補強します
- オートメーション
- 利用できます
- AWS
- AWSラムダ
- 基本
- BE
- 有益な
- の間に
- ビッグ
- ビッグデータ
- ロボット
- ボット
- ビルド
- ビジネス
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 呼ばれます
- 缶
- 機能
- 慎重に
- 課題
- チャットボット
- 選択する
- クラウド
- クラスタ
- コード
- コヒーレント
- コレクション
- 注釈
- コンプリート
- 複雑な
- コンポーネント
- 検討
- 領事
- コンテンツ
- コンテキスト
- 会話
- 変換
- 作ります
- 作成した
- 電流プローブ
- Customers
- カスタマイズ
- データ
- データストレージ
- データ駆動型の
- データベース
- データベースを追加しました
- 数十年
- デフォルト
- デフォルト
- 定義
- 展開します
- 展開
- 検出
- 開発
- 異なります
- 次元
- 大きさ
- 距離
- ドキュメント
- ドメイン
- ダイナミック
- エコシステム
- 効果的な
- 排除
- 埋め込み
- 可能
- エンドポイント
- 従事する
- エンジニア
- 確保する
- 入力します
- Enterprise
- 企業
- 特に
- あらゆる
- 体験
- 外部
- スピーディー
- 特徴
- フィードバック
- 少数の
- フィールド
- フィールズ
- filter
- 発見
- フォロー中
- Foundation
- フレームワーク
- 詐欺
- 不正検出
- 無料版
- から
- function
- ギア
- 生成する
- 世代
- 生々しい
- 生成AI
- 地域
- 取得する
- 与えられた
- グローバル
- ハーネス
- 持ってる
- he
- 助けます
- 助け
- ことができます
- ハイライト
- 彼の
- 包括的な
- 認定条件
- How To
- HTML
- HTTP
- HTTPS
- ICON
- 説明する
- 画像
- 実装する
- 実装
- 改善します
- in
- 含めて
- index
- 情報
- 説明書
- 統合された
- 統合する
- 統合
- 統合
- 統合
- インテリジェンス
- 対話
- 相互作用
- 相互作用
- インタフェース
- に
- 関係する
- IT
- ITS
- 参加
- JSON
- ただ
- 湖
- 着陸
- 言語
- 大
- 学習
- コメントを残す
- リアルな
- 制限
- LLM
- 機械
- 機械学習
- make
- 多くの
- 一致
- ML
- モデル
- MongoDBの
- 他には?
- 最も
- の試合に
- しなければなりません
- 名
- ナチュラル
- 自然言語処理
- 必要
- ネットワーク
- 新作
- 次の
- NLP
- 今
- 番号
- オブジェクト
- オブジェクト
- of
- Office
- 頻繁に
- on
- もの
- の
- オペレーショナル
- 業務執行統括
- or
- 元来の
- 克服する
- 概要
- ページ
- ペアリング
- パートナー
- パートナー
- 情熱的な
- path
- パフォーマンス
- 実行する
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- お願いします
- ポイント
- ポスト
- 潜在的な
- 電力
- 強力な
- プレゼント
- 前
- 事前の
- プロセス
- 処理
- プロジェクト(実績作品)
- プロトタイプ
- 提供します
- は、大阪で
- 提供
- 品質
- 質問
- 質問
- すぐに
- への
- 縮小
- 参照
- 関連した
- 表現
- で表さ
- 表し
- 必要とする
- リソース
- 回答
- 革命を起こす
- 職種
- 保護
- セージメーカー
- スコア
- シームレス
- を検索
- セクション
- セクション
- シニア
- 別
- サービス
- セッションに
- 設定
- いくつかの
- すべき
- 示されました
- 作品
- 同様の
- 簡単な拡張で
- 簡素化する
- サイズ
- 溶液
- ソリューション
- 解決する
- ソース
- スペース
- 開始
- 手順
- ステップ
- ストレージ利用料
- 店舗
- 戦略的
- 戦略的パートナー
- 成功した
- 首尾よく
- そのような
- スイート
- システム
- タスク
- 技術的
- 技術
- テクノロジー
- 条件
- test
- テスト
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- より
- それ
- アプリ環境に合わせて
- それら
- その後
- 彼ら
- この
- 介して
- 層
- 〜へ
- トレーニング
- 変形させる
- 遷移
- true
- 2
- type
- ui
- アップデイト
- つかいます
- 中古
- ユーザー
- 使用されます
- 多様
- 確認する
- ボイス
- 歩く
- ました
- 仕方..
- we
- ウェブ
- Webサービス
- ようこそ
- while
- 意志
- ワーキング
- 作品
- You
- あなたの
- ゼファーネット