の発売を発表できることを嬉しく思います Amazon DocumentDB(MongoDB互換性あり) との統合 Amazon SageMaker キャンバスこれにより、Amazon DocumentDB の顧客はコードを書かずに生成 AI および機械学習 (ML) ソリューションを構築して使用できるようになります。 Amazon DocumentDB はフルマネージドのネイティブ JSON ドキュメント データベースであり、インフラストラクチャを管理することなく、実質的にあらゆる規模で重要なドキュメントのワークロードを簡単かつコスト効率よく運用できるようになります。 Amazon SageMaker Canvas は、基盤モデルを含むすぐに使用できるモデルと、データを準備してカスタムモデルを構築およびデプロイする機能を提供するノーコード ML ワークスペースです。
この投稿では、Amazon DocumentDB に保存されているデータを SageMaker Canvas に取り込み、そのデータを使用して予測分析用の ML モデルを構築する方法について説明します。 データ パイプラインを作成および維持することなく、Amazon DocumentDB に保存されている非構造化データを使用して ML モデルを強化できるようになります。
ソリューションの概要
食品配達会社のビジネス アナリストの役割を想定してみましょう。 モバイルアプリは、そのスケーラビリティと柔軟なスキーマ機能により、レストランに関する情報を Amazon DocumentDB に保存します。 このデータに関する洞察を収集し、新しいレストランがどのように評価されるかを予測するための ML モデルを構築したいと考えていますが、非構造化データの分析を実行するのは難しいと感じています。 これらの目標を達成するにはデータ エンジニアリング チームとデータ サイエンス チームに依存する必要があるため、ボトルネックに遭遇します。
この新しい統合により、Amazon DocumentDB データを SageMaker Canvas に簡単に取り込み、すぐに ML 用のデータの準備と分析を開始できるようになり、これらの問題が解決されます。 さらに、SageMaker Canvas は、高品質のモデルを構築して予測を生成するための ML 専門知識への依存を排除します。
次の手順で、Amazon DocumentDB データを使用して SageMaker Canvas で ML モデルを構築する方法を示します。
- SageMaker Canvas で Amazon DocumentDB コネクタを作成します。
- 生成 AI を使用してデータを分析します。
- 機械学習用のデータを準備します。
- モデルを構築し、予測を生成します。
前提条件
このソリューションを実装するには、次の前提条件を満たしている必要があります。
- AWS クラウド管理者アクセス権を持っている AWS IDおよびアクセス管理 (わたし) user 統合を完了するために必要な権限が付与されています。
- 次を使用して環境セットアップを完了します。 AWS CloudFormation 次のいずれかのオプションを使用します。
- CloudFormation テンプレートを新しい VPC にデプロイする – このオプションは、VPC、プライベートサブネット、セキュリティグループ、IAM 実行ロール、 アマゾンクラウド9, 必要な VPC エンドポイント, SageMakerドメイン。 次に、Amazon DocumentDB をこの新しい VPC にデプロイします。 ダウンロード template または、選択して CloudFormation スタックをクイック起動します。 発射スタック:
- CloudFormation テンプレートを既存の VPC にデプロイする – このオプションは、プライベートサブネットを持つ既存の VPC に必要な VPC エンドポイント、IAM 実行ロール、および SageMaker ドメインを作成します。 ダウンロード template または、選択して CloudFormation スタックをクイック起動します。 発射スタック:
- CloudFormation テンプレートを新しい VPC にデプロイする – このオプションは、VPC、プライベートサブネット、セキュリティグループ、IAM 実行ロール、 アマゾンクラウド9, 必要な VPC エンドポイント, SageMakerドメイン。 次に、Amazon DocumentDB をこの新しい VPC にデプロイします。 ダウンロード template または、選択して CloudFormation スタックをクイック起動します。 発射スタック:
新しい SageMaker ドメインを作成している場合は、Amazon DocumentDB にコネクタを追加できるように、インターネット アクセスのないプライベート VPC 内にドメインを設定する必要があることに注意してください。 詳細については、を参照してください。 インターネットにアクセスせずに VPC で Amazon SageMaker Canvas を設定する.
- フォロー チュートリアル サンプルのレストランデータを Amazon DocumentDB にロードします。
- Amazon Bedrock とその中の Anthropic Claude モデルへのアクセスを追加します。 詳細については、を参照してください。 モデルアクセスの追加.
SageMaker Canvas で Amazon DocumentDB コネクタを作成する
SageMaker ドメインを作成したら、次の手順を実行します。
- Amazon DocumentDB コンソールで、次を選択します。 ノーコード機械学習 ナビゲーションペインに表示されます。
- ドメインとプロファイルを選択してください¸ SageMaker ドメインとユーザー プロファイルを選択します。
- 選択する Canvasを起動します 新しいタブで SageMaker Canvas を起動します。
SageMaker Canvas の読み込みが完了すると、 データフロー タブには何も表示されないことに注意してください。
- 選択する 創造する 新しいデータ フローを作成します。
- データ フローの名前を入力し、選択します 創造する.
- を選択して、新しい Amazon DocumentDB 接続を追加します。 インポート日、を選択します 表形式 for データセットの種類.
- ソフトウェア設定ページで、下図のように インポート日 ページ、 情報元、選択する ドキュメントDB および 接続を追加.
- 「demo」などの接続名を入力し、目的の Amazon DocumentDB クラスターを選択します。
SageMaker Canvas は、SageMaker ドメインと同じ VPC 内のクラスターをドロップダウン メニューに事前に設定することに注意してください。
- ユーザー名、パスワード、データベース名を入力します。
- 最後に、読み取り設定を選択します。
プライマリ インスタンスのパフォーマンスを保護するために、SageMaker Canvas はデフォルトで 二次つまり、セカンダリ インスタンスからのみ読み取ります。 読み取り設定が 第二優先, SageMaker Canvas は利用可能なセカンダリ インスタンスから読み取りますが、セカンダリ インスタンスが利用できない場合はプライマリ インスタンスから読み取ります。 Amazon DocumentDB 接続の設定方法の詳細については、「 AWS に保存されているデータベースに接続する.
- 選択する 接続を追加.
接続が成功すると、Amazon DocumentDB データベース内のコレクションがテーブルとして表示されます。
- 選択したテーブルを空白のキャンバスにドラッグします。 この投稿では、レストランのデータを追加します。
最初の 100 行がプレビューとして表示されます。
- データの分析と準備を開始するには、次を選択します。 インポート日.
- データセット名を入力して選択します インポート日.
生成AIを使用したデータ分析
次に、データに関する洞察を取得し、パターンを探したいと思います。 SageMaker Canvas は、データを分析および準備するための自然言語インターフェイスを提供します。 とき 且つ タブが読み込まれると、次の手順でデータとのチャットを開始できます。
- 選択する データ準備のためのチャット.
- 次のスクリーンショットに示されているサンプルのような質問をして、データに関する洞察を収集します。
自然言語を使用してデータを探索および準備する方法の詳細については、以下を参照してください。 自然言語を使用して、Amazon SageMaker Canvas の新機能でデータを探索および準備します.
データ品質を自動的に評価し、異常を検出する SageMaker Canvas データ品質およびインサイト レポートを使用して、データ品質をより深く理解してみましょう。
- ソフトウェア設定ページで、下図のように 分析 タブを選択 データ品質と洞察レポート.
- 選択する
rating
ターゲット列として、 不具合 問題の種類として選択し、 創造する.
これにより、モデルのトレーニングがシミュレートされ、機械学習用にデータを改善する方法についての洞察が得られます。 完全なレポートは数分で生成されます。
レポートでは、ターゲット内の行の 2.47% に欠損値があることが示されています。これについては次のステップで説明します。 さらに、分析により、 address line 2
, name
, type_of_food
特徴は、データ内で最も予測力があります。 これは、場所や料理などのレストランの基本情報が評価に大きな影響を与える可能性があることを示しています。
機械学習用のデータを準備する
SageMaker Canvas は、インポートされたデータを準備するための 300 以上の組み込み変換を提供します。 SageMaker Canvas の変換機能の詳細については、以下を参照してください。 高度な変換を使用してデータを準備する。 いくつかの変換を追加して、ML モデルをトレーニングできるようにデータを準備しましょう。
- に戻ります データフロー ページの上部でデータ フローの名前を選択して、ページを開きます。
- 横のプラス記号を選択します データ型 選択して 変換を追加.
- 選択する ステップを追加.
- の名前を変更しましょう
address line 2
列からcities
.- 選択する 列を管理する.
- 選択する 列の名前を変更 for 最適化の適用.
- 選択する
address line 2
for 入力列、 入るcities
for 新しい名前、選択して Add.
- さらに、不要な列をいくつか削除してみましょう。
- 新しい変換を追加します。
- 最適化の適用、選択する ドロップカラム.
- ドロップする列、選択する
URL
およびrestaurant_id
. - 選択する Add.
[
- 本サイトの
rating
feature 列には欠損値がいくつかあるため、これらの行にこの列の平均値を入力しましょう。- 新しい変換を追加します。
- 最適化の適用、選択する 代入.
- 列タイプ、選択する 数値の.
- 入力列を選択してください
rating
コラム。 - 帰属戦略、選択する 平均.
- 出力列、 入る
rating_avg_filled
. - 選択する Add.
- ドロップすることができます
rating
値が入力された新しい列があるためです。 - なぜなら
type_of_food
は本質的にカテゴリカルであるため、数値的にエンコードする必要があります。 ワンホット エンコーディング手法を使用して、この機能をエンコードしてみましょう。- 新しい変換を追加します。
- 最適化の適用、選択する ワンホットエンコード.
- [入力列] で、次を選択します。
type_of_food
. - 無効な処理戦略¸選ぶ キープ.
- 出力スタイル¸選ぶ コラム.
- 出力列、 入る
encoded
. - 選択する Add.
モデルを構築して予測を生成する
データを変換したので、数値 ML モデルをトレーニングしてレストランの評価を予測しましょう。
- 選択する モデルを作成する.
- データセット名、データセットのエクスポートの名前を入力します。
- 選択する 輸出 そして、変換されたデータがエクスポートされるまで待ちます。
- 選択する モデルを作成する ページの左下隅にあるリンク。
ページの左側にある Data Wrangler 機能からデータセットを選択することもできます。
- モデル名を入力します。
- 選択する 予測分析、を選択します 創造する.
- 選択する
rating_avg_filled
ターゲット列として。
SageMaker Canvas は、適切なモデル タイプを自動的に選択します。
- 選択する プレビューモデル データ品質に問題がないことを確認するためです。
- 選択する クイックビルド モデルを構築します。
モデルの作成が完了するまでに約 2 ~ 15 分かかります。
モデルのトレーニングが終了した後、モデルのステータスを表示できます。 私たちのモデルの RSME は 0.422 です。これは、モデルがレストランの評価を実際の値の +/- 0.422 以内で予測することが多く、これは 1 ~ 6 の評価スケールの確実な近似値であることを意味します。
- 最後に、に移動してサンプル予測を生成できます。 予測する タブには何も表示されないことに注意してください。
クリーンアップ
今後料金が発生しないようにするには、この投稿のフォロー中に作成したリソースを削除してください。 SageMaker Canvas はセッションの継続時間に対して料金を請求するため、使用していないときは SageMaker Canvas からログアウトすることをお勧めします。 参照する Amazon SageMaker Canvas からのログアウト のガイドをご参照ください。
まとめ
この投稿では、Amazon DocumentDB に保存されたデータを使用した生成 AI および ML に SageMaker Canvas を使用する方法について説明しました。 この例では、アナリストがサンプルのレストラン データセットを使用して高品質の ML モデルを迅速に構築する方法を示しました。
Amazon DocumentDB からのデータのインポートから SageMaker Canvas での ML モデルの構築まで、ソリューションを実装する手順を示しました。 プロセス全体は、コードを XNUMX 行も記述することなく、ビジュアル インターフェイスを通じて完了しました。
ローコード/ノーコード ML ジャーニーを開始するには、以下を参照してください。 Amazon SageMaker キャンバス.
著者について
アデレケ・コーカー AWS のグローバル ソリューション アーキテクトです。 彼は世界中の顧客と協力して、AWS に本番ワークロードを大規模にデプロイする際のガイダンスと技術支援を提供しています。 余暇には、学習、読書、ゲーム、スポーツ イベントの観戦を楽しんでいます。
グルラジ・S・バヤリ AWS のシニア DocumentDB スペシャリスト ソリューション アーキテクトです。 彼は、顧客が Amazon の専用データベースを導入できるよう支援することに喜びを感じています。 彼は、顧客が NoSQL やリレーショナル データベースを活用したインターネット スケールと高性能ワークロードの設計、評価、最適化を支援します。
ティム・プサテリ 彼は AWS のシニアプロダクトマネージャーで、Amazon SageMaker Canvas に取り組んでいます。 彼の目標は、顧客が AI/ML から価値を迅速に引き出せるよう支援することです。 仕事以外では、アウトドアに出かけたり、ギターを弾いたり、ライブ音楽を鑑賞したり、家族や友人と時間を過ごすのが大好きです。
プラティック・ダス AWS のプロダクト マネージャーです。 彼は、クラウド上で復元力のあるワークロードと強力なデータ基盤を構築したいと考えている顧客と協力することに喜びを感じています。 彼は、企業と協力してモダナイゼーション、分析、データ変換の取り組みに取り組む専門知識をもたらします。
ヴァルマ ゴトゥムッカラ は、ダラス フォートワースを拠点とする AWS のシニア データベース スペシャリスト ソリューション アーキテクトです。 Varma は、顧客のデータベース戦略について協力し、AWS 専用データベースを使用してワークロードを設計します。 AWS に入社する前は、過去 22 年間、リレーショナル データベース、NOSQL データベース、および複数のプログラミング言語を幅広く扱ってきました。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/use-amazon-documentdb-to-build-no-code-machine-learning-solutions-in-amazon-sagemaker-canvas/
- :持っている
- :は
- :not
- :どこ
- 10
- 100
- 11
- 12
- 13
- 150
- 22
- 27
- 300
- 385
- 500
- 58
- 7
- 8
- 9
- a
- 能力
- できる
- 私たちについて
- アクセス
- こちらからお申し込みください。
- 実際の
- 加えます
- さらに
- 住所
- 管理人
- 採用
- 高度な
- 後
- AI
- AI / ML
- 許可
- また
- Amazon
- アマゾンセージメーカー
- Amazon SageMaker キャンバス
- Amazon Webサービス
- an
- 分析
- アナリスト
- 分析的
- 分析論
- 分析します
- 分析する
- および
- アナウンス
- 人間原理
- どれか
- アプリ
- 約
- です
- AS
- 質問
- 援助
- 引き受けます
- At
- 自動的に
- 利用できます
- 平均
- 避ける
- AWS
- バック
- ベース
- 基本
- BE
- なぜなら
- 札
- ボトルネック
- ボトム
- 持って来る
- もたらす
- ビルド
- 建物
- 構築します
- 内蔵
- 内蔵
- ビジネス
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 缶
- キャンバス
- 機能
- 機能
- 挑戦
- 課金
- チャット
- 選択
- 選択する
- 選択する
- クラウド
- クラスタ
- コード
- コレクション
- コラム
- コラム
- 会社
- 互換性
- コンプリート
- 記入済みの
- 接続
- からなる
- 領事
- コーナー
- コスト効率の良い
- 作ります
- 作成した
- 作成します。
- 作成
- 創造
- 重大な
- カスタム
- Customers
- ダラス
- データ
- データサイエンス
- データベース
- データベースを追加しました
- より深い
- デフォルト
- 配達
- デモ
- 実証します
- 依存関係
- 展開します
- 展開する
- 配備する
- 派生する
- 設計
- 希望
- 細部
- 話し合います
- 議論する
- 表示される
- ドキュメント
- ドメイン
- ダウンロード
- Drop
- デュレーション
- どちら
- エンコーディング
- エンジニアリング
- 確保
- 入力します
- 企業
- 全体
- 環境
- 評価する
- イベント
- 例
- 興奮した
- 実行
- 既存の
- 専門知識
- 探る
- export
- 広く
- 家族
- 特徴
- 特徴
- 少数の
- 埋める
- 埋め
- もう完成させ、ワークスペースに掲示しましたか?
- 名
- フレキシブル
- フロー
- フォロー中
- フード
- 食品の配達
- Foundation
- 財団
- 友達
- から
- 完全に
- 未来
- 賭博
- 集める
- 生成する
- 生成された
- 生々しい
- 生成AI
- 取得する
- グローバル
- グローバルに
- 目標
- 目標
- グループの
- ガイダンス
- ハンドリング
- 持ってる
- he
- 助けます
- 助け
- ことができます
- ハイ
- 高品質
- 彼の
- 認定条件
- How To
- HTML
- HTTPS
- アイデンティティ
- if
- 直ちに
- 影響
- 実装する
- インポート
- 改善します
- in
- 含めて
- を示し
- 情報
- インフラ
- イニシアチブ
- 洞察
- 統合
- インタフェース
- インターネット
- インターネット・アクセス
- に
- 問題
- IT
- ITS
- 参加
- 旅
- JPG
- JSON
- 土地
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 姓
- 起動する
- LEARN
- 学習
- 左
- ことができます
- ような
- LINE
- LINK
- ライブ
- 負荷
- ローディング
- 負荷
- 場所
- ロギング
- 見て
- 探して
- で
- 機械
- 機械学習
- 保守
- 作る
- 作成
- マネージド
- マネージャー
- 管理する
- 五月..
- 意味
- 手段
- メニュー
- 分
- 行方不明
- ML
- モバイル
- モバイルアプリ
- モデル
- MongoDBの
- 他には?
- 最も
- の試合に
- 音楽を聴く際のスピーカーとして
- しなければなりません
- 名
- ネイティブ
- ナチュラル
- 自然
- ナビゲート
- ナビゲーション
- 必要
- 新作
- 次の
- いいえ
- of
- 提供すること
- オファー
- 頻繁に
- on
- の
- 操作する
- 最適化
- オプション
- オプション
- or
- 私たちの
- でる
- 屋外で
- 外側
- が
- ページ
- ペイン
- パスワード
- パターン
- 実行する
- パフォーマンス
- パーミッション
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイ
- さらに
- ポスト
- 電力
- パワード
- 予測する
- 予測
- 予測
- 予測分析
- 予測
- 準備
- 準備中
- 前提条件
- プレビュー
- 主要な
- プライベート
- 問題
- 問題
- プロセス
- プロダクト
- プロダクトマネージャー
- 生産
- プロフィール
- プログラミング
- プログラミング言語
- 守る
- 提供します
- は、大阪で
- 目的
- 品質
- 質問
- クイック
- すぐに
- 定格の
- 評価
- 評価
- 読む
- リーディング
- 準備
- 推奨する
- 参照する
- 頼る
- 除去する
- レポート
- の提出が必要です
- 弾力性のあります
- リソース
- レストラン
- レストラン
- 職種
- 役割
- s
- セージメーカー
- 同じ
- スケーラビリティ
- 規模
- 科学
- スクリーンショット
- 二次
- セキュリティ
- select
- シニア
- センス
- サービス
- セッション
- 示されました
- 示す
- 作品
- 符号
- 簡単な拡張で
- So
- 固体
- 溶液
- ソリューション
- 解決する
- 一部
- 専門家
- 過ごす
- スポーツ
- スタック
- start
- Status:
- 手順
- ステップ
- 保存され
- 店舗
- 簡単な
- 戦略
- 強い
- サブネット
- 成功した
- そのような
- 適当
- テーブル
- 取る
- ターゲット
- チーム
- 技術的
- 技術
- template
- それ
- アプリ環境に合わせて
- その後
- そこ。
- ボーマン
- この
- それらの
- 介して
- 時間
- 〜へ
- top
- トレーニング
- トレーニング
- 最適化の適用
- 変換
- 変換
- 変換
- type
- 不要
- つかいます
- ユーザー
- 値
- 価値観
- 詳しく見る
- 事実上
- ビジュアル
- wait
- 欲しいです
- ました
- 見ている
- we
- ウェブ
- Webサービス
- いつ
- which
- while
- 意志
- 以内
- 無し
- 仕事
- 働いていました
- ワーキング
- 作品
- 価値
- 書き込み
- 年
- You
- あなたの
- ゼファーネット