クリエイティブな広告、メディアとエンターテイメント、e コマース、ファッションの業界を含む多くの顧客は、多くの画像の背景を変更する必要があることがよくあります。通常、これには写真ソフトウェアを使用して各画像を手動で編集する必要があります。これには、特に大量の画像のバッチの場合、多大な労力がかかる可能性があります。しかし、 アマゾンの岩盤 および AWSステップ関数 このプロセスを大規模に自動化することが簡単になります。
Amazon Bedrock は生成 AI 基盤モデルを提供します Amazon Titan イメージ ジェネレーター G1と呼ばれる技術を使用して画像の背景を自動的に変更できます。 塗りつぶし。 Step Functions を使用すると、Amazon Bedrock や他の AWS サービスとシームレスに接続する自動化されたワークフローを作成できます。 Amazon Bedrock と Step Functions を併用すると、複数の画像の背景を自動的に変更するプロセス全体が効率化されます。
この投稿では、複数の画像の背景を変更するプロセスを簡素化するソリューションを紹介します。の機能を活用することで、 generative AI このソリューションは、Amazon Bedrock と Titan Image Generator G1 モデルを Step Functions と組み合わせて、目的の背景を持つ画像を効率的に生成します。この投稿では、ソリューションの内部動作についての洞察を提供し、この独自のカスタム ソリューションを構築するために行われた設計上の選択を理解するのに役立ちます。
ジョブの設定方法については、 GitHubリポジトリ このソリューションを導入するための詳細な手順については、を参照してください。
ソリューションの概要
特定の要素と使用される AWS サービスについて詳しく説明する前に、ソリューションが高レベルでどのように機能するかを見てみましょう。次の図は、ソリューション アーキテクチャを簡略化して示し、主要な要素を強調しています。
ワークフローは次の手順で構成されます。
- ユーザーが複数の画像を Amazon シンプル ストレージ サービス Streamlit Web アプリケーション経由で (Amazon S3) バケットにアクセスします。
- Streamlit Web アプリケーションは アマゾンAPIゲートウェイ REST API エンドポイントと統合 Amazonの再認識 ラベル検出 API、各画像のラベルを検出します。
- 送信時に、Streamlit Web アプリケーションは Amazon DynamoDB 画像の詳細を示す表。
- DynamoDB の更新により、 AWSラムダ Step Functions ワークフローを開始する関数。
- Step Functions ワークフローは、画像ごとに次のステップを実行します。
5.1 Amazon Bedrock のリクエスト ペイロードを構築するInvokeModel
APIです。
5.2 Amazon Bedrock を呼び出すInvokeModel
APIアクション。
5.3 応答から画像を解析し、S3 の場所に保存します。
5.4 DynamoDB テーブル内のイメージのステータスを更新します。 - Step Functions ワークフローは、Lambda 関数を呼び出してステータス レポートを生成します。
- ワークフローは次を使用して電子メールを送信します Amazon シンプル通知サービス (AmazonSNS)。
次のスクリーンショットに示すように、Streamlit Web アプリケーションを使用すると、画像をアップロードし、テキスト プロンプトを入力して、希望の背景、ネガティブ プロンプト、画像生成のアウトペイント モードを指定できます。また、最終的に生成される画像に保持したくない、アップロードされた各画像に関連付けられた不要なラベルを表示して削除することもできます。
この例では、背景のプロンプトは「ロンドン都市の背景」です。自動化プロセスでは、アップロードされた元の画像に基づいて、ロンドンを背景にした新しい画像が生成されます。
Streamlit Web アプリケーションと画像のアップロード
Streamlit Web アプリケーションは、このソリューションのフロントエンドとして機能します。アプリケーションを不正アクセスから保護するために、アプリケーションは アマゾンコグニート ユーザープール。 APIゲートウェイは Amazon Cognito 承認者 リクエストを認証するため。 Web アプリケーションは次の手順を実行します。
- 選択した画像ごとに、API Gateway REST API エンドポイントを使用して Amazon Rekognition 経由でラベルを取得します。
- 送信時に、アプリケーションは画像を S3 バケットにアップロードします。
- アプリケーションは、別の API Gateway REST API エンドポイントを使用して、関連するパラメーター、イメージ名、各イメージの関連ラベルで DynamoDB テーブルを更新します。
画像処理ワークフロー
DynamoDB テーブルが更新されると、 DynamoDB ストリーム Lambda 関数をトリガーして、新しい Step Functions ワークフローを開始します。以下は、ワークフローのサンプル リクエストです。
その後、Step Functions ワークフローは次の 3 つのステップを実行します。
- すべての画像の背景を置き換えます。
- ステータスレポートを生成します。
- Amazon SNS 経由でメールを送信します。
次のスクリーンショットは、Step Functions のワークフローを示しています。
各ステップを詳しく見てみましょう。
すべての画像の背景を置き換える
Step Functions は 分散マップ 各画像を並列子ワークフローで処理します。分散マップにより、高度な同時処理が可能になります。各子ワークフローには、親ワークフローとは別の独自の実行履歴があります。
Step Functions は Amazon Bedrock 向けに InvokeModel に最適化された API アクション。 API は、最大 25 MB のリクエストと応答を受け入れます。ただし、Step Functions には状態ペイロードの入出力に 256 KB の制限があります。より大きな画像をサポートするために、ソリューションでは S3 バケットを使用します。 InvokeModel
API はデータを読み取り、結果を書き込みます。以下は、 InvokeModel
Amazon Bedrock 統合用の API:
Input S3Uri
パラメータは、入力データを取得するソースの場所を指定します。の Output S3Uri
パラメータにはAPIレスポンスの書き込み先を指定します。
Lambda 関数は、リクエストのペイロードを指定された場所に JSON ファイルとして保存します。 Input S3Uri
位置。 NS InvokeModel
API はこの入力ペイロードを使用して、指定された背景を持つ画像を生成します。
Titan Image Generator G1 モデルは、イメージ生成用に次のパラメーターをサポートしています。
- タスクタイプ – 画像の背景を置き換えるアウトペイント方法を指定します。
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다. – 背景を定義するためのテキスト プロンプト。
- ネガティブテキスト – 画像に含めないものを定義するためのテキスト プロンプト。
- マスクプロンプト – マスクを定義するテキスト プロンプト。これは、最終的に生成されるイメージに保持したいラベルに対応します。
- マスク画像 – Base64 でエンコードされた JPEG または PNG 画像。
- アウトペイントモード – マスク内のピクセルの変更を許可するかどうかを指定します。 DEFAULT では、再構築された背景との一貫性を保つために、マスク内の画像を変更できます。 PRECISE は、マスク内の画像の変更を防ぎます。
- 画像の数 – 生成する画像の数。
- 品質 – 生成された画像の品質:
standard
orpremium
. - cfgスケール – 生成されたイメージがプロンプトにどれだけ強く従うかを指定します。
- 高さ – 画像の高さ (ピクセル単位)。
- 幅 – 画像の幅 (ピクセル単位)。
アマゾンの岩盤 InvokeModel
API は、エンコードされた画像を含む応答を生成します。 Output S3Uri
位置。別の Lambda 関数は、応答から画像を解析し、base64 からデコードして、画像ファイルを次の場所に保存します。 s3://<Image Bucket>/generated-image-file/<year>/<month>/<day>/<timestamp>/
.
最後に、子ワークフローはイメージ生成ステータスで DynamoDB テーブルを更新し、次のいずれかにマークします。 成功した or Failed:、次のような詳細を含みます。 ImageName
, Cause
, Error
, Status
.
ステータスレポートを生成する
イメージ生成プロセスの後、Lambda 関数は DynamoDB からステータスの詳細を取得します。これらの詳細を動的にコンパイルして、JSON 形式の包括的なステータス レポートを作成します。次に、生成されたステータス レポートを JSON ファイルとして次の場所に保存します。 s3://<Image Bucket>/status-report-files/<year>/<month>/<day>/<timestamp>/
。 ITOps チームは、このレポートを既存の通知システムと統合して、画像処理が正常に完了したかどうかを追跡できます。ビジネス ユーザーの場合は、これをさらに拡張して CSV 形式でレポートを生成できます。
Amazon SNS 経由でメールを送信する
Step Functions は、Amazon SNS API アクションを呼び出して E メールを送信します。このメールには、ステータス レポートや最終イメージ ファイルの S3 の場所などの詳細が含まれています。以下は通知メールのサンプルです。
まとめ
この投稿では、Amazon Bedrock と Step Functions を使用して大規模に画像の背景を変更する自動化を実証するサンプル ソリューションの概要を説明しました。ソリューションの各要素についても詳しく説明しました。 Amazon Bedrock、Distributed Map、Titan Image Generator G1 モデルとの Step Functions の最適化された統合を使用することで、このソリューションは画像の背景を並行して効率的に置き換え、生産性とスケーラビリティを向上させます。
ソリューションを展開するには、次の手順を参照してください。 GitHubリポジトリ.
リソース
Amazon Bedrock の詳細については、次のリソースを参照してください。
Titan Image Generator G1 モデルの詳細については、次のリソースを参照してください。
Step Functions で Amazon Bedrock を使用する方法の詳細については、次のリソースを参照してください。
著者について
チェタン・マクヴァナ アマゾン ウェブ サービスのシニア ソリューション アーキテクトです。彼は AWS パートナーや顧客と協力して、スケーラブルなアーキテクチャを構築し、AWS サービスの導入を促進する戦略を実装するためのアーキテクチャ ガイダンスを提供しています。彼はテクノロジ愛好家であり、生成 AI、サーバーレス、DevOps に主な関心分野を持つビルダーです。仕事以外では、番組鑑賞、旅行、音楽を楽しんでいます。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/automate-the-process-to-change-image-backgrounds-using-amazon-bedrock-and-aws-step-functions/
- :持っている
- :は
- :not
- :どこ
- $UP
- 1
- 130
- 14
- 22
- 25
- 32
- 7
- 8
- a
- 私たちについて
- 受け入れる
- アクセス
- 越えて
- Action
- 付着します
- 養子縁組
- 成人
- 広告運用
- AI
- すべて
- 許す
- ことができます
- また
- Amazon
- Amazonの再認識
- Amazon Webサービス
- an
- および
- 別の
- API
- 申し込み
- 建築の
- 建築
- です
- AREA
- AS
- 関連する
- At
- 認証
- 自動化する
- 自動化
- 自動的に
- オートメーション
- AWS
- AWSステップ関数
- 背景
- 背景
- ベース
- ビルド
- ビルダー
- 建物
- バス
- ビジネス
- by
- 呼ばれます
- コール
- 缶
- 機能
- 変化する
- 変化
- 子
- 選択肢
- 市町村
- 組み合わせた
- 記入済みの
- 完了
- 包括的な
- コネクト
- 整合性のある
- からなる
- 構成
- 含まれています
- 基本
- 対応する
- 作ります
- クリエイティブ
- カスタム
- Customers
- データ
- より深い
- デフォルト
- 定義します
- 定義する
- デモ
- 展開します
- 展開する
- 設計
- 希望
- デスティネーション
- 詳細
- 詳細な
- 細部
- ダイアグラム
- 配布
- ダイビング
- 犬
- ドント
- ドライブ
- 動的に
- 各
- eコマース
- 効率良く
- 努力
- どちら
- 素子
- 要素は
- エンコード
- エンドポイント
- 強化
- 入力します
- エンターテインメント
- 熱狂者
- 全体
- 特に
- 例
- 既存の
- 詳細
- 説明
- ファッション
- File
- ファイナル
- フォロー中
- 形式でアーカイブしたプロジェクトを保存します.
- Foundation
- から
- フロントエンド
- function
- 機能
- さらに
- g1
- ゲートウェイ
- 生成する
- 生成された
- 生成
- 世代
- 生々しい
- 生成AI
- ジェネレータ
- ガイダンス
- 利用する
- he
- 高さ
- ことができます
- ハイ
- ハイライト
- history
- 認定条件
- しかしながら
- HTML
- HTTPS
- ID
- if
- 説明する
- 画像
- 画像
- 実装
- in
- include
- 含めて
- 内側の
- 内部
- 洞察力
- 説明書
- 統合する
- 統合された
- 統合する
- 統合
- 関心
- に
- 紹介します
- 呼び出す
- 関与
- IT
- ITS
- JPG
- JSON
- キープ
- キー
- ラベル
- 大
- より大きい
- LEARN
- レベル
- LIMIT
- 場所
- ロンドン
- 見て
- たくさん
- ロー
- 製
- make
- 男性
- man
- 手動で
- 地図
- マーキング
- mask
- メディア
- 方法
- モード
- 他には?
- の試合に
- 音楽を聴く際のスピーカーとして
- 名
- 必要
- 負
- 新作
- 通知
- 数
- of
- オファー
- 頻繁に
- on
- 最適化
- or
- 注文
- オリジナル
- その他
- 出力
- 外側
- 概要
- 自分の
- 並列シミュレーションの設定
- パラメーター
- パラメータ
- パートナー
- 実行する
- 人
- 写真
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プール
- ポスト
- 正確な
- プレミアム
- を防止
- プロセス
- 処理
- 生産性
- プロンプト
- 守る
- 提供します
- 提供
- は、大阪で
- 品質
- 参照する
- 関連した
- 削除します
- replace
- レポート
- 要求
- リクエスト
- 解像度
- リソース
- 応答
- 回答
- REST
- 結果
- リテンションを維持
- ラン
- runs
- サンプル
- スケーラビリティ
- ド電源のデ
- 規模
- シームレス
- 選択
- 送信
- 送る
- シニア
- 別
- サーバレス
- 仕える
- サービス
- すべき
- 示す
- 作品
- 簡単な拡張で
- 簡略化されました
- 簡素化する
- ソフトウェア
- 溶液
- ソリューション
- ソース
- 特定の
- 指定の
- start
- 開始
- 都道府県
- Status:
- 手順
- ステップ
- ストレージ利用料
- 簡単な
- 作戦
- 流線
- 文字列
- 強く
- 提出
- 続いて
- 首尾よく
- そのような
- サポート
- サポート
- テーブル
- 取る
- チーム
- 技術
- テクノロジー
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- それ
- ソース
- アプリ環境に合わせて
- それら
- その後
- ボーマン
- この
- それらの
- 三
- タイタン
- 〜へ
- 一緒に
- 追跡する
- 旅行
- 一般的に
- 無許可
- わかる
- 不要な
- アップデイト
- 更新しました
- 更新版
- アップロード
- 中古
- ユーザー
- users
- 使用されます
- 、
- 詳しく見る
- 欲しいです
- 見ている
- we
- ウェブ
- ウェブアプリケーション
- Webサービス
- この試験は
- かどうか
- which
- 幅
- 仕事
- ワークフロー
- ワークフロー
- 仕組み
- 作品
- 書きます
- You
- ゼファーネット