デジタル パブリッシャーは、可能な限り迅速に新しいコンテンツを生成して公開するために、メディア ワークフローを合理化および自動化する方法を常に模索しています。
多くの出版社は、記事に使用するストック画像の大規模なライブラリを持っています。 これらの画像は、特に出版社が有名人の画像を持っている場合、さまざまなストーリーで何度も再利用できます。 多くの場合、ジャーナリストは、次の記事で使用する画像から目的の有名人を切り取る必要があります。 これは、自動化する必要がある手動の反復タスクです。 作成者が有名人の画像を使用したい場合がありますが、その画像には XNUMX 人の人物が含まれており、主要な有名人を画像から切り取る必要があります。 また、モバイル、ソーシャル メディア、デジタル ニュースなどのさまざまなプラットフォームに公開するために、有名人の画像を再フォーマットする必要がある場合もあります。 さらに、作成者は、画像の縦横比を変更したり、有名人に鮮明な焦点を合わせたりする必要がある場合があります。
この投稿では、使用方法を示します Amazonの再認識 画像解析を行います。 Amazon Rekognition を使用すると、機械学習 (ML) の専門知識がなくても、この機能をアプリケーションに簡単に追加できます。また、オブジェクト検出、コンテンツ モデレート、顔検出と分析、テキストと有名人の認識などのユース ケースを満たすさまざまな API が付属しています。この例で使用します。
有名人認識機能 in Amazonの再認識 ML を使用して、画像や動画に含まれる何万人もの著名人を自動的に認識します。 有名人認識は、特定の有名人の存在だけでなく、画像内の位置も検出できます。
ソリューションの概要
この投稿では、写真、有名人の名前、および出力画像の縦横比を渡す方法を示して、特定の有名人の顔を中央に捉えたトリミングされた画像を生成できるようにします。
また、 Amazon Rekognition 有名人検出 API、多くの要素が応答で返されます。 以下は、主要な応答要素の一部です。
- マッチコンフィデンス – API の動作を制御するために使用できる一致信頼度スコア。 アプリケーションでこのスコアに適切なしきい値を適用して、優先する操作点を選択することをお勧めします。 たとえば、しきい値を 99% に設定すると、誤検知を排除できますが、潜在的な一致を見逃す可能性があります。
- 名前、ID、および URL – 有名人の名前、一意の Amazon Rekognition ID、および有名人の IMDb や Wikipedia リンクなどの URL のリストで、詳細情報を入手できます。
- バウンディングボックス – 認識された各有名人の顔の長方形の境界ボックスの位置の座標。
- 既知の性別 – 認識された各有名人の既知の性同一性。
- 感情 – 有名人の顔に表れる感情。たとえば、嬉しい、悲しい、怒っているなど。
- ポーズ – ロール、ピッチ、ヨーの XNUMX つの軸を使用した有名人の顔のポーズ。
- 笑顔 – 有名人が笑っているかどうか。
Amazon Rekognition からの API レスポンスの一部には、次のコードが含まれています。
この演習では、次のサンプル画像に示すように、境界ボックス要素を使用して顔の位置を特定する方法を示します。 すべての寸法は画像全体のサイズの比率として表されるため、応答の数値は 0 ~ 1 になります。 たとえば、API 応答のサンプルでは、バウンディング ボックスの幅は 0.1 です。これは、顔の幅が画像の全幅の 10% であることを意味します。
このバウンディング ボックスを使用すると、ロジックを使用して、作成する新しい画像のエッジ内に顔が残るようにすることができます。 この境界ボックスの周りにパディングを適用して、顔を中央に保つことができます。
次のセクションでは、Werner Vogels が鮮明にフォーカスされた次のトリミングされた画像出力を作成する方法を示します。
私たちは アマゾンセージメーカー このノートブックは、コードを実行して画像を Amazon Rekognition に渡し、有名人に焦点を合わせて画像を自動的に変更できる Python 環境を提供します。
このコードは、次の大まかな手順を実行します。
- に依頼する
recognize_celebrities
指定された画像と有名人の名前を持つ API。 - 境界ボックス情報の応答をフィルター処理します。
- 背景の一部をキャプチャできるように、バウンディング ボックスにパディングを追加します。
前提条件
このチュートリアルでは、次の前提条件を満たしている必要があります。
サンプル画像をアップロード
サンプルの有名人の画像を S3 バケットにアップロードします。
コードを実行する
コードを実行するには、SageMaker ノートブックを使用しますが、Python、pillow、および Boto3 をインストールした後は、任意の IDE も機能します。 SageMaker ノートブックと AWS IDおよびアクセス管理 必要な権限を持つ (IAM) ロール。 次の手順を完了します。
- ノートブックを作成する 名前をつけて
automatic-cropping-celebrity
.
SageMaker ノートブックの作成時に作成されたデフォルトの実行ポリシーには、Amazon S3 と対話するためのアクセス許可をロールに付与する単純なポリシーがあります。
- 更新する
Resource
S3 バケット名による制約:
- SageMaker ノートブック IAM ロールに追加する別のポリシーを作成して、 認識有名人 API:
- SageMakerコンソールで、 ノートブックインスタンス ナビゲーションペインに表示されます。
- 動画内で
automatic-cropping-celebrity
ノートと選択 Jupyterを開く. - 選択する 新作 および conda_python3 ノートブックのカーネルとして。
次の手順では、コード ブロックを Jupyter ノートブックにコピーし、選択して実行します。 ラン.
- まず、ヘルパー関数とライブラリをインポートします。
- 変数の設定
- サービス クライアントを作成する
- 有名人を認識する機能
- 指定された有名人の境界ボックスを取得する関数:
- バウンディング ボックスにパディングを追加する関数で、顔の周りの背景をキャプチャします。
- イメージをノートブック ストレージと Amazon S3 に保存する機能
- Pythonを使用する
main()
関数を使用して、前述の関数を組み合わせて、有名人の新しいトリミングされた画像を保存するワークフローを完了します。
このコード ブロックを実行すると、Werner Vogels が見つかり、顔が中央にある新しい画像が作成されたことがわかります。
画像はノートブックに保存され、S3 バケットにもアップロードされます。
このソリューションを より大きなワークフロー; たとえば、出版社は、有名人の記事を複数のプラットフォームに公開するときに、この機能をエンドポイントとして公開して、画像をその場で再フォーマットおよびサイズ変更することができます。
清掃
今後の請求を回避するには、次のリソースを削除してください。
- SageMaker コンソールでノートブックを選択し、 メニュー、選択 Force Stop.
- ノートブックが停止した後、 メニュー、選択 削除.
- IAM コンソールで、作成した SageMaker 実行ロールを削除します。
- Amazon S3 コンソールで、入力イメージと出力ファイルを S3 バケットから削除します。
まとめ
この投稿では、Amazon Rekognition を使用して、メディア ワークフローをサポートするために画像を変更するという手動のタスクを自動化する方法を示しました。 これは、新鮮なコンテンツを迅速に複数のプラットフォームに公開するスピードが重要な出版業界では特に重要です。
メディア アセットの操作の詳細については、次を参照してください。 Media2Cloud 3.0 でメディア インテリジェンスがさらにスマートに
著者について
マークワトキンス メディア アンド エンターテイメント チームのソリューション アーキテクトです。 彼は、AWS を使用してビジネス上の課題を解決する AI/ML ソリューションを作成する顧客を支援しています。 彼は、コンピューター ビジョン、自然言語処理、パーソナライゼーション、エッジでの ML などに関連するいくつかの AI/ML プロジェクトに取り組んできました。 職業生活から離れて、彼は家族と時間を過ごし、XNUMX 人の小さな子供の成長を見守るのが大好きです。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/automatic-image-cropping-with-amazon-rekognition/
- :は
- $UP
- 1
- 10
- 100
- 11
- 7
- 8
- 9
- a
- できる
- 私たちについて
- アクセス
- Action
- さらに
- 後
- AI / ML
- すべて
- Amazon
- Amazonの再認識
- 分析
- および
- 別の
- API
- API
- 申し込み
- 申し込む
- 適用
- です
- 周りに
- 物品
- AS
- 側面
- 資産
- At
- 著者
- 自動化する
- 自動化
- オートマチック
- 自動的に
- AWS
- 軸
- 背景
- BE
- の間に
- ブロック
- ブロック
- ボックス
- ボックス
- ビジネス
- by
- コール
- 缶
- キャプチャー
- キャプチャ
- 例
- 有名人
- 有名人
- セレブリティ
- センター
- 課題
- 変化する
- 課金
- 選択する
- 選択する
- コード
- 組み合わせる
- 会社
- コンプリート
- コンピュータ
- Computer Vision
- 信頼
- 領事
- 含まれています
- コンテンツ
- 連続的に
- コントロール
- 可能性
- 作ります
- 作成した
- 作成
- 作物
- Customers
- デフォルト
- 実証します
- 希望
- 検出された
- 検出
- 異なります
- デジタル
- 大きさ
- ディスプレイ
- ダウンロード
- e
- 各
- エッジ(Edge)
- 効果
- 素子
- 要素は
- 排除する
- エンドポイント
- エンターテインメント
- 環境
- 特に
- 例
- 実行
- 運動
- 専門知識
- 表現
- 顔
- 顔
- 家族
- 有名な
- File
- フォーカス
- フォロー中
- 形式でアーカイブしたプロジェクトを保存します.
- 発見
- 新鮮な
- から
- function
- 機能
- さらに
- 未来
- 性別
- 生成する
- 取得する
- 受け
- 与えられた
- 与える
- 成長
- ハッピー
- 持ってる
- 高さ
- ことができます
- ハイレベル
- 認定条件
- How To
- しかしながら
- HTML
- HTTP
- HTTPS
- ID
- 識別する
- アイデンティティ
- 画像
- 画像
- import
- 重要
- in
- include
- 含ま
- 産業を変えます
- 情報
- インストールする
- インテリジェンス
- 対話
- IT
- ジャーナリスト
- JPG
- キープ
- キー
- 既知の
- 言語
- 大
- 起動する
- 学習
- ライブラリ
- 図書館
- 生活
- ような
- LINK
- リスト
- 少し
- ローカル
- 場所
- 探して
- 機械
- 機械学習
- make
- 作る
- マニュアル
- 多くの
- 一致
- 事態
- メディア
- メニュー
- かもしれない
- ML
- モバイル
- 節度
- 修正する
- 他には?
- の試合に
- 名
- ナチュラル
- 自然言語処理
- ナビゲーション
- 必要
- ニーズ
- 新作
- ニュース
- ノート
- 番号
- オブジェクト
- オブジェクト検出
- of
- on
- オペレーティング
- 注文
- その他
- さもないと
- 出力
- 全体
- ペイン
- 特に
- path
- のワークプ
- 実行する
- 実行する
- パーミッション
- パーソナリティ
- 個人化
- ピッチ
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポイント
- 方針
- ポスト
- 潜在的な
- 優先
- 前提条件
- プレゼンス
- 主要な
- 処理
- プロ
- プロジェクト(実績作品)
- は、大阪で
- パブリッシュ
- 出版社
- 出版社
- 出版
- 置きます
- Python
- すぐに
- 上げる
- 急速に
- 比
- 認識
- 認識する
- 認識
- 認識
- 推奨する
- 関連する
- 残っている
- 反復的な
- で表さ
- 要求
- の提出が必要です
- リソースを追加する。
- リソース
- 応答
- 結果
- 結果
- return
- ROI
- 職種
- ロール
- ラン
- セージメーカー
- Save
- 節約
- スコア
- セクション
- サービス
- 設定
- いくつかの
- すべき
- 表示する
- 示す
- 簡単な拡張で
- サイズ
- 賢い
- So
- 社会
- ソーシャルメディア
- 溶液
- ソリューション
- 解決する
- 一部
- スピード
- 支出
- 広場
- ステートメント
- ステップ
- 株式
- 停止
- ストレージ利用料
- ストーリー
- ストーリー
- 流線
- そのような
- 適当
- サポート
- 仕事
- チーム
- それ
- アプリ環境に合わせて
- それら
- ボーマン
- 数千
- 三
- しきい値
- 時間
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- top
- トータル
- ユニーク
- 今後の
- アップロード
- つかいます
- 多様
- さまざまな
- バージョン
- 動画
- ビジョン
- ウォークスルー
- 見ている
- 方法
- WELL
- 周知
- かどうか
- which
- 幅
- Wikipedia
- 意志
- 以内
- 無し
- 仕事
- ワークフロー
- ワーキング
- でしょう
- You
- あなたの
- ゼファーネット