Цифровые издатели постоянно ищут способы оптимизировать и автоматизировать свои рабочие процессы с мультимедиа, чтобы создавать и публиковать новый контент как можно быстрее.
У многих издателей есть большая библиотека стоковых изображений, которые они используют для своих статей. Эти изображения можно многократно использовать в разных историях, особенно если у издателя есть изображения знаменитостей. Довольно часто журналисту может понадобиться вырезать желаемую знаменитость из изображения, чтобы использовать его в своем предстоящем материале. Это ручная повторяющаяся задача, которую следует автоматизировать. Иногда автор может захотеть использовать изображение знаменитости, но оно содержит двух человек, а основную знаменитость необходимо вырезать из изображения. В других случаях может потребоваться переформатирование изображений знаменитостей для публикации на различных платформах, таких как мобильные устройства, социальные сети или цифровые новости. Кроме того, автору может потребоваться изменить соотношение сторон изображения или сделать знаменитость более четкой.
В этом посте мы покажем, как использовать Апостол выполнять анализ изображения. Amazon Rekognition упрощает добавление этой возможности в ваши приложения без каких-либо знаний в области машинного обучения (ML) и поставляется с различными API-интерфейсами для выполнения таких сценариев использования, как обнаружение объектов, модерация контента, обнаружение и анализ лиц, а также распознавание текста и знаменитостей, которые мы использовать в этом примере.
Ассоциация функция распознавания знаменитостей in Апостол автоматически распознает десятки тысяч известных личностей на изображениях и видео с помощью машинного обучения. Распознавание знаменитостей может обнаруживать не только присутствие данной знаменитости, но и местоположение на изображении.
Обзор решения
В этом посте мы покажем, как мы можем передать фотографию, имя знаменитости и соотношение сторон для выходного изображения, чтобы иметь возможность создать обрезанное изображение данной знаменитости, запечатлевшее ее лицо в центре.
При работе с API обнаружения знаменитостей Amazon Rekognition, в ответе возвращается много элементов. Ниже приведены некоторые ключевые элементы ответа:
- Уверенность в совпадении – Оценка достоверности соответствия, которую можно использовать для управления поведением API. Мы рекомендуем применить подходящий порог к этой оценке в вашем приложении, чтобы выбрать предпочтительную рабочую точку. Например, установив пороговое значение 99%, вы можете исключить ложные срабатывания, но можете пропустить некоторые потенциальные совпадения.
- Имя, идентификатор и URL-адреса – Имя знаменитости, уникальный идентификатор Amazon Rekognition и список URL-адресов, таких как IMDb знаменитости или ссылка на Википедию для получения дополнительной информации.
- Ограничительная рамка – Координаты расположения прямоугольной ограничивающей рамки для каждого распознанного лица знаменитости.
- ИзвестныйПол - Известная гендерная идентичность для каждой признанной знаменитости.
- Эмоции – Эмоция, выраженная на лице знаменитости, например, счастливая, грустная или злая.
- поза - Поза лица знаменитости с использованием трех осей крена, тангажа и рыскания.
- Улыбка – Улыбается ли знаменитость или нет.
Часть ответа API от Amazon Rekognition включает следующий код:
В этом упражнении мы покажем, как использовать элемент ограничительной рамки для определения местоположения лица, как показано на следующем примере изображения. Все размеры представлены как отношения к общему размеру изображения, поэтому числа в ответе находятся в диапазоне от 0 до 1. Например, в примере ответа API ширина ограничивающей рамки равна 0.1, что означает, что ширина лица составляет 10 % от общей ширины изображения.
С помощью этой ограничивающей рамки мы теперь можем использовать логику, чтобы убедиться, что лицо остается в пределах краев нового изображения, которое мы создаем. Мы можем применить некоторые отступы вокруг этой ограничивающей рамки, чтобы сохранить лицо в центре.
В следующих разделах мы покажем, как создать следующее обрезанное изображение с четким фокусом Вернера Фогельса.
Мы запускаем Создатель мудреца Амазонки Блокнот, предоставляющий среду Python, в которой можно запустить код для передачи изображения в Amazon Rekognition, а затем автоматически изменить изображение, сосредоточив внимание на знаменитости.
Код выполняет следующие высокоуровневые шаги:
- Сделать запрос в
recognize_celebrities
API с заданным изображением и именем знаменитости. - Отфильтруйте ответ для информации о ограничивающей рамке.
- Добавьте немного отступа к ограничительной рамке, чтобы захватить часть фона.
Предпосылки
Для этого прохождения у вас должны быть следующие предпосылки:
Загрузите образец изображения
Загрузите образец изображения знаменитости в корзину S3.
Запустите код
Для запуска кода мы используем блокнот SageMaker, однако любая IDE также будет работать после установки Python, подушки и Boto3. Мы создаем блокнот SageMaker, а также Управление идентификацией и доступом AWS (IAM) с необходимыми разрешениями. Выполните следующие шаги:
- Создать блокнот и назовите файл
automatic-cropping-celebrity
.
Политика выполнения по умолчанию, которая была создана при создании блокнота SageMaker, имеет простую политику, которая дает роли разрешения на взаимодействие с Amazon S3.
- Обновите
Resource
ограничение с именем корзины S3:
- Создайте еще одну политику для добавления к роли IAM записной книжки SageMaker, чтобы иметь возможность вызывать ПризнатьЗнаменитости API:
- На консоли SageMaker выберите Экземпляры ноутбуков в навигационной панели.
- Найдите
automatic-cropping-celebrity
блокнот и выбери Открытый Юпитер. - Выберите Новые и conda_python3 как ядро для вашего ноутбука.
Для следующих шагов скопируйте блоки кода в блокнот Jupyter и запустите их, выбрав Run.
- Во-первых, мы импортируем вспомогательные функции и библиотеки:
- Установить переменные
- Создать сервисный клиент
- Функция распознавания знаменитостей
- Функция для получения ограничивающей рамки данной знаменитости:
- Функция для добавления отступов к ограничительной рамке, чтобы мы захватили фон вокруг лица.
- Функция сохранения изображения в хранилище ноутбука и на Amazon S3
- Используйте Python
main()
Функция для объединения предыдущих функций для завершения рабочего процесса сохранения нового обрезанного изображения нашей знаменитости:
Когда вы запустите этот блок кода, вы увидите, что мы нашли Вернера Фогельса и создали новое изображение с его лицом в центре.
Изображение будет сохранено в записной книжке, а также загружено в корзину S3.
Вы можете включить это решение в больший рабочий процесс; например, издательская компания может захотеть опубликовать эту возможность в качестве конечной точки для переформатирования и изменения размера изображений на лету при публикации статей о знаменитостях на нескольких платформах.
Убираться
Чтобы избежать дополнительных расходов, удалите ресурсы:
- В консоли SageMaker выберите свою записную книжку и на Действия Меню, выберите Stop.
- После остановки ноутбука на Действия Меню, выберите Удалить.
- В консоли IAM удалите созданную роль выполнения SageMaker.
- На консоли Amazon S3 удалите входное изображение и все выходные файлы из корзины S3.
Заключение
В этом посте мы показали, как можно использовать Amazon Rekognition для автоматизации выполняемой вручную задачи изменения изображений для поддержки рабочих процессов мультимедиа. Это особенно важно в издательской индустрии, где скорость имеет значение для быстрого выпуска свежего контента на несколько платформ.
Дополнительные сведения о работе с мультимедийными ресурсами см. Медиа-аналитика стала еще умнее с Media2Cloud 3.0
Об авторе
Марк Уоткинс является архитектором решений в команде СМИ и развлечений. Он помогает клиентам создавать решения AI/ML, которые решают их бизнес-задачи с помощью AWS. Он работал над несколькими проектами AI/ML, связанными с компьютерным зрением, обработкой естественного языка, персонализацией, ML на периферии и многим другим. Вдали от профессиональной жизни он любит проводить время со своей семьей и наблюдать за тем, как растут двое его малышей.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/automatic-image-cropping-with-amazon-rekognition/
- :является
- $UP
- 1
- 10
- 100
- 11
- 7
- 8
- 9
- a
- в состоянии
- О нас
- доступ
- Действие
- Дополнительно
- После
- AI / ML
- Все
- Amazon
- Апостол
- анализ
- и
- Другой
- API
- API
- Применение
- Приложения
- Применить
- Применение
- МЫ
- около
- статьи
- AS
- внешний вид
- Активы
- At
- автор
- автоматизировать
- Автоматизированный
- Автоматический
- автоматически
- AWS
- ОСИ
- фон
- BE
- между
- Заблокировать
- Блоки
- Коробка
- коробки
- бизнес
- by
- призывают
- CAN
- захватить
- Захват
- случаев
- Знаменитости
- знаменитости
- Знаменитость
- Центр
- проблемы
- изменение
- расходы
- Выберите
- Выбирая
- код
- объединять
- Компания
- полный
- компьютер
- Компьютерное зрение
- доверие
- Консоли
- содержит
- содержание
- непрерывно
- контроль
- может
- Создайте
- создали
- Создающий
- урожай
- Клиенты
- По умолчанию
- демонстрировать
- желанный
- обнаруженный
- обнаружение
- различный
- Интернет
- размеры
- Дисплей
- скачать
- e
- каждый
- Edge
- эффект
- элемент
- элементы
- ликвидировать
- Конечная точка
- Развлечения
- Окружающая среда
- особенно
- пример
- выполнение
- Упражнение
- опыта
- выраженный
- Face
- лица
- семья
- знаменитый
- Файл
- Файлы
- Фокус
- после
- Что касается
- формат
- найденный
- свежий
- от
- функция
- Функции
- далее
- будущее
- пол
- порождать
- получить
- получающий
- данный
- дает
- Рост
- счастливый
- Есть
- высота
- помогает
- на высшем уровне
- Как
- How To
- Однако
- HTML
- HTTP
- HTTPS
- ID
- определения
- Личность
- изображение
- изображений
- Импортировать
- важную
- in
- включают
- включает в себя
- промышленность
- информация
- вход
- Установка
- Интеллекта
- взаимодействовать
- IT
- журналист
- JPG
- Сохранить
- Основные
- известный
- язык
- большой
- запуск
- изучение
- библиотеки
- Библиотека
- ЖИЗНЬЮ
- такое как
- LINK
- Список
- мало
- локальным
- расположение
- искать
- машина
- обучение с помощью машины
- сделать
- ДЕЛАЕТ
- руководство
- многих
- Совпадение
- Вопросы
- Медиа
- Меню
- может быть
- ML
- Мобильный телефон
- умеренность
- изменять
- БОЛЕЕ
- с разными
- имя
- натуральный
- Обработка естественного языка
- Навигация
- Необходимость
- потребности
- Новые
- Новости
- ноутбук
- номера
- объект
- Обнаружение объекта
- of
- on
- операционный
- заказ
- Другое
- в противном случае
- выходной
- общий
- хлеб
- особенно
- путь
- Люди
- Выполнять
- выполняет
- Разрешения
- Личности
- воплощение
- Pitch
- Платформы
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Точка
- политика
- После
- потенциал
- привилегированный
- предпосылки
- присутствие
- первичный
- обработка
- профессиональный
- проектов
- приводит
- публиковать
- издатель
- Издатели
- Издательство
- положил
- Питон
- быстро
- повышение
- быстро
- соотношение
- признание
- признавать
- признанный
- признает
- рекомендовать
- Связанный
- остатки
- повторяющийся
- представленный
- запросить
- обязательный
- ресурс
- Полезные ресурсы
- ответ
- результат
- Итоги
- возвращают
- ROI
- Роли
- Катить
- Run
- sagemaker
- Сохранить
- экономия
- Гол
- разделах
- обслуживание
- установка
- несколько
- должен
- показывать
- показанный
- просто
- Размер
- умнее
- So
- Соцсети
- социальные сети
- Решение
- Решения
- РЕШАТЬ
- некоторые
- скорость
- Расходы
- площадь
- заявление
- Шаги
- акции
- остановившийся
- диск
- Истории
- История
- упорядочить
- такие
- подходящее
- поддержка
- Сложность задачи
- команда
- который
- Ассоциация
- их
- Их
- Эти
- тысячи
- три
- порог
- время
- раз
- в
- топ
- Всего
- созданного
- Предстоящие
- загружено
- использование
- разнообразие
- различный
- версия
- Видео
- видение
- прохождение
- наблюдение
- способы
- ЧТО Ж
- известный
- будь то
- , которые
- ширина
- Википедия.
- будете
- в
- без
- Работа
- Рабочие процессы
- работает
- бы
- Ты
- ВАШЕ
- зефирнет