Los editores digitales buscan continuamente formas de optimizar y automatizar sus flujos de trabajo de medios para generar y publicar contenido nuevo lo más rápido posible.
Muchos editores tienen una gran biblioteca de imágenes de archivo que utilizan para sus artículos. Estas imágenes se pueden reutilizar muchas veces para diferentes historias, especialmente cuando el editor tiene imágenes de celebridades. Muy a menudo, un periodista puede necesitar recortar una celebridad deseada de una imagen para usarla en su próxima historia. Esta es una tarea manual y repetitiva que debe automatizarse. A veces, un autor puede querer usar una imagen de una celebridad, pero contiene dos personas y la celebridad principal debe recortarse de la imagen. Otras veces, es posible que sea necesario reformatear las imágenes de celebridades para publicarlas en una variedad de plataformas, como dispositivos móviles, redes sociales o noticias digitales. Además, es posible que un autor necesite cambiar la relación de aspecto de la imagen o poner a la celebridad en un enfoque nítido.
En esta publicación, demostramos cómo usar Reconocimiento de amazonas para realizar análisis de imágenes. Amazon Rekognition facilita agregar esta capacidad a sus aplicaciones sin ninguna experiencia en aprendizaje automático (ML) y viene con varias API para cumplir con casos de uso como detección de objetos, moderación de contenido, detección y análisis de rostros y reconocimiento de texto y celebridades, que nosotros utilizar en este ejemplo.
La función de reconocimiento de celebridades in Reconocimiento de amazonas reconoce automáticamente decenas de miles de personalidades conocidas en imágenes y videos usando ML. El reconocimiento de celebridades puede detectar no solo la presencia de la celebridad dada, sino también la ubicación dentro de la imagen.
Resumen de la solución
En esta publicación, demostramos cómo podemos pasar una foto, el nombre de una celebridad y una relación de aspecto para la imagen de salida para poder generar una imagen recortada de la celebridad dada capturando su rostro en el centro.
Cuando se trabaja con el API de detección de celebridades de Amazon Rekognition, se devuelven muchos elementos en la respuesta. Los siguientes son algunos elementos clave de la respuesta:
- Igualar la confianza – Una puntuación de confianza de coincidencia que se puede utilizar para controlar el comportamiento de la API. Recomendamos aplicar un umbral adecuado a esta puntuación en su aplicación para elegir su punto de operación preferido. Por ejemplo, al establecer un umbral del 99 %, puede eliminar los falsos positivos, pero puede perder algunas coincidencias potenciales.
- Nombre, ID y URL – El nombre de la celebridad, un ID único de Amazon Rekognition y una lista de URL, como el enlace IMDb o Wikipedia de la celebridad para obtener más información.
- Cuadro delimitador – Coordenadas de la ubicación del cuadro delimitador rectangular para cada cara de celebridad reconocida.
- Género conocido – Identidad de género conocida para cada celebridad reconocida.
- Emociones – Emoción expresada en el rostro de la celebridad, por ejemplo, feliz, triste o enojado.
- Pose – Pose de la cara de la celebridad, utilizando tres ejes de balanceo, cabeceo y guiñada.
- Smile – Si la celebridad está sonriendo o no.
Parte de la respuesta de la API de Amazon Rekognition incluye el siguiente código:
En este ejercicio, demostramos cómo usar el elemento de cuadro delimitador para identificar la ubicación de la cara, como se muestra en la siguiente imagen de ejemplo. Todas las dimensiones se representan como proporciones del tamaño total de la imagen, por lo que los números en la respuesta están entre 0 y 1. Por ejemplo, en la respuesta API de muestra, el ancho del cuadro delimitador es 0.1, lo que implica que el ancho de la cara es el 10 % del ancho total de la imagen.
Con este cuadro delimitador, ahora podemos usar la lógica para asegurarnos de que la cara permanezca dentro de los bordes de la nueva imagen que creamos. Podemos aplicar algo de relleno alrededor de este cuadro delimitador para mantener la cara en el centro.
En las siguientes secciones, mostramos cómo crear la siguiente salida de imagen recortada con Werner Vogels en un enfoque nítido.
Lanzamos un Amazon SageMaker notebook, que proporciona un entorno de Python donde puede ejecutar el código para pasar una imagen a Amazon Rekognition y luego modificar automáticamente la imagen con la celebridad enfocada.
El código realiza los siguientes pasos de alto nivel:
- Haga una solicitud a la
recognize_celebrities
API con la imagen dada y el nombre de la celebridad. - Filtre la respuesta para la información del cuadro delimitador.
- Agregue algo de relleno al cuadro delimitador para que capturemos parte del fondo.
Requisitos previos
Para este tutorial, debe tener los siguientes requisitos previos:
Sube la imagen de muestra
Cargue su imagen de celebridad de muestra en su depósito S3.
Ejecuta el código
Para ejecutar el código, usamos una computadora portátil SageMaker; sin embargo, cualquier IDE también funcionaría después de instalar Python, pillow y Boto3. Creamos un cuaderno SageMaker así como el Gestión de identidades y accesos de AWS (IAM) con los permisos necesarios. Complete los siguientes pasos:
- crear el cuaderno y nombrarlo
automatic-cropping-celebrity
.
La política de ejecución predeterminada, que se creó cuando se creó el cuaderno de SageMaker, tiene una política simple que otorga permisos al rol para interactuar con Amazon S3.
- Actualizar el
Resource
restricción con el nombre del depósito S3:
- Cree otra política para agregar a la función de IAM del cuaderno de SageMaker para poder llamar al reconocercelebridades API:
- En la consola de SageMaker, elija Instancias de cuaderno en el panel de navegación.
- Localice el
automatic-cropping-celebrity
cuaderno y elige Jupyter abierto. - Elige Nuevo y conda_python3 como el núcleo de su portátil.
Para los siguientes pasos, copie los bloques de código en su cuaderno Jupyter y ejecútelos eligiendo Ejecutar.
- Primero, importamos funciones auxiliares y bibliotecas:
- Establecer variables
- Crear un cliente de servicio
- Función para reconocer a los famosos
- Función para obtener el cuadro delimitador de la celebridad dada:
- Función para agregar algo de relleno al cuadro delimitador, para que capturemos algo de fondo alrededor de la cara
- Función para guardar la imagen en el almacenamiento del portátil y en Amazon S3
- Usa Python
main()
función para combinar las funciones anteriores para completar el flujo de trabajo de guardar una nueva imagen recortada de nuestra celebridad:
Cuando ejecuta este bloque de código, puede ver que encontramos a Werner Vogels y creamos una nueva imagen con su rostro en el centro.
La imagen se guardará en la computadora portátil y también se cargará en el depósito S3.
Podría incluir esta solución en un mayor flujo de trabajo; por ejemplo, una editorial puede querer publicar esta capacidad como punto final para reformatear y cambiar el tamaño de las imágenes sobre la marcha al publicar artículos de celebridades en múltiples plataformas.
Limpiar
Para evitar incurrir en cargos futuros, elimine los recursos:
- En la consola de SageMaker, seleccione su computadora portátil y en el Acciones menú, seleccione Detener.
- Después de detener el portátil, en el Acciones menú, seleccione Borrar.
- En la consola de IAM, elimine el rol de ejecución de SageMaker que creó.
- En la consola de Amazon S3, elimine la imagen de entrada y cualquier archivo de salida de su depósito S3.
Conclusión
En esta publicación, mostramos cómo podemos usar Amazon Rekognition para automatizar una tarea manual de modificar imágenes para admitir flujos de trabajo de medios. Esto es particularmente importante dentro de la industria editorial, donde la velocidad es importante para publicar contenido nuevo rápidamente y en múltiples plataformas.
Para obtener más información sobre cómo trabajar con recursos multimedia, consulte La inteligencia de medios ahora es más inteligente con Media2Cloud 3.0
Sobre la autora
Mark Watkins es Arquitecto de Soluciones dentro del equipo de Medios y Entretenimiento. Ayuda a los clientes a crear soluciones de inteligencia artificial/aprendizaje automático que resuelven sus desafíos comerciales con AWS. Ha estado trabajando en varios proyectos de IA/ML relacionados con la visión artificial, el procesamiento del lenguaje natural, la personalización, el ML en el perímetro y más. Lejos de la vida profesional, le encanta pasar tiempo con su familia y ver crecer a sus dos pequeños.
- Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
- Platoblockchain. Inteligencia del Metaverso Web3. Conocimiento amplificado. Accede Aquí.
- Fuente: https://aws.amazon.com/blogs/machine-learning/automatic-image-cropping-with-amazon-rekognition/
- :es
- $ UP
- 1
- 10
- 100
- 11
- 7
- 8
- 9
- a
- Poder
- Nuestra Empresa
- de la máquina
- la columna Acción
- Adicionalmente
- Después
- AI / ML
- Todos
- Amazon
- Reconocimiento de amazonas
- análisis
- y
- Otra
- abejas
- API
- Aplicación
- aplicaciones
- Aplicá
- La aplicación de
- somos
- en torno a
- AS
- aspecto
- Activos
- At
- autor
- automatizado
- Confirmación de Viaje
- Automático
- automáticamente
- AWS
- EJES
- fondo
- BE
- entre
- Bloquear
- Bloques
- Box
- cajas
- by
- llamar al
- PUEDEN
- capturar
- Capturando
- cases
- Celeb
- celebrities
- Celebrities
- Reubicación
- retos
- el cambio
- cargos
- Elige
- la elección de
- código
- combinar
- compañía
- completar
- computadora
- Visión por computador
- confianza
- Consola
- contiene
- contenido
- continuamente
- control
- podría
- Para crear
- creado
- Creamos
- cultivo
- Clientes
- Predeterminado
- demostrar
- deseado
- detectado
- Detección
- una experiencia diferente
- digital
- dimensiones
- Pantalla
- descargar
- e
- cada una
- Southern Implants
- efecto
- elementos
- elementos
- eliminarlos
- Punto final
- Entretenimiento
- Entorno
- especialmente
- ejemplo
- ejecución
- Haz ejercicio
- Experiencia
- expresados
- Cara
- caras
- familia
- famoso
- Archive
- archivos
- Focus
- siguiendo
- formato
- encontrado
- fresco
- Desde
- función
- funciones
- promover
- futuras
- Género
- generar
- obtener
- conseguir
- dado
- da
- Creciendo
- Ahorrar
- Tienen
- altura
- ayuda
- de alto nivel
- Cómo
- Como Hacer
- Sin embargo
- HTML
- http
- HTTPS
- ID
- Identifique
- Identidad
- imagen
- imágenes
- importar
- importante
- in
- incluir
- incluye
- energético
- información
- Las opciones de entrada
- instalando
- Intelligence
- interactuar
- IT
- periodista
- jpg
- Guardar
- Clave
- conocido
- idioma
- large
- lanzamiento
- aprendizaje
- bibliotecas
- Biblioteca
- Vida
- como
- LINK
- Lista
- pequeño
- local
- Ubicación
- mirando
- máquina
- máquina de aprendizaje
- para lograr
- HACE
- manual
- muchos
- Match
- Cuestiones
- Medios
- Menú
- podría
- ML
- Móvil
- moderación
- modificar
- más,
- múltiples
- nombre
- Natural
- Procesamiento natural del lenguaje
- Navegación
- ¿ Necesita ayuda
- Nuevo
- noticias
- cuaderno
- números
- objeto
- Detección de objetos
- of
- on
- funcionamiento
- solicite
- Otro
- de otra manera
- salida
- total
- cristal
- particularmente
- camino
- Personas
- Realizar
- realiza
- permisos
- Personalidades
- personalización
- Paso
- Plataformas
- Platón
- Inteligencia de datos de Platón
- PlatónDatos
- punto
- política
- Publicación
- posible
- preferido
- requisitos previos
- presencia
- primario
- tratamiento
- Profesional
- proyecta
- proporciona un
- publicar
- editor
- editores
- DTP
- poner
- Python
- con rapidez
- aumento
- rápidamente
- proporción
- reconocimiento
- reconocer
- reconocido
- reconoce
- recomiendan
- relacionado
- permanece
- repetitivo
- representado
- solicita
- Requisitos
- Recurso
- Recursos
- respuesta
- resultado
- Resultados
- volvemos
- ROI
- Función
- Rodar
- Ejecutar
- sabio
- Guardar
- ahorro
- Puntuación
- (secciones)
- de coches
- pólipo
- Varios
- tienes
- Mostrar
- mostrado
- sencillos
- Tamaño
- más inteligente
- So
- Social
- redes sociales
- a medida
- Soluciones
- RESOLVER
- algo
- velocidad
- Gastos
- cuadrado
- Posicionamiento
- pasos
- en stock
- detenido
- STORAGE
- Historias
- Historia
- aerodinamizar
- tal
- adecuado
- SOPORTE
- Tarea
- equipo
- esa
- La
- su
- Les
- Estas
- miles
- Tres
- umbral
- equipo
- veces
- a
- parte superior
- Total
- único
- próximos
- subido
- utilizan el
- variedad
- diversos
- versión
- Videos
- visión
- tutorial
- ver
- formas
- WELL
- bien conocido
- sean
- que
- anchura
- Wikipedia
- seguirá
- dentro de
- sin
- Actividades:
- flujos de trabajo
- trabajando
- se
- Usted
- tú
- zephyrnet