Procesamiento de imágenes por lotes con etiquetas personalizadas de Amazon Rekognition

Reeditado por Platón

seguidores: 0

Reconocimiento de amazonas es un servicio de visión por computadora que facilita la adición de análisis de imágenes y video a sus aplicaciones utilizando tecnología probada, altamente escalable y de aprendizaje profundo que no requiere experiencia en aprendizaje automático (ML) para su uso. Con Amazon Rekognition, puede identificar objetos, personas, texto, escenas y actividades en imágenes y videos, así como detectar cualquier contenido inapropiado. Amazon Rekognition también proporciona capacidades de búsqueda y análisis facial de alta precisión que puede utilizar para detectar, analizar y comparar rostros para una amplia variedad de casos de uso.

Etiquetas personalizadas de Amazon Rekognition le permite identificar los objetos y escenas en imágenes que son específicas para sus necesidades comerciales. Por ejemplo, puede encontrar su logotipo en publicaciones de redes sociales, identificar sus productos en los estantes de las tiendas, clasificar las piezas de la máquina en una línea de ensamblaje, distinguir plantas sanas e infectadas, y más. La publicación del blog Construyendo su propia detección de marca muestra cómo utilizar las etiquetas personalizadas de Amazon Rekognition para crear una solución integral para detectar logotipos de marcas en imágenes y videos.

Las etiquetas personalizadas de Amazon Rekognition brindan una experiencia simple de un extremo a otro en la que comienza etiquetando un conjunto de datos, y las etiquetas personalizadas de Amazon Rekognition crean un modelo de aprendizaje automático personalizado para usted al inspeccionar los datos y seleccionar el algoritmo de aprendizaje automático adecuado. Una vez que haya entrenado su modelo, puede comenzar a usarlo inmediatamente para el análisis de imágenes. Si desea procesar imágenes en lotes (por ejemplo, una vez al día o a la semana, o en horarios programados durante el día), puede aprovisionar su modelo personalizado en horarios programados.

En esta publicación, mostramos cómo puede crear una solución por lotes rentable con las etiquetas personalizadas de Amazon Rekognition que aprovisiona su modelo personalizado en horarios programados, procesa todas sus imágenes y desaprovisiona sus recursos para evitar incurrir en costos adicionales.

Resumen de la solución

El siguiente diagrama de arquitectura muestra cómo puede diseñar un flujo de trabajo rentable y altamente escalable para procesar imágenes en lotes con las etiquetas personalizadas de Amazon Rekognition. Aprovecha los servicios de AWS como Puente de eventos de Amazon, Funciones de paso de AWS, Servicio de cola simple de Amazon (Amazon SQS), AWS Lambday Servicio de almacenamiento simple de Amazon (Amazon S3).

Esta solución utiliza una arquitectura sin servidor y servicios administrados, por lo que puede escalar bajo demanda y no requiere aprovisionamiento ni administración de servidores. La cola de Amazon SQS aumenta la tolerancia a fallas general de la solución al desacoplar la ingesta de imágenes del procesamiento de imágenes y permitir la entrega confiable de mensajes para cada imagen ingerida. Step Functions facilita la creación de flujos de trabajo visuales para orquestar una serie de tareas individuales, como verificar si una imagen está disponible para procesar y administrar el ciclo de vida del estado del proyecto de etiquetas personalizadas de Amazon Rekognition. Aunque la siguiente arquitectura muestra cómo puede crear una solución de procesamiento por lotes para etiquetas personalizadas de Amazon Rekognition con AWS Lambda, puede crear una arquitectura similar utilizando servicios como AWS Fargate.

Procesamiento de imágenes por lotes con etiquetas personalizadas de Amazon Rekognition PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Los siguientes pasos describen el flujo de trabajo general:

Cuando una imagen se almacena en un bucket de Amazon S3, activa un mensaje que se almacena en una cola de Amazon SQS.
Amazon EventBridge está configurado para activar un flujo de trabajo de AWS Step Functions con una frecuencia determinada (1 hora de forma predeterminada).
A medida que se ejecuta el flujo de trabajo, realiza las siguientes acciones:
1. Comprueba la cantidad de elementos en la cola de Amazon SQS. Si no hay elementos para procesar en la cola, el flujo de trabajo finaliza.
2. Si hay elementos para procesar en la cola, el flujo de trabajo inicia el modelo de etiquetas personalizadas de Amazon Rekognition.
3. El flujo de trabajo permite la integración de Amazon SQS con una función de AWS Lambda para procesar esas imágenes.
A medida que se habilita la integración entre la cola de Amazon SQS y AWS Lambda, se producen los siguientes eventos:
1. AWS Lambda comienza a procesar mensajes con los detalles de la imagen de Amazon SQS.
2. La función AWS Lambda utiliza el proyecto de etiquetas personalizadas de Amazon Rekognition para procesar las imágenes.
3. Luego, la función AWS Lambda coloca el archivo JSON que contiene las etiquetas inferenciadas en el depósito final. La imagen también se mueve del depósito de origen al depósito final.
Cuando se procesan todas las imágenes, el flujo de trabajo de AWS Step Functions hace lo siguiente:
1. Detiene el modelo de etiquetas personalizadas de Amazon Rekognition.
2. Deshabilita la integración entre la cola de Amazon SQS y la función AWS Lambda al deshabilitar el disparador.

El siguiente diagrama ilustra la máquina de estado de AWS Step Functions para esta solución.

Procesamiento de imágenes por lotes con etiquetas personalizadas de Amazon Rekognition PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Requisitos previos

Para implementar esta solución, necesita los siguientes requisitos previos:

Una cuenta de AWS con permiso para implementar la solución utilizando Formación en la nube de AWS, que crea Gestión de identidades y accesos de AWS (IAM) roles y otros recursos.
El nombre de recurso de Amazon (ARN) del proyecto de etiquetas personalizadas de Amazon Rekognition (denominado ProyectoArn) y el nombre de recurso de Amazon (ARN) de la versión del modelo que se creó después de entrenar el modelo (referenciado como ProyectoVersiónArn). Estos valores son necesarios para comprobar el estado del modelo y también para analizar imágenes utilizando el modelo.

Para aprender a entrenar un modelo, consulte Introducción a las etiquetas personalizadas de Amazon Rekognition.

Despliegue

Para implementar la solución con AWS CloudFormation en su cuenta de AWS, siga los pasos de la Repositorio GitHub. Crea los siguientes recursos:

Cubo Amazon S3
Cola de Amazon SQS
Flujo de trabajo de AWS Step Functions
Reglas de Amazon EventBridge para activar el flujo de trabajo
IAM roles
Funciones de AWS Lambda

Puede ver los nombres de los diferentes recursos creados por la solución en la sección de salida de la Pila de CloudFormation.

Probar el flujo de trabajo

Para probar su flujo de trabajo, complete los siguientes pasos:

Suba imágenes de muestra al depósito S3 de entrada que creó la solución (por ejemplo, xxxx-sources3bucket-xxxx).
En la consola Step Functions, elija la máquina de estado creada por la solución (por ejemplo, CustomCVStateMachine-xxxx).

Debería ver que la máquina de estado se activa por la regla de Amazon EventBridge cada hora.

Puede iniciar manualmente el flujo de trabajo eligiendo Iniciar ejecución.
A medida que se procesan las imágenes, puede ir al depósito S3 de salida (por ejemplo, xxxx-finals3bucket-xxxx) para ver la salida JSON de cada imagen.

La siguiente captura de pantalla muestra el contenido del bucket de S3 final con las imágenes, junto con su salida JSON correspondiente de las etiquetas personalizadas de Amazon Rekognition.

Procesamiento de imágenes por lotes con etiquetas personalizadas de Amazon Rekognition PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Conclusión

En esta publicación, mostramos cómo puede crear una solución por lotes rentable con las etiquetas personalizadas de Amazon Rekognition que pueden aprovisionar su modelo personalizado en momentos programados, procesar todas sus imágenes y desaprovisionar sus recursos para evitar incurrir en costos adicionales. Dependiendo de su caso de uso, puede ajustar fácilmente la ventana de tiempo programada en la que la solución debe procesar el lote. Para obtener más información sobre cómo crear, entrenar, evaluar y usar un modelo que detecta objetos, escenas y conceptos en imágenes, consulte Introducción a las etiquetas personalizadas de Amazon Rekognition.

Si bien la solución descrita en esta publicación mostró cómo puede procesar imágenes por lotes con etiquetas personalizadas de Amazon Rekognition, puede ajustar fácilmente la solución para procesar imágenes por lotes con Amazon Lookout para la visión para la detección de defectos y anomalías. Con Amazon Lookout for Vision, las empresas de fabricación pueden aumentar la calidad y reducir los costos operativos al identificar rápidamente las diferencias en las imágenes de los objetos a escala. Por ejemplo, Amazon Lookout for Vision se puede utilizar para identificar componentes faltantes en productos, daños a vehículos o estructuras, irregularidades en líneas de producción, defectos minúsculos en obleas de silicio y otros problemas similares. Para obtener más información sobre Amazon Lookout for Vision, consulte la guía para desarrolladores.

Acerca de los autores

raul srivastava es un arquitecto de soluciones sénior en Amazon Web Services y tiene su sede en el Reino Unido. Tiene una amplia experiencia en arquitectura trabajando con grandes clientes empresariales. Está ayudando a nuestros clientes con la arquitectura, la adopción de la nube, el desarrollo de productos con un propósito y aprovechar la IA / ML para resolver problemas comerciales del mundo real.

Procesamiento de imágenes por lotes con etiquetas personalizadas de Amazon Rekognition PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai. kashif imran es arquitecto principal de soluciones en Amazon Web Services. Trabaja con algunos de los clientes más importantes de AWS que aprovechan AI / ML para resolver problemas comerciales complejos. Proporciona orientación técnica y asesoramiento de diseño para implementar aplicaciones de visión por computadora a escala. Su experiencia abarca la arquitectura de aplicaciones, sin servidor, contenedores, NoSQL y aprendizaje automático.