Classificação de imagens e detecção de objetos usando rótulos personalizados do Amazon Rekognition e Amazon SageMaker JumpStart

Republicado por Platão

seguidores: 0

Na última década, os casos de uso de visão computacional têm sido uma tendência crescente, especialmente em setores como seguros, automotivo, comércio eletrônico, energia, varejo, manufatura e outros. Os clientes estão criando modelos de machine learning (ML) de visão computacional para trazer eficiência operacional e automação para seus processos. Esses modelos ajudam a automatizar a classificação de imagens ou detecção de objetos de interesse em imagens específicas e exclusivas do seu negócio.

Para simplificar o processo de construção do modelo de ML, introduzimos JumpStart do Amazon SageMaker em dezembro de 2020. O JumpStart ajuda você a começar a usar o ML de maneira rápida e fácil. Ele fornece implantação com um clique e ajuste fino de uma ampla variedade de modelos pré-treinados, bem como uma seleção de soluções de ponta a ponta. Isso elimina o trabalho pesado de cada etapa do processo de ML, facilitando o desenvolvimento de modelos de alta qualidade e reduzindo o tempo de implantação. No entanto, requer que você tenha algum conhecimento prévio para ajudar na seleção de modelos de um catálogo de mais de 200 modelos de visão computacional pré-treinados. Em seguida, você precisa comparar o desempenho do modelo com diferentes configurações de hiperparâmetro e selecionar o melhor modelo a ser implantado na produção.

Para simplificar essa experiência e permitir que desenvolvedores com pouca ou nenhuma experiência em ML criem modelos personalizados de visão computacional, estamos lançando um novo notebook de exemplo no JumpStart que usa Rótulos personalizados do Amazon Rekognition, um serviço totalmente gerenciado para criar modelos personalizados de visão computacional. O Rekognition Custom Labels baseia-se nos modelos pré-treinados em Reconhecimento da Amazônia, que já são treinados em dezenas de milhões de imagens em muitas categorias. Em vez de milhares de imagens, você pode começar com um pequeno conjunto de imagens de treinamento (algumas centenas ou menos) específicas para seu caso de uso. O Rekognition Custom Labels abstrai a complexidade envolvida na construção de um modelo personalizado. Ele inspeciona automaticamente os dados de treinamento, seleciona os algoritmos de ML corretos, seleciona o tipo de instância, treina vários modelos candidatos com diferentes hiperparâmetros e gera o modelo mais bem treinado. Os rótulos personalizados do Rekognition também fornecem uma interface fácil de usar do Console de gerenciamento da AWS para todo o fluxo de trabalho de ML, incluindo rotulagem de imagens, treinamento, implantação de um modelo e visualização dos resultados do teste.

Este notebook de exemplo no JumpStart usando o Rekognition Custom Labels resolve qualquer tarefa de ML de visão computacional ou detecção de objetos, facilitando para os clientes familiarizados com Amazon Sage Maker para criar uma solução de visão computacional que melhor se adapte ao seu caso de uso, requisitos e conjunto de habilidades.

Nesta postagem, fornecemos instruções passo a passo para usar este notebook de exemplo no JumpStart. O notebook demonstra como usar facilmente as APIs de treinamento e inferência existentes do Rekognition Custom Labels para criar um modelo de classificação de imagem, um modelo de classificação de vários rótulos e um modelo de detecção de objetos. Para facilitar os primeiros passos, fornecemos conjuntos de dados de exemplo para cada modelo.

Treinar e implantar um modelo de visão computacional usando os rótulos personalizados do Rekognition

Nesta seção, localizamos o notebook desejado no JumpStart e demonstramos como treinar e executar a inferência no endpoint implantado.

Vamos começar do Estúdio Amazon SageMaker Launcher.

No Studio Launcher, escolha Ir para SageMaker JumpStart.

A página inicial do JumpStart tem seções para carrosséis de soluções, modelos de texto e modelos de visão. Ele também tem uma barra de pesquisa.
Na barra de pesquisa, digite Rekognition Custom Labels e escolha o Rótulos personalizados do Rekognition para visão notebook.

O notebook é aberto no modo somente leitura.
Escolha Importar Notebook para importar o notebook para seu ambiente.

O notebook fornece um guia passo a passo para treinamento e execução de inferências usando Rótulos personalizados do Rekognition no console do JumpStart. Ele fornece os quatro conjuntos de dados de amostra a seguir para demonstrar a classificação de imagens de rótulo único e múltiplo e a detecção de objetos.

- Classificação de imagem de rótulo único – Este conjunto de dados demonstra como classificar imagens como pertencentes a um conjunto de rótulos predefinidos. Por exemplo, empresas imobiliárias podem usar os Rótulos personalizados do Rekognition para categorizar suas imagens de salas de estar, quintais, quartos e outros locais domésticos. Veja a seguir uma imagem de amostra desse conjunto de dados, que está incluído como parte do notebook.
- Classificação de imagem com vários rótulos – Este conjunto de dados demonstra como classificar imagens em várias categorias, como cor, tamanho, textura e tipo de uma flor. Por exemplo, os produtores de plantas podem usar os rótulos personalizados do Rekognition para distinguir entre diferentes tipos de flores e se estão saudáveis, danificadas ou infectadas. A imagem a seguir é um exemplo desse conjunto de dados.
- Detecção de objetos – Este conjunto de dados demonstra a localização de objetos para localizar peças usadas em linhas de produção ou fabricação. Por exemplo, na indústria eletrônica, as etiquetas personalizadas do Rekognition podem ajudar a contar o número de capacitores em uma placa de circuito. A imagem a seguir é um exemplo desse conjunto de dados.
- Detecção de marca e logotipo – Este conjunto de dados demonstra a localização de logotipos ou marcas em uma imagem. Por exemplo, na indústria de mídia, um modelo de detecção de objetos pode ajudar a identificar a localização de logotipos de patrocinadores em fotografias. Veja a seguir uma imagem de amostra desse conjunto de dados.

Siga as etapas no notebook executando cada célula.

Este notebook demonstra como você pode usar um único notebook para abordar os casos de uso de classificação de imagem e detecção de objeto por meio das APIs de rótulo personalizado do Rekognition.

Ao prosseguir com o notebook, você tem a opção de selecionar um dos conjuntos de dados de amostra mencionados acima. Recomendamos que você tente executar o notebook para cada um dos conjuntos de dados.

Conclusão

Neste post, mostramos como usar as APIs de rótulos personalizados do Rekognition para criar uma classificação de imagem ou um modelo de visão computacional de detecção de objetos para classificar e identificar objetos em imagens específicas para suas necessidades de negócios. Para treinar um modelo, você pode começar fornecendo dezenas a centenas de imagens rotuladas em vez de milhares. Os rótulos personalizados do Rekognition simplificam o treinamento do modelo cuidando das escolhas de parâmetros, como tipo de máquina, tipo de algoritmo ou hiperparâmetros específicos do algoritmo (incluindo o número de camadas na rede, taxa de aprendizado e tamanho do lote). Os rótulos personalizados do Rekognition também simplificam a hospedagem de um modelo treinado e fornecem uma operação simples para realizar inferência com um modelo treinado.

O Rekognition Custom Labels oferece uma experiência de console fácil de usar para o processo de treinamento, gerenciamento de modelos e visualização de imagens de conjuntos de dados. Nós encorajamos você a aprender mais sobre Etiquetas personalizadas de reconhecimento e experimente com seus conjuntos de dados específicos de negócios.

Para começar, você pode navegar até o bloco de anotações de exemplo do Rekognition Custom Labels em SageMaker JumpStart.

Sobre os autores

Mistério Pashmeen é gerente de produto sênior para rótulos personalizados do Amazon Rekognition. Fora do trabalho, Pashmeen gosta de caminhadas de aventura, fotografia e passar tempo com sua família.

Abhishek Gupta é o arquiteto sênior de soluções de serviços de IA da AWS. Ele ajuda os clientes a projetar e implementar soluções de visão computacional.

Carimbo de hora: 12 de maio de 2022

Carimbo de hora: Julho 6, 2022

Republicado por Platão

Crie um aplicativo de resumo de documentos HCLS com Falcon usando Amazon SageMaker JumpStart | Amazon Web Services

Amazon SageMaker Automatic Model Tuning agora oferece suporte a três novos critérios de conclusão para otimização de hiperparâmetros

Modere, classifique e processe documentos usando o Amazon Rekognition e o Amazon Textract

Exafunction oferece suporte ao AWS Inferentia para obter o melhor desempenho de preço para inferência de aprendizado de máquina

Otimize hiperparâmetros com o Amazon SageMaker Automatic Model Tuning

Os modelos Meta Llama 3 já estão disponíveis no Amazon SageMaker JumpStart | Amazon Web Services

Melhore a revisão de código e a eficiência de aprovação com IA generativa usando Amazon Bedrock | Amazon Web Services

Crie legendas de vídeo com o Amazon Transcribe usando este fluxo de trabalho sem código

Ultrapasse as barreiras linguísticas com o Amazon Transcribe, Amazon Translate e Amazon Polly

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta