Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition

Reconhecimento da Amazônia é um serviço de visão computacional que simplifica a adição de análise de imagem e vídeo aos seus aplicativos usando tecnologia de aprendizado profundo comprovada e altamente escalável que não requer experiência em aprendizado de máquina (ML). Com o Amazon Rekognition, você pode identificar objetos, pessoas, textos, cenas e atividades em imagens e vídeos e detectar conteúdo impróprio. O Amazon Rekognition também fornece análise facial altamente precisa e recursos de pesquisa facial que você pode usar para detectar, analisar e comparar rostos para uma ampla variedade de casos de uso.

Rótulos personalizados do Amazon Rekognition é um recurso do Amazon Rekognition que simplifica a criação de seus próprios recursos especializados de análise de imagem com base em ML para detectar objetos e cenas exclusivos integrados ao seu caso de uso específico.

Alguns casos de uso comuns das etiquetas personalizadas Rekognition incluem encontrar seu logotipo em postagens de mídia social, identificar seus produtos nas prateleiras das lojas, classificar peças de máquinas em uma linha de montagem, distinguir entre plantas saudáveis ​​e infectadas e muito mais.

Rótulos do Amazon Rekognition suporta marcos populares como a Ponte do Brooklyn, Coliseu, Torre Eiffel, Machu Picchu, Taj Mahal, e mais. Se você tiver outros pontos de referência ou edifícios ainda não suportados pelo Amazon Rekognition, ainda poderá usar os rótulos personalizados do Amazon Rekognition.

Nesta postagem, demonstramos o uso de rótulos personalizados do Rekognition para detectar a construção do Amazon Spheres em Seattle.

Com o Rekognition Custom Labels, a AWS cuida do trabalho pesado para você. O Rekognition Custom Labels se baseia nos recursos existentes do Amazon Rekognition, que já é treinado em dezenas de milhões de imagens em várias categorias. Em vez de milhares de imagens, basta carregar um pequeno conjunto de imagens de treinamento (normalmente algumas centenas de imagens ou menos) que sejam específicas para o seu caso de uso por meio de nosso console simples. O Amazon Rekognition pode começar o treinamento com apenas alguns cliques. Depois que o Amazon Rekognition começa a treinar com seu conjunto de imagens, ele pode produzir um modelo de análise de imagem personalizado para você em alguns minutos ou horas. Nos bastidores, o Rekognition Custom Labels carrega e inspeciona automaticamente os dados de treinamento, seleciona os algoritmos de ML adequados, treina um modelo e fornece métricas de desempenho do modelo. Você pode usar seu modelo personalizado por meio da API de rótulos personalizados do Rekognition e integrá-lo aos seus aplicativos.

Visão geral da solução

Para o nosso exemplo, usamos o Esferas da Amazônia edifício em Seattle. Treinamos um modelo usando Rekognition Custom Labels; sempre que imagens semelhantes forem usadas, o algoritmo deve identificá-la como Amazon Spheres em vez de Dome, Architecture, Glass building, ou outros rótulos.

Vamos primeiro mostrar um exemplo de uso do recurso de detecção de rótulo do Amazon Rekognition, onde alimentamos a imagem do Amazon Spheres sem nenhum treinamento personalizado. Usamos o console do Amazon Rekognition para abrir a demonstração de detecção de etiquetas e carregar nossa foto.

Depois que a imagem é carregada e analisada, vemos rótulos com suas pontuações de confiança em Resultados . Nesse caso, Dome foi detectado com pontuação de confiança de 99.2%, Architecture com 99.2% Building com 99.2% Metropolis com 79.4%, e assim por diante.

Queremos usar rotulagem personalizada para produzir um modelo de visão computacional que possa rotular a imagem Amazon Spheres.

Nas seções a seguir, orientamos você na preparação do conjunto de dados, na criação de um projeto Rekognition Custom Labels, no treinamento do modelo, na avaliação dos resultados e no teste com imagens adicionais.

Pré-requisitos

Antes de iniciar as etapas, há quotas para rótulos personalizados do Rekognition que você precisa conhecer. Se você quiser alterar os limites, você pode solicitar um aumento de limite de serviço.

Crie seu conjunto de dados

Se esta for a primeira vez que usa rótulos personalizados do Rekognition, você será solicitado a criar um Serviço de armazenamento simples da Amazon (Amazon S3) para armazenar seu conjunto de dados.

Para esta demonstração de blog, usamos imagens das Amazon Spheres, que capturamos enquanto visitamos Seattle, WA. Sinta-se à vontade para usar suas próprias imagens conforme sua necessidade.

Copie seu conjunto de dados para o bucket recém-criado, que armazena suas imagens dentro de seus respectivos prefixos.

Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Criar um projeto

Para criar seu projeto Rekognition Custom Labels, conclua as seguintes etapas:

  1. No console de Rótulos personalizados do Rekognition, escolha Criar um projeto.
  2. Escolha Nome do Projeto, Insira o nome.
  3. Escolha Criar projeto.
    Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.
    Agora especificamos a configuração e o caminho do seu conjunto de dados de treinamento e teste.
  4. Escolha Criar conjunto de dados.
    Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Você pode começar com um projeto que tenha um único conjunto de dados ou um projeto que tenha conjuntos de dados de treinamento e teste separados. Se você começar com um único conjunto de dados, o Rekognition Custom Labels divide seu conjunto de dados durante o treinamento para criar um conjunto de dados de treinamento (80%) e um conjunto de dados de teste (20%) para seu projeto.

Além disso, você pode criar conjuntos de dados de treinamento e teste para um projeto importando imagens de um dos seguintes locais:

Para esta postagem, usamos nosso próprio conjunto de dados personalizado do Amazon Spheres.

  1. Selecionar Comece com um único conjunto de dados.
  2. Selecionar Importar imagens do intervalo S3.
    Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.
  3. Escolha URI S3, insira o caminho para seu bucket S3.
  4. Se você deseja que os rótulos personalizados do Rekognition rotulem automaticamente as imagens para você com base nos nomes das pastas em seu bucket do S3, selecione Atribua automaticamente rótulos de nível de imagem a imagens com base no nome da pasta.
    Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.
  5. Escolha Criar conjunto de dados.

Abre-se uma página que mostra as imagens com seus rótulos. Se você vir algum erro nas etiquetas, consulte Depurando conjuntos de dados.

Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Treine o modelo

Depois de revisar seu conjunto de dados, agora você pode treinar o modelo.

  1. Escolha modelo de trem.
  2. Escolha Escolha o projeto, insira o ARN do seu projeto, caso ainda não esteja listado.
  3. Escolha Modelo de trem.

No Modelos seção da página do projeto, você pode verificar o status atual na status do modelo coluna, onde o treinamento está em andamento. O tempo de treinamento normalmente leva de 30 minutos a 24 horas para ser concluído, dependendo de vários fatores, como número de imagens e número de rótulos no conjunto de treinamento e tipos de algoritmos de ML usados ​​para treinar seu modelo.

Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Quando o treinamento do modelo estiver concluído, você poderá ver o status do modelo como TRAINING_COMPLETED. Se o treinamento falhar, consulte Depurando um treinamento de modelo com falha.

Avalie o modelo

Abra a página de detalhes do modelo. o Avaliação A guia mostra métricas para cada rótulo e a métrica média para todo o conjunto de dados de teste.

Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

O console Rekognition Custom Labels fornece as seguintes métricas como um resumo dos resultados do treinamento e como métricas para cada rótulo:

Você pode visualizar os resultados de seu modelo treinado para imagens individuais, conforme mostrado na captura de tela a seguir.

Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Teste o modelo

Agora que vimos os resultados da avaliação, estamos prontos para iniciar o modelo e analisar novas imagens.

Você pode iniciar o modelo no Modelo de uso guia no console Rekognition Custom Labels, ou usando o Versão do Projeto Inicial operação através do Interface de linha de comando da AWS (AWS CLI) ou Python SDK.

Quando o modelo está em execução, podemos analisar as novas imagens usando o Detectar rótulos personalizados API. O resultado de DetectCustomLabels é uma previsão de que a imagem contém objetos, cenas ou conceitos específicos. Veja o seguinte código:

aws rekognition detect-custom-labels 
--project-version-arn  
--image '{"S3Object": {"Bucket":,"Name":}}' 
--region 

Na saída, você pode ver o rótulo com sua pontuação de confiança:

{
    "Custom Labels": [
        {
            "Name": "Amazon Spheres",
            "Confidence": 93.55500030517578
        }
    ]
}

Como você pode ver no resultado, com apenas alguns cliques simples, você pode usar os rótulos personalizados do Rekognition para obter resultados de rotulagem precisos. Você pode usar isso para vários casos de uso de imagem, como identificar rotulagem personalizada para produtos alimentícios, animais de estimação, peças de máquinas e muito mais.

limpar

Para limpar os recursos que você criou como parte desta postagem e evitar possíveis custos recorrentes, conclua as seguintes etapas:

  1. No Modelo de uso aba, parar o modelo.
    Alternativamente, você pode parar o modelo usando o StopProjectVersão operação por meio da AWS CLI ou Python SDK. Aguarde até que o modelo esteja no Stopped antes de prosseguir para as próximas etapas.
  2. Excluir o modelo.
  3. Excluir o projeto.
  4. Excluir o conjunto de dados.
  5. vazio o conteúdo do balde S3 e excluir o balde.

Conclusão

Nesta postagem, mostramos como usar os rótulos personalizados do Rekognition para detectar imagens de edifícios.

Você pode começar com seus conjuntos de dados de imagem personalizados e, com alguns cliques simples no console Rekognition Custom Labels, você pode treinar seu modelo e detectar objetos em imagens. Os rótulos personalizados do Rekognition podem carregar e inspecionar automaticamente os dados, selecionar os algoritmos de ML corretos, treinar um modelo e fornecer métricas de desempenho do modelo. Você pode revisar métricas de desempenho detalhadas, como precisão, recall, pontuações de F1 e pontuações de confiança.

Chegou o dia em que podemos identificar edifícios populares como o Empire State Building na cidade de Nova York, o Taj Mahal na Índia e muitos outros em todo o mundo pré-etiquetados e prontos para uso em inteligência em seus aplicativos. Mas se você tiver outros pontos de referência atualmente ainda não suportados pelo Amazon Rekognition Labels, não procure mais e experimente o Amazon Rekognition Custom Labels.

Para obter mais informações sobre como usar rótulos personalizados, consulte O que são rótulos personalizados do Amazon Rekognition? Visite também o nosso GitHub repo para um fluxo de trabalho completo da detecção de marca personalizada do Amazon Rekognition.


Sobre os autores:

Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.Suresh Patnam é Principal BDM – GTM AI/ML Leader na AWS. Ele trabalha com os clientes para criar uma estratégia de TI, tornando a transformação digital por meio da nuvem mais acessível, aproveitando dados e IA/ML. Em seu tempo livre, Suresh gosta de jogar tênis e passar o tempo com sua família.

Identificação de pontos de referência com rótulos personalizados do Amazon Rekognition PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.Coelho Kaushik é arquiteto de soluções da AWS. Ele é apaixonado por criar soluções de IA/ML na AWS e ajudar os clientes a inovar na plataforma da AWS. Fora do trabalho, ele gosta de caminhar, escalar e nadar.

Carimbo de hora:

Mais de Aprendizado de máquina da AWS