Na última década, os casos de uso de visão computacional têm sido uma tendência crescente, especialmente em setores como seguros, automotivo, comércio eletrônico, energia, varejo, manufatura e outros. Os clientes estão criando modelos de machine learning (ML) de visão computacional para trazer eficiência operacional e automação para seus processos. Esses modelos ajudam a automatizar a classificação de imagens ou detecção de objetos de interesse em imagens específicas e exclusivas do seu negócio.
Para simplificar o processo de construção do modelo de ML, introduzimos JumpStart do Amazon SageMaker em dezembro de 2020. O JumpStart ajuda você a começar a usar o ML de maneira rápida e fácil. Ele fornece implantação com um clique e ajuste fino de uma ampla variedade de modelos pré-treinados, bem como uma seleção de soluções de ponta a ponta. Isso elimina o trabalho pesado de cada etapa do processo de ML, facilitando o desenvolvimento de modelos de alta qualidade e reduzindo o tempo de implantação. No entanto, requer que você tenha algum conhecimento prévio para ajudar na seleção de modelos de um catálogo de mais de 200 modelos de visão computacional pré-treinados. Em seguida, você precisa comparar o desempenho do modelo com diferentes configurações de hiperparâmetro e selecionar o melhor modelo a ser implantado na produção.
Para simplificar essa experiência e permitir que desenvolvedores com pouca ou nenhuma experiência em ML criem modelos personalizados de visão computacional, estamos lançando um novo notebook de exemplo no JumpStart que usa Rótulos personalizados do Amazon Rekognition, um serviço totalmente gerenciado para criar modelos personalizados de visão computacional. O Rekognition Custom Labels baseia-se nos modelos pré-treinados em Reconhecimento da Amazônia, que já são treinados em dezenas de milhões de imagens em muitas categorias. Em vez de milhares de imagens, você pode começar com um pequeno conjunto de imagens de treinamento (algumas centenas ou menos) específicas para seu caso de uso. O Rekognition Custom Labels abstrai a complexidade envolvida na construção de um modelo personalizado. Ele inspeciona automaticamente os dados de treinamento, seleciona os algoritmos de ML corretos, seleciona o tipo de instância, treina vários modelos candidatos com diferentes hiperparâmetros e gera o modelo mais bem treinado. Os rótulos personalizados do Rekognition também fornecem uma interface fácil de usar do Console de gerenciamento da AWS para todo o fluxo de trabalho de ML, incluindo rotulagem de imagens, treinamento, implantação de um modelo e visualização dos resultados do teste.
Este notebook de exemplo no JumpStart usando o Rekognition Custom Labels resolve qualquer tarefa de ML de visão computacional ou detecção de objetos, facilitando para os clientes familiarizados com Amazon Sage Maker para criar uma solução de visão computacional que melhor se adapte ao seu caso de uso, requisitos e conjunto de habilidades.
Nesta postagem, fornecemos instruções passo a passo para usar este notebook de exemplo no JumpStart. O notebook demonstra como usar facilmente as APIs de treinamento e inferência existentes do Rekognition Custom Labels para criar um modelo de classificação de imagem, um modelo de classificação de vários rótulos e um modelo de detecção de objetos. Para facilitar os primeiros passos, fornecemos conjuntos de dados de exemplo para cada modelo.
Treinar e implantar um modelo de visão computacional usando os rótulos personalizados do Rekognition
Nesta seção, localizamos o notebook desejado no JumpStart e demonstramos como treinar e executar a inferência no endpoint implantado.
Vamos começar do Estúdio Amazon SageMaker Launcher.
- No Studio Launcher, escolha Ir para SageMaker JumpStart.
A página inicial do JumpStart tem seções para carrosséis de soluções, modelos de texto e modelos de visão. Ele também tem uma barra de pesquisa. - Na barra de pesquisa, digite
Rekognition Custom Labels
e escolha o Rótulos personalizados do Rekognition para visão notebook.
O notebook é aberto no modo somente leitura. - Escolha Importar Notebook para importar o notebook para seu ambiente.
O notebook fornece um guia passo a passo para treinamento e execução de inferências usando Rótulos personalizados do Rekognition no console do JumpStart. Ele fornece os quatro conjuntos de dados de amostra a seguir para demonstrar a classificação de imagens de rótulo único e múltiplo e a detecção de objetos.
-
- Classificação de imagem de rótulo único – Este conjunto de dados demonstra como classificar imagens como pertencentes a um conjunto de rótulos predefinidos. Por exemplo, empresas imobiliárias podem usar os Rótulos personalizados do Rekognition para categorizar suas imagens de salas de estar, quintais, quartos e outros locais domésticos. Veja a seguir uma imagem de amostra desse conjunto de dados, que está incluído como parte do notebook.
- Classificação de imagem com vários rótulos – Este conjunto de dados demonstra como classificar imagens em várias categorias, como cor, tamanho, textura e tipo de uma flor. Por exemplo, os produtores de plantas podem usar os rótulos personalizados do Rekognition para distinguir entre diferentes tipos de flores e se estão saudáveis, danificadas ou infectadas. A imagem a seguir é um exemplo desse conjunto de dados.
- Detecção de objetos – Este conjunto de dados demonstra a localização de objetos para localizar peças usadas em linhas de produção ou fabricação. Por exemplo, na indústria eletrônica, as etiquetas personalizadas do Rekognition podem ajudar a contar o número de capacitores em uma placa de circuito. A imagem a seguir é um exemplo desse conjunto de dados.
- Detecção de marca e logotipo – Este conjunto de dados demonstra a localização de logotipos ou marcas em uma imagem. Por exemplo, na indústria de mídia, um modelo de detecção de objetos pode ajudar a identificar a localização de logotipos de patrocinadores em fotografias. Veja a seguir uma imagem de amostra desse conjunto de dados.
- Classificação de imagem de rótulo único – Este conjunto de dados demonstra como classificar imagens como pertencentes a um conjunto de rótulos predefinidos. Por exemplo, empresas imobiliárias podem usar os Rótulos personalizados do Rekognition para categorizar suas imagens de salas de estar, quintais, quartos e outros locais domésticos. Veja a seguir uma imagem de amostra desse conjunto de dados, que está incluído como parte do notebook.
- Siga as etapas no notebook executando cada célula.
Este notebook demonstra como você pode usar um único notebook para abordar os casos de uso de classificação de imagem e detecção de objeto por meio das APIs de rótulo personalizado do Rekognition.
Ao prosseguir com o notebook, você tem a opção de selecionar um dos conjuntos de dados de amostra mencionados acima. Recomendamos que você tente executar o notebook para cada um dos conjuntos de dados.
Conclusão
Neste post, mostramos como usar as APIs de rótulos personalizados do Rekognition para criar uma classificação de imagem ou um modelo de visão computacional de detecção de objetos para classificar e identificar objetos em imagens específicas para suas necessidades de negócios. Para treinar um modelo, você pode começar fornecendo dezenas a centenas de imagens rotuladas em vez de milhares. Os rótulos personalizados do Rekognition simplificam o treinamento do modelo cuidando das escolhas de parâmetros, como tipo de máquina, tipo de algoritmo ou hiperparâmetros específicos do algoritmo (incluindo o número de camadas na rede, taxa de aprendizado e tamanho do lote). Os rótulos personalizados do Rekognition também simplificam a hospedagem de um modelo treinado e fornecem uma operação simples para realizar inferência com um modelo treinado.
O Rekognition Custom Labels oferece uma experiência de console fácil de usar para o processo de treinamento, gerenciamento de modelos e visualização de imagens de conjuntos de dados. Nós encorajamos você a aprender mais sobre Etiquetas personalizadas de reconhecimento e experimente com seus conjuntos de dados específicos de negócios.
Para começar, você pode navegar até o bloco de anotações de exemplo do Rekognition Custom Labels em SageMaker JumpStart.
Sobre os autores
Mistério Pashmeen é gerente de produto sênior para rótulos personalizados do Amazon Rekognition. Fora do trabalho, Pashmeen gosta de caminhadas de aventura, fotografia e passar tempo com sua família.
Abhishek Gupta é o arquiteto sênior de soluções de serviços de IA da AWS. Ele ajuda os clientes a projetar e implementar soluções de visão computacional.
- Coinsmart. A melhor troca de Bitcoin e criptografia da Europa.
- Platoblockchain. Inteligência Metaverso Web3. Conhecimento Ampliado. ACESSO LIVRE.
- CryptoHawk. Radar Altcoin. Teste grátis.
- Fonte: https://aws.amazon.com/blogs/machine-learning/image-classification-and-object-detection-using-amazon-rekognition-custom-labels-and-amazon-sagemaker-jumpstart/
- "
- 100
- 2020
- resumos
- em
- endereço
- AI
- Serviços de IA
- algoritmo
- algoritmos
- já
- Amazon
- APIs
- automatizar
- Automação
- automotivo
- AWS
- referência
- MELHOR
- borda
- marcas
- construir
- Prédio
- Constrói
- negócio
- Pode obter
- candidato
- Cuidado
- casos
- escolhas
- Escolha
- classificação
- Empresas
- computador
- cônsul
- crio
- personalizadas
- Clientes
- dados,
- década
- demonstrar
- implantar
- implantado
- Implantação
- desenvolvimento
- Design
- Detecção
- desenvolver
- desenvolvedores
- diferente
- facilmente
- fácil de usar
- Loja virtual
- Eletrônicos
- encorajar
- Ponto final
- energia
- Entrar
- Meio Ambiente
- especialmente
- propriedade
- exemplo
- existente
- vasta experiência
- experiência
- família
- seguinte
- Crescente
- guia
- ajudar
- ajuda
- alta qualidade
- hospedagem
- casa
- Como funciona o dobrador de carta de canal
- Como Negociar
- Contudo
- HTTPS
- Centenas
- identificar
- imagem
- executar
- incluído
- Incluindo
- indústrias
- indústria
- com seguro
- interesse
- Interface
- envolvido
- IT
- Conhecimento
- marcação
- Rótulos
- APRENDER
- aprendizagem
- facelift
- pequeno
- vida
- localização
- locais
- logotipo
- máquina
- aprendizado de máquina
- Fazendo
- gerenciados
- de grupos
- Gerente
- fabrica
- Mídia
- milhões
- ML
- modelo
- modelos
- mais
- múltiplo
- Cria
- rede
- caderno
- número
- abre
- operação
- Opção
- Outros
- parte
- atuação
- realização
- fotografia
- processo
- processos
- Produto
- Produção
- fornecer
- fornece
- fornecendo
- rapidamente
- bens imóveis
- redução
- Requisitos
- exige
- Resultados
- varejo
- Quartos
- Execute
- corrida
- Pesquisar
- serviço
- Serviços
- conjunto
- simples
- Tamanho
- pequeno
- solução
- Soluções
- Resolve
- alguns
- Passar
- patrocinador
- começo
- começado
- estudo
- tomar
- teste
- milhares
- tempo
- Training
- trens
- tipos
- único
- usar
- variedade
- visão
- visualização
- dentro
- Atividades: