Temos o prazer de anunciar o lançamento de Amazon DocumentDB (com compatibilidade com MongoDB) integração com Tela do Amazon SageMaker, permitindo que os clientes do Amazon DocumentDB criem e usem soluções generativas de IA e machine learning (ML) sem escrever código. O Amazon DocumentDB é um banco de dados de documentos JSON nativo totalmente gerenciado que torna simples e econômico operar cargas de trabalho de documentos críticos em praticamente qualquer escala, sem gerenciar a infraestrutura. O Amazon SageMaker Canvas é um espaço de trabalho de ML sem código que oferece modelos prontos para uso, incluindo modelos básicos, e a capacidade de preparar dados e criar e implantar modelos personalizados.
Nesta postagem, discutimos como trazer dados armazenados no Amazon DocumentDB para o SageMaker Canvas e usar esses dados para criar modelos de ML para análise preditiva. Sem criar e manter pipelines de dados, você poderá potencializar modelos de ML com dados não estruturados armazenados no Amazon DocumentDB.
Visão geral da solução
Vamos assumir o papel de analista de negócios de uma empresa de entrega de alimentos. Seu aplicativo móvel armazena informações sobre restaurantes no Amazon DocumentDB devido à escalabilidade e aos recursos de esquema flexíveis. Você deseja coletar insights sobre esses dados e construir um modelo de ML para prever como os novos restaurantes serão avaliados, mas acha um desafio realizar análises em dados não estruturados. Você encontra gargalos porque precisa contar com equipes de engenharia e ciência de dados para atingir esses objetivos.
Essa nova integração resolve esses problemas, simplificando a transferência de dados do Amazon DocumentDB para o SageMaker Canvas e o início imediato da preparação e análise de dados para ML. Além disso, o SageMaker Canvas elimina a dependência da experiência em ML para construir modelos de alta qualidade e gerar previsões.
Demonstramos como usar dados do Amazon DocumentDB para criar modelos de ML no SageMaker Canvas nas seguintes etapas:
- Crie um conector Amazon DocumentDB no SageMaker Canvas.
- Analise dados usando IA generativa.
- Prepare dados para aprendizado de máquina.
- Construa um modelo e gere previsões.
Pré-requisitos
Para implementar esta solução, preencha os seguintes pré-requisitos:
- Tenha acesso de administrador da Nuvem AWS com um Gerenciamento de acesso e identidade da AWS (IAM) usuário com permissões necessárias para concluir a integração.
- Conclua a configuração do ambiente usando Formação da Nuvem AWS através de uma das seguintes opções:
- Implantar um modelo CloudFormation em uma nova VPC – Esta opção cria um novo ambiente AWS que consiste em VPC, sub-redes privadas, grupos de segurança, funções de execução IAM, Amazon Cloud9, endpoints VPC necessários e Domínio do SageMaker. Em seguida, ele implanta o Amazon DocumentDB nessa nova VPC. Faça o download do modelo ou inicie rapidamente a pilha do CloudFormation escolhendo Pilha de Lançamento:
- Implantar um modelo CloudFormation em uma VPC existente – Esta opção cria os VPC endpoints necessários, as funções de execução do IAM e o domínio SageMaker em uma VPC existente com sub-redes privadas. Faça o download do modelo ou inicie rapidamente a pilha do CloudFormation escolhendo Pilha de Lançamento:
- Implantar um modelo CloudFormation em uma nova VPC – Esta opção cria um novo ambiente AWS que consiste em VPC, sub-redes privadas, grupos de segurança, funções de execução IAM, Amazon Cloud9, endpoints VPC necessários e Domínio do SageMaker. Em seguida, ele implanta o Amazon DocumentDB nessa nova VPC. Faça o download do modelo ou inicie rapidamente a pilha do CloudFormation escolhendo Pilha de Lançamento:
Observe que se você estiver criando um novo domínio SageMaker, deverá configurar o domínio para estar em uma VPC privada sem acesso à Internet para poder adicionar o conector ao Amazon DocumentDB. Para saber mais, consulte Configure o Amazon SageMaker Canvas em uma VPC sem acesso à Internet.
- Siga o tutorial para carregar dados de amostra de restaurantes no Amazon DocumentDB.
- Adicione acesso ao Amazon Bedrock e ao modelo Antrópico Claude dentro dele. Para mais informações, veja Adicionar acesso ao modelo.
Crie um conector Amazon DocumentDB no SageMaker Canvas
Depois de criar seu domínio SageMaker, conclua as seguintes etapas:
- No console do Amazon DocumentDB, escolha Aprendizado de máquina sem código no painel de navegação.
- Debaixo Escolha um domínio e perfil¸ escolha seu domínio e perfil de usuário SageMaker.
- Escolha Iniciar tela para iniciar o SageMaker Canvas em uma nova guia.
Quando o SageMaker Canvas terminar de carregar, você chegará ao Fluxos de dados aba.
- Escolha Crie para criar um novo fluxo de dados.
- Insira um nome para seu fluxo de dados e escolha Crie.
- Adicione uma nova conexão do Amazon DocumentDB escolhendo Datas de importação, Em seguida, escolha Tabular para Tipo de conjunto de dados.
- No Datas de importação página, para Fonte de dados, escolha DocumentDB e Adicionar conexão.
- Insira um nome de conexão, como demo, e escolha o cluster do Amazon DocumentDB desejado.
Observe que o SageMaker Canvas preencherá previamente o menu suspenso com clusters na mesma VPC do seu domínio SageMaker.
- Insira um nome de usuário, senha e nome do banco de dados.
- Por fim, selecione sua preferência de leitura.
Para proteger o desempenho das instâncias primárias, o padrão do SageMaker Canvas é Secundário, o que significa que ele lerá apenas instâncias secundárias. Quando a preferência de leitura é Secundário preferido, o SageMaker Canvas lê as instâncias secundárias disponíveis, mas lerá a instância primária se uma instância secundária não estiver disponível. Para obter mais informações sobre como configurar uma conexão do Amazon DocumentDB, consulte o Conecte-se a um banco de dados armazenado na AWS.
- Escolha Adicionar conexão.
Se a conexão for bem-sucedida, você verá coleções no banco de dados Amazon DocumentDB mostradas como tabelas.
- Arraste a tabela de sua preferência para a tela em branco. Para esta postagem, adicionamos os dados do nosso restaurante.
As primeiras 100 linhas são exibidas como uma visualização.
- Para começar a analisar e preparar seus dados, escolha Datas de importação.
- Insira um nome de conjunto de dados e escolha Datas de importação.
Analise dados usando IA generativa
A seguir, queremos obter alguns insights sobre nossos dados e procurar padrões. SageMaker Canvas fornece uma interface de linguagem natural para analisar e preparar dados. Quando o Data carregando a guia, você pode começar a conversar com seus dados seguindo as seguintes etapas:
- Escolha Bate-papo para preparação de dados.
- Reúna insights sobre seus dados fazendo perguntas como os exemplos mostrados nas capturas de tela a seguir.
Para saber mais sobre como usar a linguagem natural para explorar e preparar dados, consulte Use linguagem natural para explorar e preparar dados com um novo recurso do Amazon SageMaker Canvas.
Vamos ter uma noção mais profunda da qualidade dos nossos dados usando o Relatório de insights e qualidade de dados do SageMaker Canvas, que avalia automaticamente a qualidade dos dados e detecta anormalidades.
- No Analisa guia, escolha Relatório de insights e qualidade de dados.
- Escolha
rating
como a coluna de destino e Regressão como o tipo de problema e escolha Crie.
Isso simulará o treinamento do modelo e fornecerá insights sobre como podemos melhorar nossos dados para aprendizado de máquina. O relatório completo é gerado em poucos minutos.
Nosso relatório mostra que 2.47% das linhas em nosso destino possuem valores ausentes – abordaremos isso na próxima etapa. Além disso, a análise mostra que o address line 2
, name
e type_of_food
recursos têm o maior poder de previsão em nossos dados. Isso indica que informações básicas do restaurante, como localização e culinária, podem ter um impacto enorme nas avaliações.
Preparar dados para aprendizado de máquina
SageMaker Canvas oferece mais de 300 transformações integradas para preparar seus dados importados. Para obter mais informações sobre os recursos de transformação do SageMaker Canvas, consulte Prepare dados com transformações avançadas. Vamos adicionar algumas transformações para preparar nossos dados para treinar um modelo de ML.
- Navegue de volta para o Fluxo de dados página escolhendo o nome do seu fluxo de dados na parte superior da página.
- Escolha o sinal de mais ao lado de Tipos de dados e escolha Adicionar transformação.
- Escolha Adicionar etapa.
- Vamos renomear o
address line 2
coluna paracities
.- Escolha Gerenciar colunas.
- Escolha Renomear coluna para Transformar.
- Escolha
address line 2
para Coluna de entrada, entrarcities
para Novo nomee escolha Adicionar.
- Além disso, vamos eliminar algumas colunas desnecessárias.
- Adicione uma nova transformação.
- Escolha Transformar, escolha Coluna de queda.
- Escolha Colunas para soltar, escolha
URL
erestaurant_id
. - Escolha Adicionar.
[
- Nosso
rating
coluna de recurso tem alguns valores ausentes, então vamos preencher essas linhas com o valor médio desta coluna.- Adicione uma nova transformação.
- Escolha Transformar, escolha Imputar.
- Escolha Tipo de coluna, escolha Numérico.
- Escolha Colunas de entrada, escolha o
rating
coluna. - Escolha Estratégia de imputação, escolha Média.
- Escolha Coluna de saída, entrar
rating_avg_filled
. - Escolha Adicionar.
- Podemos abandonar o
rating
coluna porque temos uma nova coluna com valores preenchidos. - Porque
type_of_food
é de natureza categórica, desejaremos codificá-lo numericamente. Vamos codificar esse recurso usando a técnica de codificação one-hot.- Adicione uma nova transformação.
- Escolha Transformar, escolha Codificação one-hot.
- Para Colunas de entrada, escolha
type_of_food
. - Escolha Estratégia de manuseio inválida¸ escolher Guarda.
- Escolha Estilo de saída¸ escolher colunas.
- Escolha Coluna de saída, entrar
encoded
. - Escolha Adicionar.
Construa um modelo e gere previsões
Agora que transformamos nossos dados, vamos treinar um modelo numérico de ML para prever as classificações de restaurantes.
- Escolha Criar modelo.
- Escolha Nome do conjunto de dados, insira um nome para a exportação do conjunto de dados.
- Escolha Exportações e aguarde a exportação dos dados transformados.
- Escolha o Criar modelo link no canto inferior esquerdo da página.
Você também pode selecionar o conjunto de dados no recurso Data Wrangler à esquerda da página.
- Insira um nome de modelo.
- Escolha Análise preditiva, Em seguida, escolha Crie.
- Escolha
rating_avg_filled
como a coluna de destino.
O SageMaker Canvas seleciona automaticamente um tipo de modelo adequado.
- Escolha Modelo de visualização para garantir que não haja problemas de qualidade dos dados.
- Escolha Construção rápida para construir o modelo.
A criação do modelo levará aproximadamente 2 a 15 minutos para ser concluída.
Você pode visualizar o status do modelo depois que ele terminar o treinamento. Nosso modelo tem um RSME de 0.422, o que significa que o modelo geralmente prevê a classificação de um restaurante dentro de +/- 0.422 do valor real, uma aproximação sólida para a escala de classificação de 1–6.
- Finalmente, você pode gerar previsões de amostra navegando até o Prever aba.
limpar
Para evitar cobranças futuras, exclua os recursos que você criou ao seguir esta postagem. O SageMaker Canvas cobra pela duração da sessão e recomendamos sair do SageMaker Canvas quando não estiver usando-o. Referir-se Sair do Amazon SageMaker Canvas para mais detalhes.
Conclusão
Nesta postagem, discutimos como você pode usar o SageMaker Canvas para IA generativa e ML com dados armazenados no Amazon DocumentDB. Em nosso exemplo, mostramos como um analista pode construir rapidamente um modelo de ML de alta qualidade usando um conjunto de dados de restaurante de amostra.
Mostramos as etapas para implementar a solução, desde a importação de dados do Amazon DocumentDB até a construção de um modelo de ML no SageMaker Canvas. Todo o processo foi concluído através de uma interface visual sem escrever uma única linha de código.
Para iniciar sua jornada de ML com baixo código/sem código, consulte Tela do Amazon SageMaker.
Sobre os autores
Adeleke Coker é um arquiteto de soluções globais da AWS. Ele trabalha com clientes globalmente para fornecer orientação e assistência técnica na implantação de cargas de trabalho de produção em escala na AWS. Em seu tempo livre, ele gosta de aprender, ler, jogar e assistir a eventos esportivos.
Gururaj S Bayari é arquiteto de soluções especialista em DocumentDB sênior na AWS. Ele gosta de ajudar os clientes a adotar os bancos de dados específicos da Amazon. Ele ajuda os clientes a projetar, avaliar e otimizar sua escala de Internet e cargas de trabalho de alto desempenho alimentadas por bancos de dados NoSQL e/ou relacionais.
Tim Pusateri é gerente de produto sênior na AWS, onde trabalha no Amazon SageMaker Canvas. Seu objetivo é ajudar os clientes a obter rapidamente valor da IA/ML. Fora do trabalho, ele adora estar ao ar livre, tocar violão, ver música ao vivo e passar tempo com a família e amigos.
Pratik Das é gerente de produto na AWS. Ele gosta de trabalhar com clientes que buscam criar cargas de trabalho resilientes e bases de dados sólidas na nuvem. Ele traz experiência trabalhando com empresas em iniciativas de modernização, análise e transformação de dados.
Varma Gottumukkala é arquiteto de soluções especialista em banco de dados sênior na AWS e baseado em Dallas Fort Worth. Varma trabalha com os clientes em sua estratégia de banco de dados e arquiteta suas cargas de trabalho usando bancos de dados criados especificamente pela AWS. Antes de ingressar na AWS, ele trabalhou extensivamente com bancos de dados relacionais, bancos de dados NOSQL e diversas linguagens de programação nos últimos 22 anos.
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- Fonte: https://aws.amazon.com/blogs/machine-learning/use-amazon-documentdb-to-build-no-code-machine-learning-solutions-in-amazon-sagemaker-canvas/
- :tem
- :é
- :não
- :onde
- 10
- 100
- 11
- 12
- 13
- 150
- 22
- 27
- 300
- 385
- 500
- 58
- 7
- 8
- 9
- a
- habilidade
- Capaz
- Sobre
- Acesso
- realizar
- real
- adicionar
- Adicionalmente
- endereço
- admin
- adotar
- avançado
- Depois de
- AI
- AI / ML
- Permitindo
- tb
- Amazon
- Amazon Sage Maker
- Tela do Amazon SageMaker
- Amazon Web Services
- an
- análise
- analista
- Análises
- analítica
- analisar
- análise
- e
- Anunciar
- Antrópico
- qualquer
- app
- aproximadamente
- SOMOS
- AS
- pergunta
- Assistência
- assumir
- At
- automaticamente
- disponível
- média
- evitar
- AWS
- em caminho duplo
- baseado
- basic
- BE
- Porque
- antes
- Contas inclusas
- gargalos
- Inferior
- trazer
- Traz
- construir
- Prédio
- Constrói
- construído
- construídas em
- negócio
- mas a
- by
- CAN
- lona
- capacidades
- capacidade
- desafiante
- acusações
- conversando
- escolha
- Escolha
- escolha
- Na nuvem
- Agrupar
- código
- coleções
- Coluna
- colunas
- Empresa
- compatibilidade
- completar
- Efetuado
- da conexão
- consiste
- cônsul
- Canto
- relação custo-benefício
- crio
- criado
- cria
- Criar
- criação
- crítico
- personalizadas
- Clientes
- Dallas
- dados,
- ciência de dados
- banco de dados
- bases de dados
- mais profunda
- defaults
- Entrega
- demonstração
- demonstrar
- Dependência
- implantar
- Implantação
- implanta
- derivar
- Design
- desejado
- detalhes
- discutir
- discutido
- exibido
- documento
- domínio
- download
- Cair
- duração
- ou
- codificação
- Engenharia
- garantir
- Entrar
- empresas
- Todo
- Meio Ambiente
- avaliar
- eventos
- exemplo
- animado
- execução
- existente
- experiência
- explorar
- exportar
- extensivamente
- família
- Característica
- Funcionalidades
- poucos
- preencher
- preenchida
- Encontre
- Primeiro nome
- flexível
- fluxo
- seguinte
- comida
- entrega de alimentos
- Escolha
- Foundation
- Fundações
- amigos
- da
- totalmente
- futuro
- jogos
- reunir
- gerar
- gerado
- generativo
- IA generativa
- ter
- Global
- Globalmente
- meta
- Objetivos
- Do grupo
- orientações
- Manipulação
- Ter
- he
- ajudar
- ajuda
- ajuda
- Alta
- alta qualidade
- sua
- Como funciona o dobrador de carta de canal
- Como Negociar
- HTML
- HTTPS
- Identidade
- if
- imediatamente
- Impacto
- executar
- importador
- melhorar
- in
- Incluindo
- indicam
- INFORMAÇÕES
- Infraestrutura
- iniciativas
- entrada
- insights
- instância
- integração
- Interface
- Internet
- Acesso à internet
- para dentro
- questões
- IT
- ESTÁ
- juntando
- viagem
- jpg
- json
- Terreno
- língua
- Idiomas
- Sobrenome
- lançamento
- APRENDER
- aprendizagem
- esquerda
- Permite
- como
- Line
- LINK
- viver
- carregar
- carregamento
- cargas
- localização
- logging
- olhar
- procurando
- ama
- máquina
- aprendizado de máquina
- Manter
- FAZ
- Fazendo
- gerenciados
- Gerente
- gestão
- Posso..
- significado
- significa
- Menu
- Minutos
- desaparecido
- ML
- Móvel Esteira
- Aplicativo móvel
- modelo
- modelos
- MongoDB
- mais
- a maioria
- múltiplo
- Música
- devo
- nome
- nativo
- natural
- Natureza
- navegação
- Navegação
- você merece...
- Novo
- Próximo
- não
- of
- oferecendo treinamento para distância
- Oferece
- frequentemente
- on
- só
- operar
- Otimize
- Opção
- Opções
- or
- A Nossa
- Fora
- ao ar livre
- lado de fora
- Acima de
- página
- pão
- Senha
- padrões
- Realizar
- atuação
- permissões
- platão
- Inteligência de Dados Platão
- PlatãoData
- Jogar
- mais
- Publique
- poder
- alimentado
- predizer
- predição
- Previsões
- Análise Preditiva
- Previsões
- Preparar
- preparação
- pré-requisitos
- visualização
- primário
- privado
- Problema
- problemas
- processo
- Produto
- gerente de produto
- Produção
- Perfil
- Programação
- linguagens de programação
- proteger
- fornecer
- fornece
- propósito
- qualidade
- Frequentes
- Links
- rapidamente
- Classificado
- classificação
- avaliações
- Leia
- Leitura
- pronto
- recomendar
- referir
- depender
- remove
- Denunciar
- requeridos
- resiliente
- Recursos
- restaurante
- Restaurantes
- Tipo
- papéis
- s
- sábio
- mesmo
- AMPLIAR
- Escala
- Ciência
- screenshots
- secundário
- segurança
- Vejo
- selecionar
- senior
- sentido
- Serviços
- Sessão
- instalação
- mostrou
- mostrando
- Shows
- assinar
- simples
- solteiro
- So
- sólido
- solução
- Soluções
- Resolve
- alguns
- especialista
- gastar
- Desporto
- pilha
- começo
- Status
- Passo
- Passos
- armazenadas
- lojas
- franco
- Estratégia
- mais forte,
- sub-redes
- bem sucedido
- tal
- adequado
- mesa
- Tire
- Target
- equipes
- Dados Técnicos:
- técnica
- modelo
- que
- A
- deles
- então
- Lá.
- Este
- isto
- aqueles
- Através da
- tempo
- para
- topo
- Trem
- Training
- Transformar
- Transformação
- transformações
- transformado
- tipo
- desnecessário
- usar
- Utilizador
- utilização
- valor
- Valores
- Ver
- praticamente
- visual
- esperar
- queremos
- foi
- assistindo
- we
- web
- serviços web
- quando
- qual
- enquanto
- precisarão
- de
- dentro
- sem
- Atividades:
- trabalhou
- trabalhar
- trabalho
- Equivalente há
- escrita
- anos
- Vocês
- investimentos
- zefirnet