Lançado em 2021, Tela do Amazon SageMaker é um serviço visual de apontar e clicar para criar e implantar modelos de aprendizado de máquina (ML) sem a necessidade de escrever nenhum código. Modelos básicos (FMs) prontos para uso disponíveis no SageMaker Canvas permitem que os clientes usem IA generativa para tarefas como geração e resumo de conteúdo.
Temos o prazer de anunciar as atualizações mais recentes do Amazon SageMaker Canvas, que trazem novos recursos de IA generativa para a plataforma. Com suporte para os modelos Meta Llama 2 e Mistral.AI e o lançamento de respostas de streaming, o SageMaker Canvas continua a capacitar todos que desejam começar com IA generativa sem escrever uma única linha de código. Nesta postagem, discutimos essas atualizações e seus benefícios.
Apresentando os modelos Meta Llama 2 e Mistral
Llama 2 é um modelo básico de ponta da Meta que oferece escalabilidade e versatilidade aprimoradas para uma ampla gama de tarefas generativas de IA. Os usuários relataram que o Llama 2 é capaz de se envolver em conversas significativas e coerentes, gerando novos conteúdos e extraindo respostas de notas existentes. Llama 2 está entre os grandes modelos de linguagem (LLMs) de última geração disponíveis hoje para a comunidade de código aberto construir seus próprios aplicativos baseados em IA.
Mistral.AI, uma start-up francesa líder em IA, desenvolveu o Mistral 7B, um poderoso modelo de linguagem com 7.3 bilhões de parâmetros. Os modelos Mistral foram muito bem recebidos pela comunidade de código aberto graças ao uso de atenção de consulta agrupada (GQA) para inferência mais rápida, tornando-os altamente eficientes e com desempenho comparável ao modelo com duas ou três vezes o número de parâmetros.
Hoje, temos o prazer de anunciar que o SageMaker Canvas agora oferece suporte a três variantes do modelo Llama 2 e duas variantes do Mistral 7B:
Para testar esses modelos, navegue até o SageMaker Canvas Modelos prontos para uso página e, em seguida, escolha Gerar, extrair e resumir conteúdo. É aqui que você encontrará a experiência de bate-papo do SageMaker Canvas GenAI. Aqui, você pode usar qualquer modelo do Amazon Bedrock ou SageMaker JumpStart selecionando-os no menu suspenso do modelo.
No nosso caso, escolhemos um dos modelos Llama 2. Agora você pode fornecer sua opinião ou consulta. À medida que você envia a entrada, o SageMaker Canvas encaminha sua entrada para o modelo.
Escolher qual dos modelos disponíveis no SageMaker Canvas se adapta melhor ao seu caso de uso exige que você leve em consideração informações sobre os próprios modelos: o modelo Llama-2-70B-chat é um modelo maior (70 bilhões de parâmetros, em comparação com 13 bilhões com Llama-2-13B-chat ), o que significa que seu desempenho é geralmente superior ao menor, ao custo de uma latência um pouco maior e de um custo por token aumentado. Mistral-7B tem desempenho comparável ao Llama-2-7B ou Llama-2-13B, mas está hospedado no Amazon SageMaker. Isso significa que o modelo de precificação é diferente, passando de um modelo de precificação de dólar por token para um modelo de dólar por hora. Isso pode ser mais econômico com uma quantidade significativa de solicitações por hora e um uso consistente em escala. Todos os modelos acima podem funcionar bem em uma variedade de casos de uso, portanto, nossa sugestão é avaliar qual modelo resolve melhor seu problema, considerando as compensações de produção, rendimento e custos.
Se você está procurando uma maneira direta de comparar o comportamento dos modelos, o SageMaker Canvas fornece esse recurso nativamente na forma de comparações de modelos. Você pode selecionar até três modelos diferentes e enviar a mesma consulta para todos eles de uma vez. O SageMaker Canvas obterá as respostas de cada um dos modelos e as mostrará em uma interface de bate-papo lado a lado. Para fazer isso, escolha Comparar e escolha outros modelos para comparar, conforme mostrado abaixo:
Apresentando o streaming de resposta: interações em tempo real e desempenho aprimorado
Um dos principais avanços nesta versão é a introdução de respostas transmitidas. O streaming de respostas proporciona uma experiência mais rica para o usuário e reflete melhor a experiência de chat. Com respostas de streaming, os usuários podem receber feedback instantâneo e integração perfeita em seus aplicativos de chatbot. Isto permite uma experiência mais interativa e responsiva, melhorando o desempenho geral e a satisfação do usuário do chatbot. A capacidade de receber respostas imediatas como um bate-papo cria um fluxo de conversa mais natural e melhora a experiência do usuário.
Com esse recurso, agora você pode interagir com seus modelos de IA em tempo real, recebendo respostas instantâneas e permitindo integração perfeita em uma variedade de aplicativos e fluxos de trabalho. Todos os modelos que podem ser consultados no SageMaker Canvas — do Amazon Bedrock e do SageMaker JumpStart — podem transmitir respostas ao usuário.
Comece hoje mesmo
Esteja você construindo um chatbot, um sistema de recomendação ou um assistente virtual, os modelos Llama 2 e Mistral combinados com respostas transmitidas proporcionam melhor desempenho e interatividade aos seus projetos.
Para usar os recursos mais recentes do SageMaker Canvas, exclua e recrie o aplicativo. Para fazer isso, saia do aplicativo escolhendo Finalizar Sessãoe abra o SageMaker Canvas novamente. Você deverá ver os novos modelos e aproveitar os últimos lançamentos. O logout do aplicativo SageMaker Canvas liberará todos os recursos usados pela instância do espaço de trabalho, evitando assim incorrer em cobranças adicionais não intencionais.
Conclusão
Para começar com as novas respostas transmitidas para os modelos Llama 2 e Mistral no SageMaker Canvas, visite o Console SageMaker e explore a interface intuitiva. Para saber mais sobre como o SageMaker Canvas e a IA generativa podem ajudá-lo a atingir seus objetivos de negócios, consulte Capacite seus usuários empresariais a extrair insights de documentos da empresa usando o Amazon SageMaker Canvas e a IA generativa e Superando desafios comuns de contact centers com IA generativa e Amazon SageMaker Canvas.
Se você quiser saber mais sobre os recursos do SageMaker Canvas e se aprofundar em outros casos de uso de ML, confira as outras postagens disponíveis no Categoria SageMaker Canvas do blog de ML da AWS. Mal podemos esperar para ver os incríveis aplicativos de IA que você criará com esses novos recursos!
Sobre os autores
Davide Gallitelli é arquiteto de soluções especialista sênior em IA/ML. Ele está baseado em Bruxelas e trabalha em estreita colaboração com clientes em todo o mundo que desejam adotar tecnologias de aprendizado de máquina de baixo código/sem código e IA generativa. Ele é desenvolvedor desde muito jovem, começando a programar aos 7 anos. Começou a aprender IA/ML na universidade e se apaixonou por isso desde então.
Dan Sinnreich é gerente de produto sênior na AWS, ajudando a democratizar o aprendizado de máquina com baixo/sem código. Antes da AWS, Dan construiu e comercializou plataformas SaaS empresariais e modelos de séries temporais usados por investidores institucionais para gerenciar riscos e construir portfólios ideais. Fora do trabalho, ele pode ser encontrado jogando hóquei, mergulhando e lendo ficção científica.
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- Fonte: https://aws.amazon.com/blogs/machine-learning/announcing-support-for-llama-2-models-and-streaming-responses-in-amazon-sagemaker-canvas/
- :tem
- :é
- :onde
- $UP
- 100
- 13
- 2021
- 7
- 70
- a
- habilidade
- Sobre
- acima
- Conta
- Alcançar
- Adicional
- adotar
- avanços
- novamente
- contra
- idade
- AI
- Modelos de IA
- Alimentado por AI
- AI / ML
- Todos os Produtos
- permite
- surpreendente
- Amazon
- Amazon Sage Maker
- Tela do Amazon SageMaker
- Amazon Web Services
- entre
- quantidade
- an
- e
- Anunciar
- Anunciando
- respostas
- qualquer
- app
- Aplicação
- aplicações
- SOMOS
- por aí
- AS
- Assistente
- At
- por WhatsApp.
- disponível
- evitando
- AWS
- baseado
- BE
- sido
- abaixo
- Benefícios
- MELHOR
- Melhor
- maior
- bilhão
- Blog
- trazer
- Bruxelas
- construir
- Prédio
- construído
- negócio
- by
- CAN
- lona
- capacidades
- capacidade
- capaz
- casas
- casos
- Centralização de
- desafios
- acusações
- bate-papo
- chatbot
- verificar
- Escolha
- escolha
- de perto
- código
- COERENTE
- combinado
- comum
- comunidade
- Empresa
- comparável
- comparar
- comparado
- comparações
- considerando
- consistente
- construir
- Contacto
- contact center
- conteúdo
- Geração de Conteúdo
- continua
- Conversa
- conversas
- Custo
- crio
- cria
- Clientes
- ponta
- profundo
- mergulho profundo
- democratizar
- Implantação
- desenvolvido
- Developer
- diferente
- discutir
- mergulho
- mergulho
- do
- INSTITUCIONAIS
- cada
- Eficaz
- eficiente
- autorizar
- permitir
- permitindo
- noivando
- aprimorada
- aprimorando
- desfrutar
- Empreendimento
- avaliar
- todos
- animado
- emocionante
- existente
- vasta experiência
- explorar
- extrato
- Caído
- mais rápido
- Característica
- Funcionalidades
- retornos
- Ficção
- Encontre
- encaixa
- fluxo
- Escolha
- formulário
- encontrado
- Foundation
- Francês
- da
- genai
- geralmente
- gerando
- geração
- generativo
- IA generativa
- ter
- globo
- Objetivos
- Ter
- he
- ajudar
- ajuda
- SUA PARTICIPAÇÃO FAZ A DIFERENÇA
- superior
- altamente
- hospedado
- hora
- Como funciona o dobrador de carta de canal
- Contudo
- HTTPS
- Imediato
- melhorado
- melhora
- in
- aumentou
- INFORMAÇÕES
- entrada
- insights
- instância
- instantâneos
- DOCUMENTOS
- investidores institucionais
- integração
- interagir
- interações
- interativo
- interatividade
- Interface
- para dentro
- Introdução
- intuitivo
- Investidores
- IT
- ESTÁ
- jpg
- Chave
- língua
- grande
- Latência
- mais recente
- Ultimas atualizações
- lançamento
- principal
- APRENDER
- aprendizagem
- Line
- lhama
- log
- logging
- procurando
- gosta,
- máquina
- aprendizado de máquina
- fazer
- Fazendo
- gerencia
- Gerente
- maneira
- significativo
- significa
- Menu
- Meta
- ML
- modelo
- modelos
- mais
- em movimento
- nativamente
- natural
- Navegar
- você merece...
- Novo
- Notas
- agora
- número
- of
- Oferece
- on
- uma vez
- ONE
- aberto
- open source
- ideal
- or
- Outros
- A Nossa
- Fora
- saída
- lado de fora
- global
- próprio
- página
- parâmetros
- para
- Realizar
- atuação
- performances
- realização
- fotografia
- plataforma
- Plataformas
- platão
- Inteligência de Dados Platão
- PlatãoData
- jogar
- carteiras
- Publique
- POSTAGENS
- poderoso
- anterior
- preços
- modelo de precificação
- Problema
- Produto
- gerente de produto
- projetos
- fornecer
- fornece
- pergunta
- alcance
- Leitura
- reais
- em tempo real
- receber
- recebido
- receber
- Recomendação
- referir
- reflete
- liberar
- Releases
- Informou
- pedidos
- exige
- Recursos
- resposta
- respostas
- responsivo
- mais rico
- Risco
- SaaS
- sábio
- mesmo
- satisfação
- AMPLIAR
- Escala
- Ciência
- Ficção científica
- desatado
- Vejo
- selecionar
- selecionando
- enviar
- senior
- serviço
- Serviços
- rede de apoio social
- mostrar
- mostrando
- periodo
- desde
- solteiro
- menor
- So
- Soluções
- Resolve
- fonte
- especialista
- Start-up
- começado
- Comece
- estado-da-arte
- franco
- transmitir canais
- fluídas
- de streaming
- tal
- resumir
- ajuda
- suportes
- certo
- .
- Tire
- tarefas
- Tecnologias
- teste
- obrigado
- que
- A
- deles
- Eles
- si mesmos
- então
- assim sendo
- Este
- isto
- três
- emocionado
- Taxa de transferência
- tempo
- vezes
- para
- hoje
- token
- Twice
- dois
- ui
- universidade
- Atualizações
- Uso
- usar
- caso de uso
- usava
- Utilizador
- Experiência do Usuário
- usuários
- utilização
- variedade
- versatilidade
- muito
- Virtual
- assistente virtual
- Visite a
- visual
- esperar
- queremos
- quer
- foi
- Caminho..
- we
- web
- serviços web
- BEM
- qual
- Largo
- Ampla variedade
- precisarão
- de
- sem
- Atividades:
- fluxos de trabalho
- trabalho
- escrever
- escrita
- Vocês
- jovem
- investimentos
- zefirnet