Anunciando suporte para modelos Llama 2 e Mistral e respostas de streaming no Amazon SageMaker Canvas

Republicado por Platão

seguidores: 0

Lançado em 2021, Tela do Amazon SageMaker é um serviço visual de apontar e clicar para criar e implantar modelos de aprendizado de máquina (ML) sem a necessidade de escrever nenhum código. Modelos básicos (FMs) prontos para uso disponíveis no SageMaker Canvas permitem que os clientes usem IA generativa para tarefas como geração e resumo de conteúdo.

Temos o prazer de anunciar as atualizações mais recentes do Amazon SageMaker Canvas, que trazem novos recursos de IA generativa para a plataforma. Com suporte para os modelos Meta Llama 2 e Mistral.AI e o lançamento de respostas de streaming, o SageMaker Canvas continua a capacitar todos que desejam começar com IA generativa sem escrever uma única linha de código. Nesta postagem, discutimos essas atualizações e seus benefícios.

Apresentando os modelos Meta Llama 2 e Mistral

Llama 2 é um modelo básico de ponta da Meta que oferece escalabilidade e versatilidade aprimoradas para uma ampla gama de tarefas generativas de IA. Os usuários relataram que o Llama 2 é capaz de se envolver em conversas significativas e coerentes, gerando novos conteúdos e extraindo respostas de notas existentes. Llama 2 está entre os grandes modelos de linguagem (LLMs) de última geração disponíveis hoje para a comunidade de código aberto construir seus próprios aplicativos baseados em IA.

Mistral.AI, uma start-up francesa líder em IA, desenvolveu o Mistral 7B, um poderoso modelo de linguagem com 7.3 bilhões de parâmetros. Os modelos Mistral foram muito bem recebidos pela comunidade de código aberto graças ao uso de atenção de consulta agrupada (GQA) para inferência mais rápida, tornando-os altamente eficientes e com desempenho comparável ao modelo com duas ou três vezes o número de parâmetros.

Hoje, temos o prazer de anunciar que o SageMaker Canvas agora oferece suporte a três variantes do modelo Llama 2 e duas variantes do Mistral 7B:

Anunciando suporte para modelos Llama 2 e Mistral e respostas de streaming no Amazon SageMaker Canvas | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Para testar esses modelos, navegue até o SageMaker Canvas Modelos prontos para uso página e, em seguida, escolha Gerar, extrair e resumir conteúdo. É aqui que você encontrará a experiência de bate-papo do SageMaker Canvas GenAI. Aqui, você pode usar qualquer modelo do Amazon Bedrock ou SageMaker JumpStart selecionando-os no menu suspenso do modelo.

No nosso caso, escolhemos um dos modelos Llama 2. Agora você pode fornecer sua opinião ou consulta. À medida que você envia a entrada, o SageMaker Canvas encaminha sua entrada para o modelo.

Anunciando suporte para modelos Llama 2 e Mistral e respostas de streaming no Amazon SageMaker Canvas | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Escolher qual dos modelos disponíveis no SageMaker Canvas se adapta melhor ao seu caso de uso exige que você leve em consideração informações sobre os próprios modelos: o modelo Llama-2-70B-chat é um modelo maior (70 bilhões de parâmetros, em comparação com 13 bilhões com Llama-2-13B-chat ), o que significa que seu desempenho é geralmente superior ao menor, ao custo de uma latência um pouco maior e de um custo por token aumentado. Mistral-7B tem desempenho comparável ao Llama-2-7B ou Llama-2-13B, mas está hospedado no Amazon SageMaker. Isso significa que o modelo de precificação é diferente, passando de um modelo de precificação de dólar por token para um modelo de dólar por hora. Isso pode ser mais econômico com uma quantidade significativa de solicitações por hora e um uso consistente em escala. Todos os modelos acima podem funcionar bem em uma variedade de casos de uso, portanto, nossa sugestão é avaliar qual modelo resolve melhor seu problema, considerando as compensações de produção, rendimento e custos.

Se você está procurando uma maneira direta de comparar o comportamento dos modelos, o SageMaker Canvas fornece esse recurso nativamente na forma de comparações de modelos. Você pode selecionar até três modelos diferentes e enviar a mesma consulta para todos eles de uma vez. O SageMaker Canvas obterá as respostas de cada um dos modelos e as mostrará em uma interface de bate-papo lado a lado. Para fazer isso, escolha Comparar e escolha outros modelos para comparar, conforme mostrado abaixo:

Anunciando suporte para modelos Llama 2 e Mistral e respostas de streaming no Amazon SageMaker Canvas | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Apresentando o streaming de resposta: interações em tempo real e desempenho aprimorado

Um dos principais avanços nesta versão é a introdução de respostas transmitidas. O streaming de respostas proporciona uma experiência mais rica para o usuário e reflete melhor a experiência de chat. Com respostas de streaming, os usuários podem receber feedback instantâneo e integração perfeita em seus aplicativos de chatbot. Isto permite uma experiência mais interativa e responsiva, melhorando o desempenho geral e a satisfação do usuário do chatbot. A capacidade de receber respostas imediatas como um bate-papo cria um fluxo de conversa mais natural e melhora a experiência do usuário.

Com esse recurso, agora você pode interagir com seus modelos de IA em tempo real, recebendo respostas instantâneas e permitindo integração perfeita em uma variedade de aplicativos e fluxos de trabalho. Todos os modelos que podem ser consultados no SageMaker Canvas — do Amazon Bedrock e do SageMaker JumpStart — podem transmitir respostas ao usuário.

Comece hoje mesmo

Esteja você construindo um chatbot, um sistema de recomendação ou um assistente virtual, os modelos Llama 2 e Mistral combinados com respostas transmitidas proporcionam melhor desempenho e interatividade aos seus projetos.

Para usar os recursos mais recentes do SageMaker Canvas, exclua e recrie o aplicativo. Para fazer isso, saia do aplicativo escolhendo Finalizar Sessãoe abra o SageMaker Canvas novamente. Você deverá ver os novos modelos e aproveitar os últimos lançamentos. O logout do aplicativo SageMaker Canvas liberará todos os recursos usados pela instância do espaço de trabalho, evitando assim incorrer em cobranças adicionais não intencionais.

Anunciando suporte para modelos Llama 2 e Mistral e respostas de streaming no Amazon SageMaker Canvas | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Conclusão

Para começar com as novas respostas transmitidas para os modelos Llama 2 e Mistral no SageMaker Canvas, visite o Console SageMaker e explore a interface intuitiva. Para saber mais sobre como o SageMaker Canvas e a IA generativa podem ajudá-lo a atingir seus objetivos de negócios, consulte Capacite seus usuários empresariais a extrair insights de documentos da empresa usando o Amazon SageMaker Canvas e a IA generativa e Superando desafios comuns de contact centers com IA generativa e Amazon SageMaker Canvas.

Se você quiser saber mais sobre os recursos do SageMaker Canvas e se aprofundar em outros casos de uso de ML, confira as outras postagens disponíveis no Categoria SageMaker Canvas do blog de ML da AWS. Mal podemos esperar para ver os incríveis aplicativos de IA que você criará com esses novos recursos!

Sobre os autores

Davide Gallitelli é arquiteto de soluções especialista sênior em IA/ML. Ele está baseado em Bruxelas e trabalha em estreita colaboração com clientes em todo o mundo que desejam adotar tecnologias de aprendizado de máquina de baixo código/sem código e IA generativa. Ele é desenvolvedor desde muito jovem, começando a programar aos 7 anos. Começou a aprender IA/ML na universidade e se apaixonou por isso desde então.

Dan Sinnreich é gerente de produto sênior na AWS, ajudando a democratizar o aprendizado de máquina com baixo/sem código. Antes da AWS, Dan construiu e comercializou plataformas SaaS empresariais e modelos de séries temporais usados por investidores institucionais para gerenciar riscos e construir portfólios ideais. Fora do trabalho, ele pode ser encontrado jogando hóquei, mergulhando e lendo ficção científica.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
Fonte: https://aws.amazon.com/blogs/machine-learning/announcing-support-for-llama-2-models-and-streaming-responses-in-amazon-sagemaker-canvas/

Carimbo de hora: 5 de fevereiro de 2024

Anunciando suporte para modelos Llama 2 e Mistral e respostas de streaming no Amazon SageMaker Canvas | Amazon Web Services

Republicado por Platão

Apresentando os modelos Meta Llama 2 e Mistral

Apresentando o streaming de resposta: interações em tempo real e desempenho aprimorado

Comece hoje mesmo

Conclusão

Sobre os autores

Mais de Aprendizado de máquina da AWS

Apresentando a classificação em uma etapa e o reconhecimento de entidades com o Amazon Comprehend para processamento inteligente de documentos

Acelere sua carreira com habilidades de ML por meio da bolsa AWS Machine Learning Engineer

O modelo de fundação AI21 Jurassic-1 já está disponível no Amazon SageMaker

Tecnologia da Nuvem AWS para detecção de anomalias cardíacas quase em tempo real usando dados de dispositivos vestíveis

Os novos recursos do Amazon HealthLake permitem soluções de imagem de última geração e análises de saúde de precisão

Acelere fluxos de trabalho multilíngues com uma solução de tradução personalizável criada com o Amazon Translate

Use o Snowflake como fonte de dados para treinar modelos de ML com o Amazon SageMaker

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta