Solicitação de zero e poucos disparos para o modelo de base BloomZ 176B com o SDK JumpStart simplificado do Amazon SageMaker

Republicado por Platão

seguidores: 0

JumpStart do Amazon SageMaker é um hub de aprendizado de máquina (ML) que oferece algoritmos, modelos e soluções de ML. Com o SageMaker JumpStart, os profissionais de ML podem escolher entre uma lista crescente de melhores desempenhos e disponíveis publicamente modelos de fundação (FM) como BLOOM, lhama 2, Falcão-40B, Difusão Estável, OpenLLaMAName, Flan-T5/UL2, ou FMs de Coerente e Luzes ligadas.

Nesta postagem e no caderno que a acompanha, demonstramos como implantar o modelo de fundação BloomZ 176B usando o SDK simplificado do SageMaker Python in JumpStart do Amazon SageMaker como um endpoint e usá-lo para várias tarefas de processamento de linguagem natural (NLP). Você também pode acessar os modelos de fundação através Estúdio Amazon SageMaker. O modelo BloomZ 176B, um dos maiores modelos publicamente disponíveis, é um modelo sintonizado por instrução de última geração que pode executar várias tarefas de NLP de aprendizado de poucos tiros e zero tiros no contexto. O ajuste de instrução é uma técnica que envolve o ajuste fino de um modelo de linguagem em uma coleção de tarefas de NLP usando instruções. Para saber mais sobre ajuste de instrução, consulte Prompt zero-shot para o modelo de fundação Flan-T5 no Amazon SageMaker JumpStart.

O aprendizado zero-shot em PNL permite que um LLM pré-treinado gere respostas para tarefas para as quais não foi especificamente treinado. Nesta técnica, o modelo recebe um texto de entrada e um prompt que descreve a saída esperada do modelo em linguagem natural. O aprendizado zero-shot é usado em uma variedade de tarefas de PNL, como as seguintes:

Texto multilíngue e classificação de sentimentos
Perguntas e respostas multilíngues
Geração de código
Reformulação de parágrafo
Resumo
Raciocínio de senso comum e inferência de linguagem natural
Resposta de perguntas
Classificação de sentenças e sentimentos
Geração de artigos imaginários a partir de um título
Resumindo um título com base em um artigo

O aprendizado de poucos tiros envolve o treinamento de um modelo para executar novas tarefas, fornecendo apenas alguns exemplos. Isso é útil quando dados rotulados limitados estão disponíveis para treinamento. O aprendizado de poucos shows é usado em uma variedade de tarefas, incluindo as seguintes:

Resumo de texto
Geração de código
Reconhecimento de entidade de nome
Resposta de perguntas
Correção gramatical e ortográfica
Descrição e generalização do produto
Classificação de sentenças e sentimentos
Chatbot e IA conversacional
Geração de Tweet
Tradução automática
Classificação de intenção

Sobre a Bloom

O modelo de linguagem BigScience Large Open-science Open-access Multilingual (BLOOM) é um modelo de linguagem grande (LLM) baseado em transformador. O BLOOM é um LLM autorregressivo treinado para continuar o texto a partir de um prompt em grandes quantidades de dados de texto usando recursos computacionais em escala industrial. Como tal, é capaz de produzir um texto coerente que dificilmente se distingue do texto escrito por humanos. O BLOOM também pode ser instruído a executar tarefas de texto para as quais não foi explicitamente treinado, lançando-as como tarefas de geração de texto.

Com seus 176 bilhões de parâmetros, o BLOOM é capaz de gerar texto em 46 linguagens naturais e 13 linguagens de programação. Para quase todos eles, como espanhol, francês e árabe, o BLOOM é o primeiro modelo de idioma com mais de 100 bilhões de parâmetros já criados. Pesquisadores podem baixe, execute e estude o BLOOM para investigar o desempenho e o comportamento de LLMs recentemente desenvolvidos até suas operações internas mais profundas.

Visão geral da solução

Neste post, mostramos como usar o modelo BloomZ 176B sintonizado por instrução de última geração da Abraçando o rosto para geração de texto. Você pode usar o modelo BloomZ 176B com aprendizado de poucos disparos e aprendizado de disparo zero para muitas tarefas de PNL, sem precisar ajustar o modelo. Não há necessidade de treinar um novo modelo porque modelos como o BloomZ 176B têm um número significativo de parâmetros, de modo que podem se adaptar facilmente a muitos contextos sem serem retreinados. O modelo BloomZ 176B foi treinado com uma grande quantidade de dados, tornando-o aplicável para muitas tarefas de uso geral.

O código para todas as etapas desta demonstração está disponível no seguinte caderno.

Ajuste de instrução

O tamanho e a complexidade dos LLMs explodiram nos últimos anos. Os LLMs demonstraram capacidades notáveis no aprendizado da semântica da linguagem natural e na produção de respostas semelhantes às humanas. Muitos LLMs recentes são ajustados com uma técnica poderosa chamada ajuste de instrução, que ajuda o modelo a executar novas tarefas ou gerar respostas para novos prompts sem ajuste fino específico do prompt. Um modelo ajustado por instrução usa sua compreensão de tarefas ou conceitos relacionados para gerar previsões para novos prompts. Como essa técnica não envolve a atualização dos pesos do modelo, ela evita o processo demorado e computacionalmente caro necessário para ajustar um modelo para uma tarefa nova e inédita.

O ajuste de instrução envolve o ajuste fino de um modelo de linguagem em uma coleção de tarefas NLP usando instruções. Nessa técnica, o modelo é treinado para executar tarefas seguindo instruções textuais em vez de conjuntos de dados específicos para cada tarefa. O modelo é ajustado com um conjunto de exemplos de entrada e saída para cada tarefa, permitindo que o modelo generalize para novas tarefas nas quais não foi explicitamente treinado, desde que sejam fornecidos prompts para as tarefas. O ajuste de instrução ajuda a melhorar a precisão e a eficácia dos modelos e é útil em situações em que grandes conjuntos de dados não estão disponíveis para tarefas específicas.

Prompt de engenharia para tarefas de NLP de tiro zero e poucos tiros em modelos BLOOM

Engenharia imediata lida com a criação de prompts de alta qualidade para guiar o modelo em direção às respostas desejadas. Os prompts precisam ser projetados com base na tarefa específica e no conjunto de dados que está sendo usado. O objetivo aqui é fornecer ao modelo as informações necessárias para gerar respostas de alta qualidade, minimizando o ruído. Isso pode envolver palavras-chave, contextos adicionais, perguntas e muito mais.

Um prompt bem projetado pode tornar o modelo mais criativo e generalizado para que ele possa se adaptar facilmente a novas tarefas. Os prompts também podem ajudar a incorporar conhecimento de domínio em tarefas específicas e melhorar a interpretabilidade. A engenharia imediata pode melhorar muito o desempenho dos modelos de aprendizado de tiro zero e poucos tiros. A criação de prompts de alta qualidade requer uma consideração cuidadosa da tarefa em mãos, bem como uma compreensão profunda dos pontos fortes e limitações do modelo.

Na tabela a seguir, o modelo BloomZ 176B é usado para gerar respostas para várias tarefas de NLP de tiro zero e poucos tiros. A primeira coluna mostra a tarefa, a segunda coluna contém o prompt fornecido ao modelo (onde o texto do modelo está em negrito e o texto sem negrito é a entrada de exemplo) e a terceira coluna é a resposta do modelo quando consultado no prompt

Para todas as tarefas a seguir, definimos os hiperparâmetros como 600 para serem os max_length, num_return_sequences, top_k ser 250, top_p para ser 0.95, e sem amostragem.

Tarefa	Solicitar entrada	saída
Tarefas de aprendizado de tiro zero
Texto multilíngue ou classificação de sentimento (chinês para inglês)	一个传奇的开端,一个不灭的神话,这不仅仅是一部电影,而是作为一个走进新时代的标签，永远彪炳史册。Você classificaria a avaliação anterior como positiva, neutra ou negativa?	positivo
Resposta a perguntas multilíngues (inglês para chinês)	Explique-me em chinês tradicional o que é retropropagação	梯度反向传播算法是一种机器学习算法,用于训练人工神经网络.小化损失函数。
Geração de código	Escreva para árvore de busca binária com O(log(n)) complexidade computacional. {code_start}	def pesquisa_binária(a, x): baixo = 0 alto = len(a) – 1 enquanto baixo <= alto: médio = (baixo + alto) // 2 se a[mid] < x: baixo = médio + 1 elif a[mid] > x: alto = médio – 1 outro: retorno no meio retornar -1′ ... outro: retorno no meio retorne baixo' A saída é truncada
Reformulação de parágrafo	A Amazon Web Services (AWS) anunciou nove grandes novas atualizações para sua plataforma de aprendizado de máquina baseada em nuvem, SageMaker. O SageMaker visa fornecer um serviço de aprendizado de máquina que pode ser usado para criar, treinar e implantar modelos de ML para praticamente qualquer caso de uso. Durante a conferência re:Invent deste ano, a AWS fez vários anúncios para melhorar ainda mais os recursos do SageMaker.nnComo você reformularia isso brevemente usando o inglês?,Amazon Web Services (AWS) anunciou nove grandes novas atualizações para sua plataforma de aprendizado de máquina baseada em nuvem, SageMaker. O SageMaker visa fornecer um serviço de aprendizado de máquina que pode ser usado para criar, treinar e implantar modelos de ML para praticamente qualquer caso de uso. Durante a conferência re:Invent deste ano, a AWS fez vários anúncios para melhorar ainda mais os recursos do SageMaker. nA frase acima é muito complicada. Forneça-me uma versão sinônima simplificada composta por várias frases:	Amazon SageMaker recebe uma grande atualização A Amazon Web Services (AWS) anunciou nove grandes novas atualizações para sua plataforma de aprendizado de máquina baseada em nuvem, SageMaker. O SageMaker visa fornecer um serviço de aprendizado de máquina que pode ser usado para criar, treinar e implantar modelos de ML para praticamente qualquer caso de uso
Resumo	O Amazon Comprehend usa o processamento de linguagem natural (NLP) para extrair informações sobre o conteúdo dos documentos. Ele desenvolve insights reconhecendo as entidades, frases-chave, linguagem, sentimentos e outros elementos comuns em um documento. Use o Amazon Comprehend para criar novos produtos com base na compreensão da estrutura dos documentos. Por exemplo, usando o Amazon Comprehend, você pode pesquisar feeds de redes sociais em busca de menções de produtos ou digitalizar todo um repositório de documentos em busca de frases-chave. Você pode acessar os recursos de análise de documentos do Amazon Comprehend usando o console do Amazon Comprehend ou as APIs do Amazon Comprehend. Você pode executar análises em tempo real para pequenas cargas de trabalho ou iniciar trabalhos de análise assíncrona para grandes conjuntos de documentos. Você pode usar os modelos pré-treinados fornecidos pelo Amazon Comprehend ou pode treinar seus próprios modelos personalizados para classificação e reconhecimento de entidade. Todos os recursos do Amazon Comprehend aceitam documentos de texto UTF-8 como entrada. Além disso, a classificação personalizada e o reconhecimento de entidade personalizada aceitam arquivos de imagem, arquivos PDF e arquivos do Word como entrada. O Amazon Comprehend pode examinar e analisar documentos em vários idiomas, dependendo do recurso específico. Para obter mais informações, consulte Idiomas com suporte no Amazon Comprehend. O recurso de idioma dominante do Amazon Comprehend pode examinar documentos e determinar o idioma dominante para uma seleção muito mais ampla de idiomas.nn===nEscreva um resumo do texto anterior em inglês:	O Amazon Comprehend usa o processamento de linguagem natural (NLP) para extrair informações sobre o conteúdo dos documentos. Ele desenvolve insights reconhecendo as entidades, frases-chave, linguagem, sentimentos e outros elementos comuns em um documento. Use o Amazon Comprehend para criar novos produtos com base na compreensão da estrutura dos documentos. Por exemplo, usando o Amazon Comprehend, você pode pesquisar feeds de redes sociais em busca de menções de produtos ou digitalizar todo um repositório de documentos em busca de frases-chave. Você pode acessar os recursos de análise de documentos do Amazon Comprehend usando o console do Amazon Comprehend ou as APIs do Amazon Comprehend. Você pode executar análises em tempo real para pequenas cargas de trabalho ou iniciar trabalhos de análise assíncrona para grandes conjuntos de documentos. Você pode usar os modelos pré-treinados fornecidos pelo Amazon Comprehend ou pode treinar seus próprios modelos personalizados para classificação e reconhecimento de entidade. Todos os recursos do Amazon Comprehend aceitam documentos de texto UTF-8 como entrada. Além disso, a classificação personalizada e o reconhecimento de entidade personalizada aceitam arquivos de imagem, arquivos PDF e arquivos do Word como entrada. O Amazon Comprehend pode examinar e analisar documentos em vários idiomas, dependendo do recurso específico. Para obter mais informações, consulte Idiomas com suporte no Amazon Comprehend. O recurso de idioma dominante do Amazon Comprehend pode examinar documentos e determinar o idioma dominante para uma seleção muito mais ampla de idiomas.
Raciocínio de senso comum e inferência de linguagem natural	Dado que A copa do mundo começou em Los Angeles, Estados Unidos. Segue isso A copa do mundo acontece nos Estados Unidos. Sim ou não?, A copa do mundo começou em Los Angeles, Estados Unidos. Usando apenas a descrição acima e o que você sabe sobre o mundo, é “A copa do mundo acontece nos Estados Unidos” definitivamente correto? Sim ou não?,	Sim
Resposta de perguntas	pergunta: quais são os principais recursos do novo Kindle?nnContexto: O mais novo e inovador Kindle permite que você faça anotações em milhões de livros e documentos, escreva listas e diários e muito mais. Para os leitores que sempre desejaram poder escrever em seus eBooks, o novo Kindle da Amazon permite que eles façam exatamente isso. O Kindle Scribe é o primeiro Kindle para leitura e escrita e permite aos usuários complementar seus livros e documentos com notas, listas e muito mais. Aqui está tudo o que você precisa saber sobre o Kindle Scribe, incluindo perguntas frequentes. O Kindle Scribe facilita a leitura e a escrita como você faria no papel O Kindle Scribe possui uma tela antirreflexo de 10.2 polegadas (a maior de todos os dispositivos Kindle), resolução nítida de 300 ppi e 35 luzes frontais de LED que se ajustam automaticamente ao seu ambiente. Personalize ainda mais sua experiência com luz quente ajustável, tamanhos de fonte, espaçamento entre linhas e muito mais. Ele vem com a Caneta Básica ou a Caneta Premium, que você pode usar para escrever na tela como faria no papel. Eles também se conectam magneticamente ao seu Kindle e nunca precisam ser carregados. A Caneta Premium inclui uma borracha dedicada e um botão de atalho personalizável. O Kindle Scribe tem mais opções de armazenamento de todos os dispositivos Kindle: escolha entre 8 GB, 16 GB ou 32 GB para se adequar ao seu nível de leitura e escrita. nnResposta	faça anotações em milhões de livros e documentos, escreva listas e diários e muito mais
Classificação de sentenças e sentimentos	Revisão: nEste moive é tão grande e mais uma vez nos deslumbra e encantanEsta frase de crítica de filme é negativa ou positiva?nOPÇÕES: n-positivo n-negativo	Positivo
Geração de artigos imaginários com base no título	Função: “Universidade tem novas instalações chegando”nDado o título acima de um artigo imaginário, imagine o artigo.n”””	O projeto de £ 1.2 milhão verá a criação de um novo centro de ensino e aprendizagem na University of the Highlands and Islands (UHI) em Inverness. Ele será construído no local do antigo Inverness College of Commerce. A UHI disse que as novas instalações seriam usadas para ensino e aprendizado, bem como suporte e administração aos alunos. A universidade disse que também seria usado para conferências e eventos. O novo prédio será construído no local do antigo Inverness College of Commerce A universidade disse que o novo prédio será construído no local do antigo Inverness College of Commerce, que foi fechado em 2013. Ele disse que a nova instalação seria usada para ensino e aprendizagem, bem como suporte e administração aos alunos. Também seria usado para conferências e eventos. A UHI disse que a nova instalação será construída no local do antigo Inverness College of Commerce A universidade disse que o novo prédio será construído no local do antigo Inverness College of Commerce, que foi fechado em 2013. Ele disse que a nova instalação seria usada para ensino e aprendizagem, bem como suporte e administração aos alunos. ... Também seria usado para conferências e eventos. A UHI disse que a nova instalação será construída no local da antiga Inverness…
Resumindo um título com base no artigo	'O mais novo e inovador Kindle ainda permite que você faça anotações em milhões de livros e documentos, escreva listas e diários e muito mais. Para os leitores que sempre desejaram poder escrever em seus eBooks, o novo Kindle da Amazon permite que eles façam exatamente isso. O Kindle Scribe é o primeiro Kindle para leitura e escrita e permite aos usuários complementar seus livros e documentos com notas, listas e muito mais. Aqui está tudo o que você precisa saber sobre o Kindle Scribe, incluindo perguntas frequentes. O Kindle Scribe facilita a leitura e a escrita como você faria no papel O Kindle Scribe possui uma tela antirreflexo de 10.2 polegadas (a maior de todos os dispositivos Kindle), resolução nítida de 300 ppi e 35 luzes frontais de LED que se ajustam automaticamente ao seu ambiente. Personalize ainda mais sua experiência com luz quente ajustável, tamanhos de fonte, espaçamento entre linhas e muito mais. Ele vem com a Caneta Básica ou a Caneta Premium, que você pode usar para escrever na tela como faria no papel. Eles também se conectam magneticamente ao seu Kindle e nunca precisam ser carregados. A Caneta Premium inclui uma borracha dedicada e um botão de atalho personalizável. O Kindle Scribe tem mais opções de armazenamento de todos os dispositivos Kindle: escolha entre 8 GB, 16 GB ou 32 GB para se adequar ao seu nível de leitura e escrita. nn nnDê-me um bom título para o artigo acima.	Kindle Scribe da Amazon: tudo o que você precisa saber
Tarefas de aprendizagem de poucos tiros
Resumo	[Original]: Cientistas da Amazon, em colaboração com pesquisadores da Universidade de Sheffield, estão disponibilizando publicamente pela primeira vez um conjunto de dados de verificação e extração de fatos em larga escala. O conjunto de dados, compreendendo mais de 185,000 declarações apoiadas por evidências, está sendo disponibilizado para catalisar a pesquisa e o desenvolvimento que abordam os problemas de extração e verificação de fatos em aplicativos de software ou serviços baseados em nuvem que executam a extração automática de informações. [Resumo]: Pesquisadores da Amazon e da Universidade disponibilizam publicamente um conjunto de dados de extração e verificação de fatos. # # # [Original]: Os membros Prime nos EUA podem receber ainda mais produtos em casa com uma assinatura Prime. Os membros agora podem desfrutar de um ano de Grubhub+ no valor de $ 9.99 por mês gratuitamente - sem nenhum custo adicional à sua assinatura Prime. Para ativar esta oferta, visite amazon.com/grubhub. Esta nova oferta inclui taxas ilimitadas de entrega de comida de $ 0 em pedidos acima de $ 12, bem como vantagens exclusivas para membros do Grubhub + e recompensas como comida grátis e descontos em pedidos. Além disso, os clientes podem “comer bem enquanto fazem o bem” optando pelo programa Donate the Change do Grubhub, uma iniciativa de doação que arrecadou mais de US$ 25 milhões somente em 2021, beneficiando mais de 20 organizações de caridade em todo o país. [Resumo]: Os membros Prime nos EUA podem desfrutar de um ano de Grubhub+ gratuitamente, sem taxas de entrega de comida em pedidos qualificados. # # # [Original]: Cientistas da Amazon, em colaboração com pesquisadores da Universidade de Sheffield, estão disponibilizando publicamente pela primeira vez um conjunto de dados de verificação e extração de fatos em larga escala. O conjunto de dados, compreendendo mais de 185,000 declarações apoiadas por evidências, está sendo disponibilizado para catalisar a pesquisa e o desenvolvimento que abordam os problemas de extração e verificação de fatos em aplicativos de software ou serviços baseados em nuvem que executam a extração automática de informações. [Resumo]:	[Resumo]: Pesquisadores da Amazon e da Universidade disponibilizam publicamente o conjunto de dados de extração e verificação de fatos.
Geração de código	descrição: um botão laranja que diz parar código: Parar # # # descrição: uma caixa azul que contém círculos amarelos com bordas vermelhas código: # # # descrição: uma manchete dizendo Bem-vindo à IA código:	código: Bem-vindo à IA '
Reconhecimento de entidade de nome	[Texto]: Fred é um empreendedor em série. Cofundador e CEO da Platform.sh, ele foi cofundador da Commerce Guys, um fornecedor líder de comércio eletrônico Drupal. Sua missão é garantir que, à medida que continuamos em uma jornada ambiciosa para transformar profundamente a forma como a computação em nuvem é usada e percebida, mantemos nossos pés bem no chão, continuando o rápido crescimento que desfrutamos até agora. [Nome]: Fred [Posição]: Cofundador e CEO [Empresa]: Platform.sh # # # [Texto]: Microsoft (a palavra sendo uma junção de “software de microcomputador”) foi fundada por Bill Gates em 4 de abril de 1975, para desenvolver e vender interpretadores BASIC para o Altair 8800. Steve Ballmer substituiu Gates como CEO em 2000 e, posteriormente, previu uma estratégia de “dispositivos e serviços”. [Nome]: Steve Ballmer [Posição]: CEO [Empresa]: Microsoft # # # [Texto]: Franck Riboud nasceu em 7 de novembro de 1955 em Lyon. Ele é filho de Antoine Riboud, o CEO anterior, que transformou o ex-vidreiro europeu BSN Group em um player líder na indústria de alimentos. Ele é o CEO da Danone. [Nome]: Franck Riboud [Posição]: CEO [Empresa]: Danone # # # [Texto]: David Melvin é um profissional de investimentos e serviços financeiros da CITIC CLSA com mais de 30 anos de experiência em banco de investimento e private equity. Atualmente é Conselheiro Sênior do CITIC CLSA.	[Nome]: Fred [Posição]: Cofundador e CEO [Empresa]: Platform.sh
Resposta de perguntas	Contexto: NLP Cloud foi fundada em 2021, quando a equipe percebeu que não havia uma maneira fácil de alavancar de forma confiável o processamento de linguagem natural na produção. Pergunta: Quando foi fundada a NLP Cloud? Resposta: 2021 # # # Contexto: NLP Cloud desenvolveu sua API em meados de 2020 e eles adicionaram muitos modelos de código aberto pré-treinados desde então. Pergunta: O que o NLP Cloud desenvolveu? Resposta: API # # # Contexto: Todos os planos podem ser interrompidos a qualquer momento. Você só paga pelo tempo que usou o serviço. Em caso de downgrade, você receberá um desconto na próxima fatura. Pergunta: Quando os planos podem ser interrompidos? Resposta: A qualquer hora # # # Contexto: O principal desafio com GPT-J é o consumo de memória. Recomenda-se o uso de um plano de GPU. Pergunta: Qual plano é recomendado para GPT-J? Responder:"""	Resposta: plano de GPU'
Correção gramatical e ortográfica	Eu adoro ir à praia. Correção: eu adoro ir à praia. # # # Deixe-me tê-lo! Correção: Deixe-me tê-lo! # # # Tem muitos inconvenientes. Correção: Tem muitos inconvenientes. # # # eu não quero ir Correção:	Correção: eu não quero ir
Descrição e generalização do produto	Gere uma descrição do produto a partir de palavras-chave. Palavras-chave: sapatos, mulheres, $ 59 Frase: Lindos sapatos femininos ao preço de US$ 59. # # # Palavras-chave: calças, homem, $69 Frase: Calças modernas para homens, por apenas US$ 69. # # # Palavras-chave: luvas, inverno, $19 Frase: Luvas incrivelmente quentes para invernos frios, por US$ 19. # # # Palavras-chave: t-shirt, homem, $39 Frase:	Frase: Camiseta legal para homens, por apenas US$ 39.
Classificação de sentenças e sentimentos	Mensagem: Quando a nave pousou em Marte, toda a humanidade se emocionou Tópico: espaço # # # Mensagem: Adoro jogar tênis e golfe. Estou praticando duas vezes por semana. Tópico: esporte # # # Mensagem: Gerenciar uma equipe de vendas é um trabalho difícil, mas recompensador. Tópico: negócios # # # Mensagem: Estou tentando cozinhar frango com tomate. Tópico:	Tópico: comida
Chatbot e IA conversacional	Esta é uma discussão entre um [humano] e um [robô]. O [robô] é muito legal e empático. [humano]: Olá, prazer em conhecê-lo. [robô]: Prazer em conhecê-lo também. # # # [humano]: Como está indo hoje? [robô]: Nada mal, obrigado! E você? # # # [humano]: Estou bem, mas estou um pouco triste... [robô]: Ah? Porquê isso? # # # [humano]: peguei gripe [robô]:	[robô]: Oh não, lamento ouvir isso!
Geração de Tweet	palavra-chave: mercados tweet: Obtenha feedback da natureza e dos mercados, não das pessoas # # # palavra-chave: crianças tweet: Talvez morramos para podermos voltar como crianças. # # # palavra-chave: startups tweet: As startups não devem se preocupar em como apagar incêndios, elas devem se preocupar em como iniciá-los. # # # palavra-chave: nlp tweet:	tweet: A PNL é uma ferramenta, não um objetivo.
Tradução automática	Hugging Face a revolução da PNL. Tradução: Hugging Face revolucionou a PNL. # # # Cela é incroyable! Tradução: Isso é inacreditável! # # # Désolé je ne peux pas. Tradução: Desculpe, mas não posso. # # # NLP Cloud permite implantar o NLP em facilidade de produção. Tradução:	Tradução: o NLP Cloud facilita a implantação do NLP na produção.
Classificação de intenção	Quero começar a codificar amanhã porque parece ser muito divertido! Intenção: começar a codificar # # # Mostre-me as últimas fotos que você tem, por favor. Intenção: mostrar fotos # # # Pesquise todos esses arquivos o mais rápido possível. Objetivo: pesquisar arquivos # # # Você pode, por favor, me ensinar chinês na próxima semana? Intenção:	Intenção: me ensinar chinês

Acesse o modelo ajustado por instrução BloomZ 176B no SageMaker

O SageMaker JumpStart fornece duas maneiras de começar a usar esses modelos Bloom ajustados por instrução: Estúdio Amazon SageMaker e o SDK do SageMaker. As seções a seguir ilustram a aparência de cada uma dessas opções e como acessá-las.

Acesse o modelo com o SageMaker JumpStart SDK simplificado

A SDK simplificado do SageMaker JumpStart facilita o treinamento e a implantação de modelos SageMaker JumpStart integrados com algumas linhas de código. Isso fornece acesso a toda a biblioteca de modelos SageMaker JumpStart, incluindo os modelos de fundação e modelos de geração de imagem mais recentes, sem a necessidade de fornecer nenhuma entrada além do ID do modelo.

Você pode aproveitar os valores padrão específicos do modelo que fornecemos para especificar a configuração, como a imagem do Docker, tipo de instância de ML, localização do artefato do modelo e hiperparâmetros, entre outros campos. Esses atributos são apenas valores padrão; você pode substituí-los e manter o controle granular sobre os modelos da AWS que você criar. Como resultado dessas mudanças, o esforço para escrever fluxos de trabalho Python para implantar e treinar modelos SageMaker JumpStart foi reduzido, permitindo que você gaste mais tempo nas tarefas importantes. Este recurso está disponível em todas as regiões onde o JumpStart é compatível e pode ser acessado com o SDK Python do SageMaker versão 2.154.0 ou posterior.

Você pode implantar programaticamente um endpoint por meio do SageMaker SDK. Você precisará especificar a ID do modelo desejado no hub de modelos do SageMaker e o tipo de instância usado para implantação. O URI do modelo, que contém o script de inferência, e o URI do contêiner do Docker são obtidos por meio do SageMaker SDK. Esses URIs são fornecidos pelo SageMaker JumpStart e podem ser usados para inicializar um objeto de modelo do SageMaker para implantação.

Implante o modelo e consulte o endpoint

Este notebook requer ipywidgets. Instale os ipywidgets e use a função de execução associada ao bloco de anotações atual como a função da conta da AWS com acesso ao SageMaker.

Escolha o modelo pré-treinado

Nós escolhemos o bloomz-176b-fp16 modelo pré-treinado:

model_id = "huggingface-textgeneration1-bloomz-176b-fp16"

O notebook nas seções a seguir usa BloomZ 176B como um exemplo. Para obter uma lista completa de modelos pré-treinados do SageMaker, consulte Algoritmos integrados com tabela de modelo pré-treinada.

Recupere artefatos e implante um endpoint

Com o SageMaker, podemos realizar inferências no modelo pré-treinado sem ajustá-lo primeiro em um novo conjunto de dados. Começamos recuperando o deploy_image_uri, deploy_source_uri e model_uri para o modelo pré-treinado. Para hospedar o modelo pré-treinado, criamos uma instância de sábio.modelo.modelo e implantá-lo. Isso pode levar alguns minutos.

Agora podemos implantar o modelo usando o SageMaker JumpStart SDK simplificado com as seguintes linhas de código:

from sagemaker.jumpstart.model import JumpStartModel #if no instance for this model id is available, use a smaller id
model = JumpStartModel(model_id=model_id) # ml.p4de.24xlarge is used by default. You can add the kwarg
# instance_type to change this setting.
predictor = model.deploy() endpoint_name = predictor.endpoint_name

Usamos Contêineres de inferência de modelo grande (LMI) do SageMaker para hospedar o modelo BloomZ 176B. O LMI é uma pilha de software LLM (contêiner) criada pela AWS que oferece funções fáceis de usar e ganho de desempenho em modelos generativos de IA. É incorporado com paralelismo de modelo, compilação, quantização e outras pilhas para acelerar a inferência. Para detalhes, consulte Implante BLOOM-176B e OPT-30B no Amazon SageMaker com grande inferência de modelo Deep Learning Containers e DeepSpeed.

Observe que a implantação desse modelo requer uma instância p4de.24xlarge e a implantação geralmente leva cerca de 1 hora. Se você não tiver cota para essa instância, solicite uma criação de cota no console do AWS Service Quotas.

Consulte o endpoint e analise a resposta usando vários parâmetros para controlar o texto gerado

A entrada para o endpoint é qualquer string de texto formatado como JSON e codificado no formato utf-8. A saída do endpoint é um arquivo JSON com texto gerado.

No exemplo a seguir, fornecemos alguns exemplos de texto de entrada. Você pode inserir qualquer texto e o modelo prevê as próximas palavras na sequência. Sequências de texto mais longas podem ser geradas chamando o modelo repetidamente. O código a seguir mostra como invocar um endpoint com estes argumentos:

from sagemaker.predictor import retrieve_default predictor = retrieve_default(model_id=model_id, model_version="*", endpoint_name=endpoint=name)
response = predictor.predict("How to make a pasta?")
print(response["generated_text"])

Obtemos a seguinte saída:

['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']

Acesse o modelo no SageMaker Studio

Você também pode acessar esses modelos através do Página inicial do JumpStart em estúdio. Esta página lista soluções de ML de ponta a ponta disponíveis, modelos pré-treinados e notebooks de exemplo.

No momento da publicação do post, BloomZ 176B está disponível apenas no us-east-2 Região.

Acesse o modelo no SageMaker Studio

Você pode escolher o cartão modelo BloomZ 176B para visualizar o notebook.

escolha a carta modelo BloomZ 176B

Você pode então importar o bloco de anotações para executá-lo ainda mais.

importar o caderno

limpar

Para evitar cobranças contínuas, exclua os pontos de extremidade de inferência do SageMaker. Você pode excluir os endpoints por meio do console do SageMaker ou do bloco de anotações do SageMaker Studio usando os seguintes comandos:

predictor.delete_model()
predictor.delete_endpoint()

Conclusão

Nesta postagem, fornecemos uma visão geral dos benefícios do aprendizado de tiro zero e poucos tiros e descrevemos como a engenharia imediata pode melhorar o desempenho de modelos ajustados por instrução. Também mostramos como implantar facilmente um modelo BloomZ 176B ajustado por instrução do SageMaker JumpStart e fornecemos exemplos para demonstrar como você pode executar diferentes tarefas de NLP usando o endpoint de modelo BloomZ 176B implantado no SageMaker.

Incentivamos você a implantar um modelo BloomZ 176B do SageMaker JumpStart e criar seus próprios prompts para casos de uso de NLP.

Para saber mais sobre o SageMaker JumpStart, confira o seguinte:

Sobre os autores

Rajakumar Sampathkumar é gerente técnico principal de contas da AWS, fornecendo orientação aos clientes sobre o alinhamento de tecnologia de negócios e apoiando a reinvenção de seus modelos e processos de operação em nuvem. Ele é apaixonado por nuvem e aprendizado de máquina. Raj também é especialista em machine learning e trabalha com clientes da AWS para projetar, implantar e gerenciar suas cargas de trabalho e arquiteturas da AWS.

Dr.Xin Huang é um cientista aplicado para algoritmos integrados Amazon SageMaker JumpStart e Amazon SageMaker. Ele se concentra no desenvolvimento de algoritmos de aprendizado de máquina escaláveis. Seus interesses de pesquisa estão na área de processamento de linguagem natural, aprendizado profundo explicável em dados tabulares e análise robusta de agrupamento não paramétrico de espaço-tempo. Ele publicou muitos artigos em conferências ACL, ICDM, KDD e Royal Statistical Society: Series A journal.

Evan Kravitz é engenheiro de software da Amazon Web Services, trabalhando no SageMaker JumpStart. Ele gosta de cozinhar e correr em Nova York.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
PlatãoESG. Automotivo / EVs, Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
ChartPrime. Eleve seu jogo de negociação com ChartPrime. Acesse aqui.
BlockOffsets. Modernizando a Propriedade de Compensação Ambiental. Acesse aqui.
Fonte: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/

Carimbo de hora: 14 de agosto de 2023

Carimbo de hora: 10 de maio de 2023

Republicado por Platão

Acelere a resposta a desastres com visão computacional para imagens de satélite usando Amazon SageMaker e Amazon Augmented AI

Crie um detector de spam de e-mail usando o Amazon SageMaker | Amazon Web Services

Modere, classifique e processe documentos usando o Amazon Rekognition e o Amazon Textract

Preveja preços de imóveis residenciais no ImmoScout24 com o Amazon SageMaker

Melhorando a estabilidade e a flexibilidade dos pipelines de ML na Amazon Packaging Innovation com o Amazon SageMaker Pipelines

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta