Acelere seu aprendizado em direção aos exames de certificação da AWS com geração automatizada de questionários usando modelos do Amazon SageMaker Foundations

Republicado por Platão

seguidores: 0

A obtenção da certificação AWS pode ajudá-lo a impulsionar sua carreira, esteja você procurando uma nova função, mostre suas habilidades para assumir um novo projeto ou torne-se o principal especialista de sua equipe. E como os exames da AWS Certification são criados por especialistas na função ou área técnica relevante, a preparação para um desses exames ajuda você a desenvolver as habilidades necessárias identificadas por profissionais qualificados na área.

Ler a página de perguntas frequentes dos serviços da AWS relevantes para seu exame de certificação é importante para adquirir uma compreensão mais profunda do serviço. No entanto, isso pode levar algum tempo. A leitura das perguntas frequentes de até mesmo um serviço pode levar meio dia para ser lida e compreendida. Por exemplo, o Amazon Sage Maker O FAQ contém cerca de 33 páginas (impressas) de conteúdo apenas no SageMaker.

Não seria uma experiência de aprendizado mais fácil e divertida se você pudesse usar um sistema para se testar nas páginas de perguntas frequentes do serviço AWS? Na verdade, você pode desenvolver tal sistema usando modelos de linguagem de última geração e algumas linhas de Python.

Nesta postagem, apresentamos um guia abrangente de implantação de uma solução de questionário de múltipla escolha para as páginas de perguntas frequentes de qualquer serviço da AWS, com base no modelo de fundação AI21 Jurassic-2 Jumbo Instruct em Início rápido do Amazon SageMaker.

Modelos de grande linguagem

Nos últimos anos, os modelos de linguagem tiveram um grande aumento em tamanho e popularidade. Em 2018, BERT-large fez sua estreia com seus 340 milhões de parâmetros e arquitetura de transformador inovadora, estabelecendo a referência para desempenho em tarefas de NLP. Em poucos anos, o estado da arte em termos de tamanho do modelo aumentou mais de 500 vezes; O GPT-3 e o Bloom 176 B da OpenAI, ambos com 175 bilhões de parâmetros, e o AI21 Jurassic-2 Jumbo Instruct com 178 bilhões de parâmetros são apenas três exemplos de modelos de linguagem grande (LLMs) elevando o nível de precisão do processamento de linguagem natural (NLP).

Modelos de fundação do SageMaker

O SageMaker fornece uma variedade de modelos de hubs de modelos populares, incluindo Hugging Face, PyTorch Hub e TensorFlow Hub, e modelos proprietários de AI21, Cohere e LightOn, que você pode acessar em seu fluxo de trabalho de desenvolvimento de aprendizado de máquina (ML) no SageMaker. Avanços recentes em ML deram origem a uma nova classe de modelos conhecida como modelos de fundação, que têm bilhões de parâmetros e são treinados em grandes quantidades de dados. Esses modelos de base podem ser adaptados a uma ampla variedade de casos de uso, como resumo de texto, geração de arte digital e tradução de idiomas. Como esses modelos podem ser caros para treinar, os clientes desejam usar modelos de fundação pré-treinados existentes e ajustá-los conforme necessário, em vez de treinar esses modelos por conta própria. O SageMaker fornece uma lista selecionada de modelos que você pode escolher no console do SageMaker.

Com o JumpStart, você pode encontrar modelos de fundação de diferentes fornecedores, permitindo que você comece a usar os modelos de fundação rapidamente. Você pode revisar as características do modelo e os termos de uso e experimentar esses modelos usando um widget de interface do usuário de teste. Quando estiver pronto para usar um modelo de base em escala, você poderá fazer isso facilmente sem sair do SageMaker usando notebooks pré-construídos de fornecedores de modelos. Seus dados, sejam usados para avaliar ou usar o modelo em escala, nunca são compartilhados com terceiros porque os modelos são hospedados e implantados na AWS.

Instrução Jumbo AI21 Jurássico-2

Jurassic-2 Jumbo Instruct é um LLM da AI21 Labs que pode ser aplicado a qualquer tarefa de compreensão ou geração de linguagem. Ele é otimizado para seguir instruções e contexto de linguagem natural, portanto, não há necessidade de fornecer exemplos. O endpoint vem pré-carregado com o modelo e pronto para atender consultas por meio de uma API fácil de usar e do Python SDK, para que você possa começar a trabalhar. Jurassic-2 Jumbo Instruct é um dos melhores alunos do LEME, principalmente em tarefas relacionadas à leitura e escrita.

Visão geral da solução

Nas seções a seguir, passamos pelas etapas para testar o modelo de instrução Jurassic-2 Jumbo no SageMaker:

Escolha o modelo de instrução Jurassic-2 Jumbo no console do SageMaker.
Avalie o modelo usando o playground.
Use um notebook associado ao modelo de base para implantá-lo em seu ambiente.

Acesse o Jurassic-2 Jumbo Instruct por meio do console do SageMaker

A primeira etapa é fazer login no console do SageMaker. Sob Acelerador no painel de navegação, escolha modelos de fundação para solicitar acesso à lista de modelos.

Modelos da Fundação SageMaker

Depois que sua conta for listada como permitida, você poderá ver uma lista de modelos nesta página e procurar o modelo Jurassic-2 Jumbo Instruct.

Avalie o modelo Jurassic-2 Jumbo Instruct no playground modelo

Na lista AI21 Jurassic-2 Jumbo Instruct, escolha Ver Modelo. Você verá uma descrição do modelo e as tarefas que você pode executar. Leia o EULA do modelo antes de prosseguir.

Vamos primeiro experimentar o modelo para gerar um teste com base na página de perguntas frequentes do SageMaker. Navegue até o Playground aba.

No Playground guia, você pode fornecer prompts de amostra para o modelo Jurassic-2 Jumbo Instruct e visualizar a saída.

AI21 Jurassic-2 Jumbo Instruct - escolha o playground

Observe que você pode usar no máximo 500 tokens. Definimos o comprimento máximo para 500, que é o número máximo de tokens a serem gerados. Este modelo tem uma janela de contexto de 8,192 tokens (o comprimento do prompt mais a conclusão deve ser de no máximo 8,192 tokens).

Para facilitar a visualização do prompt, você pode ampliar o Prompt caixa.

AI21 Jurassic-2 Jumbo Instruct - configurar playground

Como podemos usar no máximo 500 tokens, pegamos uma pequena parte do Página de perguntas frequentes do Amazon SageMaker, ML de baixo código seção, para nosso prompt de teste.

Usamos o seguinte prompt:

Below is SageMaker Low-code ML FAQ: ##
Q: Will my data (from inference or training) be used or shared to update the base model that is offered to customers using Amazon SageMaker JumpStart?
No. Your inference and training data will not be used nor shared to update or train the base model that SageMaker JumpStart surfaces to customers. Q: Can I see the model weights and scripts of proprietary models in preview with Amazon SageMaker JumpStart?
No. Proprietary models do not allow customers to view model weights and scripts. Q: Which open-source models are supported with Amazon SageMaker JumpStart?
Amazon SageMaker JumpStart includes 150+ pre-trained open-source models from PyTorch Hub and TensorFlow Hub. For vision tasks such as image classification and object detection, you can use models such as ResNet, MobileNet, and Single-Shot Detector (SSD). For text tasks such as sentence classification, text classification, and question answering, you can use models such as BERT, RoBERTa, and DistilBERT. Q: What solutions come pre-built with Amazon SageMaker JumpStart?
SageMaker JumpStart includes solutions that are preconfigured with all necessary AWS services to launch a solution into production. Solutions are fully customizable so you can easily modify them to fit your specific use case and dataset. You can use solutions for over 15 use cases including demand forecasting, fraud detection, and predictive maintenance, and readily deploy solutions with just a few clicks. For more information about all solutions available, visit the SageMaker getting started page. Q: What built-in algorithms are supported in Amazon SageMaker Autopilot?
Amazon SageMaker Autopilot supports 2 built-in algorithms: XGBoost and Linear Learner. Q: Can I stop an Amazon SageMaker Autopilot job manually?
Yes. You can stop a job at any time. When an Amazon SageMaker Autopilot job is stopped, all ongoing trials will be stopped and no new trial will be started.
## Create a multiple choice quiz on the topic of SageMaker Low-code ML FAQ consisting of 4 questions. Each question should have 4 options. Also include the correct answer for each question using the starting string 'Correct Answer:`

A engenharia de prompt é um processo iterativo. Você deve ser claro e específico e dar ao modelo tempo para pensar.

Aqui especificamos o contexto com ## como sequências de parada, que sinalizam ao modelo para parar de gerar depois que esse caractere ou string é gerado. É útil ao usar um prompt de poucos disparos.

Below is SageMaker Low-code ML FAQ: ##
<SageMaker Low-code ML FAQ content>
##

Em seguida, somos claros e muito específicos em nosso prompt, solicitando um questionário de múltipla escolha, composto por quatro questões com quatro opções. Pedimos ao modelo para incluir a resposta correta para cada pergunta usando a string inicial 'Correct Answer:' para que possamos analisá-lo mais tarde usando Python:

Create a multiple choice quiz on the topic of SageMaker Low-code ML FAQ consisting of 4 questions. Each question should have 4 options. Also include the correct answer for each question using the starting string 'Correct Answer:`

Um prompt bem projetado pode tornar o modelo mais criativo e generalizado para que ele possa se adaptar facilmente a novas tarefas. Os prompts também podem ajudar a incorporar conhecimento de domínio em tarefas específicas e melhorar a interpretabilidade. A engenharia imediata pode melhorar muito o desempenho dos modelos de aprendizado de tiro zero e poucos tiros. A criação de prompts de alta qualidade requer uma consideração cuidadosa da tarefa em mãos, bem como uma compreensão profunda dos pontos fortes e limitações do modelo.

No escopo deste post, não cobrimos mais essa ampla área.

Copie o prompt e insira-o no Prompt caixa, em seguida, escolha Gerar texto.

AI21 Jurassic-2 Jumbo Instruct - entrada imediata

Isso envia o prompt para o modelo Jurassic-2 Jumbo Instruct para inferência. Observe que a experimentação no playground é gratuita.

Acelere seu aprendizado para os exames da AWS Certification com geração automatizada de questionários usando modelos básicos do Amazon SageMaker | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Lembre-se também de que, apesar da natureza de ponta dos LLMs, eles ainda são propensos a preconceitos, erros e alucinações.

Depois de ler a saída do modelo completa e cuidadosamente, podemos ver que o modelo gerou um bom questionário!

Depois de brincar com o modelo, é hora de usar o notebook e implantá-lo como um endpoint em seu ambiente. Usamos uma pequena função Python para analisar a saída e simular um teste interativo.

Implante o modelo de base Jurassic-2 Jumbo Instruct a partir de um notebook

Você pode usar o seguinte caderno de amostra para implantar o Jurassic-2 Jumbo Instruct usando o SageMaker. Observe que este exemplo usa uma instância ml.p4d.24xlarge. Se o limite padrão para sua conta da AWS for 0, você precisará solicitar aumento de limite para esta instância de GPU.

Vamos criar o endpoint usando a inferência do SageMaker. Primeiro, definimos as variáveis necessárias e, em seguida, implantamos o modelo do pacote de modelos:

endpoint_name = "j2-jumbo-instruct" content_type = "application/json" real_time_inference_instance_type = ( "ml.p4d.24xlarge"
) # create a deployable model from the model package.
model = ModelPackage(
role=role, model_package_arn=model_package_arn, sagemaker_session=sagemaker_session
) # Deploy the model
predictor = model.deploy(1, real_time_inference_instance_type, endpoint_name=endpoint_name,
model_data_download_timeout=3600,
container_startup_health_check_timeout=600,
)

Após a implantação do endpoint, você pode executar consultas de inferência no modelo.

Após a implantação do modelo, você pode interagir com o endpoint implantado usando o seguinte trecho de código:

response = ai21.Completion.execute(sm_endpoint=endpoint_name,
prompt=instruction,
maxTokens=2048,
temperature=0.7,
numResults=1,
stopSequences=['##']) output = response['completions'][0]['data']['text']

Com o modelo de base Jurassic-2 Jumbo Instruct implantado em um endpoint SageMaker de instância ml.p4d.24xlarge, você pode usar um prompt com 4,096 tokens. Você pode seguir o mesmo prompt que usamos no playground e adicionar muitas outras perguntas. Neste exemplo, adicionamos todo o FAQ ML de baixo código seção como contexto no prompt.

Saída do prompt de terminal AI21 Jurassic-2 Jumbo Instruct

Podemos ver o resultado do modelo, que gerou um questionário de múltipla escolha com quatro questões e quatro opções para cada questão.

Agora você pode desenvolver uma função Python para analisar a saída e criar um questionário interativo de múltipla escolha.

É bastante simples desenvolver tal função com algumas linhas de código. Você pode analisar a resposta facilmente porque o modelo criou uma linha com “Resposta correta: ” para cada pergunta, exatamente como solicitamos no prompt. Não fornecemos o código Python para a geração do questionário no escopo desta postagem.

Executar o questionário no notebook

Usando a função Python que criamos anteriormente e a saída do modelo de base Jurassic-2 Jumbo Instruct, executamos o questionário interativo no notebook.

Terminal AI21 Jurassic-2 Jumbo Instruct - faça um teste

Você pode ver que respondi três das quatro perguntas corretamente e obtive uma nota de 75%. Talvez eu precise ler o FAQ do SageMaker mais algumas vezes!

limpar

Depois de experimentar o endpoint, certifique-se de remover o endpoint de inferência do SageMaker e o modelo para evitar cobranças:

model.sagemaker_session.delete_endpoint(endpoint_name)
model.sagemaker_session.delete_endpoint_config(endpoint_name) model.delete_model()

Conclusão

Nesta postagem, mostramos como você pode testar e usar o modelo Jurassic-21 Jumbo Instruct do AI2 usando o SageMaker para criar um sistema automatizado de geração de questionários. Isso foi obtido usando um prompt bastante simples com o texto de uma página de perguntas frequentes do SageMaker disponível publicamente incorporado e algumas linhas de código Python.

Semelhante a este exemplo mencionado na postagem, você pode personalizar um modelo de base para o seu negócio com apenas alguns exemplos rotulados. Como todos os dados são criptografados e não saem de sua conta da AWS, você pode confiar que seus dados permanecerão privados e confidenciais.

Solicite acesso a experimente o modelo de fundação no SageMaker hoje e deixe-nos saber seus comentários!

Sobre o autor

Eitan Sela é um arquiteto de soluções especialista em aprendizado de máquina da Amazon Web Services. Ele trabalha com clientes da AWS para fornecer orientação e assistência técnica, ajudando-os a criar e operar soluções de machine learning na AWS. Em seu tempo livre, Eitan gosta de correr e ler os artigos mais recentes de aprendizado de máquina.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoAiStream. Inteligência de Dados Web3. Conhecimento Amplificado. Acesse aqui.
Cunhando o Futuro com Adryenn Ashley. Acesse aqui.
Compre e venda ações em empresas PRE-IPO com PREIPO®. Acesse aqui.
Fonte: https://aws.amazon.com/blogs/machine-learning/accelerate-your-learning-towards-aws-certification-exams-with-automated-quiz-generation-using-amazon-sagemaker-foundations-models/

Carimbo de hora: 31 de maio de 2023

Carimbo de hora: 19 de abril, 2023

Republicado por Platão

Conferência de Ciência de Dados da Universidade de São Francisco 2023 Datathon em parceria com AWS e Amazon SageMaker Studio Lab | Amazon Web Services

Personalize seus resultados de pesquisa com a integração do Amazon Personalize e do Amazon OpenSearch Service | Amazon Web Services

Configure um projeto de resumo de texto com Hugging Face Transformers: Parte 2

Prepare dados mais rapidamente com snippets de código PySpark e Altair no Amazon SageMaker Data Wrangler

Integre plataformas SaaS com o Amazon SageMaker para habilitar aplicativos baseados em ML | Amazon Web Services

Como o Sportradar usou a Deep Java Library para criar plataformas de ML em escala de produção para aumentar o desempenho e a eficiência

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta