Accelera il tuo apprendimento verso gli esami di certificazione AWS con la generazione automatizzata di quiz utilizzando i modelli Amazon SageMaker Foundations

Ripubblicato da Platone

Seguaci: 0

Ottenere la certificazione AWS può aiutarti a dare slancio alla tua carriera, sia che tu stia cercando di trovare un nuovo ruolo, mostrare le tue capacità per affrontare un nuovo progetto o diventare l'esperto di riferimento del tuo team. E poiché gli esami di certificazione AWS sono creati da esperti nel ruolo o nell'area tecnica pertinente, la preparazione per uno di questi esami ti aiuta a sviluppare le competenze richieste identificate da professionisti qualificati nel settore.

Leggere la pagina delle FAQ dei servizi AWS rilevanti per il tuo esame di certificazione è importante per acquisire una comprensione più approfondita del servizio. Tuttavia, questo potrebbe richiedere del tempo. La lettura delle FAQ anche di un solo servizio può richiedere mezza giornata per essere letta e compresa. Ad esempio, il Amazon Sage Maker FAQ contiene circa 33 pagine (stampate) di contenuti solo su SageMaker.

Non sarebbe un'esperienza di apprendimento più semplice e divertente se potessi utilizzare un sistema per metterti alla prova sulle pagine delle FAQ del servizio AWS? In realtà, puoi sviluppare un sistema del genere usando modelli di linguaggio all'avanguardia e poche righe di Python.

In questo post, presentiamo una guida completa per la distribuzione di una soluzione di quiz a scelta multipla per le pagine delle domande frequenti di qualsiasi servizio AWS, basata sul modello di base AI21 Jurassic-2 Jumbo Instruct su Avviamento di Amazon SageMaker.

Grandi modelli linguistici

Negli ultimi anni, i modelli linguistici hanno visto un enorme aumento di dimensioni e popolarità. Nel 2018, BERT-large ha fatto il suo debutto con i suoi 340 milioni di parametri e l'innovativa architettura del trasformatore, stabilendo il punto di riferimento per le prestazioni nelle attività di PNL. In pochi anni, lo stato dell'arte in termini di dimensioni del modello è aumentato di oltre 500 volte; GPT-3 e Bloom 176 B di OpenAI, entrambi con 175 miliardi di parametri, e AI21 Jurassic-2 Jumbo Instruct con 178 miliardi di parametri sono solo tre esempi di modelli di linguaggio di grandi dimensioni (LLM) che alzano il livello dell'accuratezza dell'elaborazione del linguaggio naturale (NLP).

Modelli di fondazione SageMaker

SageMaker fornisce una gamma di modelli da hub di modelli popolari tra cui Hugging Face, PyTorch Hub e TensorFlow Hub e modelli proprietari da AI21, Cohere e LightOn, a cui puoi accedere all'interno del tuo flusso di lavoro di sviluppo di machine learning (ML) in SageMaker. I recenti progressi nel machine learning hanno dato origine a una nuova classe di modelli noti come modelli di fondazione, che hanno miliardi di parametri e vengono addestrati su enormi quantità di dati. Questi modelli di base possono essere adattati a un'ampia gamma di casi d'uso, come il riepilogo del testo, la generazione di arte digitale e la traduzione linguistica. Poiché questi modelli possono essere costosi da addestrare, i clienti desiderano utilizzare i modelli di base pre-addestrati esistenti e perfezionarli secondo necessità, piuttosto che addestrare questi modelli da soli. SageMaker fornisce un elenco curato di modelli tra cui puoi scegliere sulla console SageMaker.

Con JumpStart, puoi trovare modelli di base di diversi fornitori, consentendoti di iniziare rapidamente con i modelli di base. Puoi esaminare le caratteristiche del modello e i termini di utilizzo e provare questi modelli utilizzando un widget dell'interfaccia utente di prova. Quando sei pronto per utilizzare un modello di base su larga scala, puoi farlo facilmente senza uscire da SageMaker utilizzando i notebook predefiniti dei fornitori di modelli. I tuoi dati, siano essi utilizzati per la valutazione o per l'utilizzo del modello su larga scala, non vengono mai condivisi con terze parti perché i modelli sono ospitati e distribuiti su AWS.

AI21 Jurassic-2 Jumbo Istruzione

Jurassic-2 Jumbo Instruct è un LLM di AI21 Labs che può essere applicato a qualsiasi attività di comprensione o generazione della lingua. È ottimizzato per seguire le istruzioni e il contesto del linguaggio naturale, quindi non è necessario fornire esempi. L'endpoint viene fornito precaricato con il modello ed è pronto per servire le query tramite un'API di facile utilizzo e Python SDK, in modo da poter iniziare subito. Jurassic-2 Jumbo Instruct è uno dei migliori in HELM, in particolare nelle attività relative alla lettura e alla scrittura.

Panoramica della soluzione

Nelle sezioni seguenti, esaminiamo i passaggi per testare il modello Jurassic-2 Jumbo instruct in SageMaker:

Scegli il modello di istruzioni Jurassic-2 Jumbo sulla console SageMaker.
Valuta il modello usando il playground.
Usa un notebook associato al modello di base per distribuirlo nel tuo ambiente.

Accedi a Jurassic-2 Jumbo Instruct tramite la console SageMaker

Il primo passo è accedere alla console SageMaker. Sotto inizio di salto nel pannello di navigazione, scegli Modelli di fondazione per richiedere l'accesso all'elenco dei modelli.

Modelli di base SageMaker

Dopo che il tuo account è stato autorizzato nell'elenco, puoi visualizzare un elenco di modelli in questa pagina e cercare il modello Jurassic-2 Jumbo Instruct.

Valuta il modello Jurassic-2 Jumbo Instruct nel parco giochi modello

Nell'elenco AI21 Jurassic-2 Jumbo Instruct, scegli Vedi il modello. Vedrai una descrizione del modello e le attività che puoi eseguire. Leggere l'EULA per il modello prima di procedere.

Proviamo prima il modello per generare un test basato sulla pagina delle domande frequenti di SageMaker. Naviga verso il Parco giochi scheda.

Sulla Parco giochi scheda, puoi fornire prompt di esempio al modello Jurassic-2 Jumbo Instruct e visualizzare l'output.

AI21 Jurassic-2 Jumbo Instruct: scegli il parco giochi

Tieni presente che puoi utilizzare un massimo di 500 token. Impostiamo la lunghezza massima su 500, che è il numero massimo di token da generare. Questo modello ha una finestra di contesto di 8,192 token (la lunghezza del prompt più il completamento dovrebbe essere al massimo di 8,192 token).

Per facilitare la visualizzazione del prompt, è possibile ingrandire il file Richiesta scatola.

AI21 Jurassic-2 Jumbo Instruct - configura il playground

Poiché possiamo utilizzare un massimo di 500 token, prendiamo una piccola parte del Pagina delle domande frequenti su Amazon SageMaker, le ML a basso codice sezione, per il nostro prompt di prova.

Usiamo il seguente prompt:

Below is SageMaker Low-code ML FAQ: ##
Q: Will my data (from inference or training) be used or shared to update the base model that is offered to customers using Amazon SageMaker JumpStart?
No. Your inference and training data will not be used nor shared to update or train the base model that SageMaker JumpStart surfaces to customers. Q: Can I see the model weights and scripts of proprietary models in preview with Amazon SageMaker JumpStart?
No. Proprietary models do not allow customers to view model weights and scripts. Q: Which open-source models are supported with Amazon SageMaker JumpStart?
Amazon SageMaker JumpStart includes 150+ pre-trained open-source models from PyTorch Hub and TensorFlow Hub. For vision tasks such as image classification and object detection, you can use models such as ResNet, MobileNet, and Single-Shot Detector (SSD). For text tasks such as sentence classification, text classification, and question answering, you can use models such as BERT, RoBERTa, and DistilBERT. Q: What solutions come pre-built with Amazon SageMaker JumpStart?
SageMaker JumpStart includes solutions that are preconfigured with all necessary AWS services to launch a solution into production. Solutions are fully customizable so you can easily modify them to fit your specific use case and dataset. You can use solutions for over 15 use cases including demand forecasting, fraud detection, and predictive maintenance, and readily deploy solutions with just a few clicks. For more information about all solutions available, visit the SageMaker getting started page. Q: What built-in algorithms are supported in Amazon SageMaker Autopilot?
Amazon SageMaker Autopilot supports 2 built-in algorithms: XGBoost and Linear Learner. Q: Can I stop an Amazon SageMaker Autopilot job manually?
Yes. You can stop a job at any time. When an Amazon SageMaker Autopilot job is stopped, all ongoing trials will be stopped and no new trial will be started.
## Create a multiple choice quiz on the topic of SageMaker Low-code ML FAQ consisting of 4 questions. Each question should have 4 options. Also include the correct answer for each question using the starting string 'Correct Answer:`

L'ingegnerizzazione rapida è un processo iterativo. Dovresti essere chiaro e specifico e dare al modello il tempo di pensare.

Qui abbiamo specificato il contesto con ## come sequenze di arresto, che segnalano al modello di interrompere la generazione dopo la generazione di questo carattere o stringa. È utile quando si utilizza un prompt di pochi colpi.

Below is SageMaker Low-code ML FAQ: ##
<SageMaker Low-code ML FAQ content>
##

Successivamente, siamo chiari e molto specifici nel nostro prompt, chiedendo un quiz a scelta multipla, composto da quattro domande con quattro opzioni. Chiediamo al modello di includere la risposta corretta per ogni domanda utilizzando la stringa iniziale 'Correct Answer:' quindi possiamo analizzarlo in seguito usando Python:

Create a multiple choice quiz on the topic of SageMaker Low-code ML FAQ consisting of 4 questions. Each question should have 4 options. Also include the correct answer for each question using the starting string 'Correct Answer:`

Un prompt ben progettato può rendere il modello più creativo e generalizzato in modo che possa adattarsi facilmente a nuove attività. I prompt possono anche aiutare a incorporare la conoscenza del dominio su attività specifiche e migliorare l'interpretabilità. L'ingegnerizzazione rapida può migliorare notevolmente le prestazioni dei modelli di apprendimento zero-shot e few-shot. La creazione di prompt di alta qualità richiede un'attenta considerazione dell'attività da svolgere, nonché una profonda comprensione dei punti di forza e dei limiti del modello.

Nell'ambito di questo post, non copriamo ulteriormente questa vasta area.

Copia il prompt e inseriscilo nel file Richiesta casella, quindi scegli Genera testo.

AI21 Jurassic-2 Jumbo Instruct - input rapido

Questo invia il prompt al modello Jurassic-2 Jumbo Instruct per l'inferenza. Nota che sperimentare nel parco giochi è gratuito.

Accelera il tuo apprendimento verso gli esami di certificazione AWS con la generazione automatizzata di quiz utilizzando i modelli di base di Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Tieni inoltre presente che, nonostante la natura all'avanguardia degli LLM, sono ancora soggetti a pregiudizi, errori e allucinazioni.

Dopo aver letto l'output del modello in modo completo e attento, possiamo vedere che il modello ha generato un buon quiz!

Dopo aver giocato con il modello, è il momento di utilizzare il notebook e distribuirlo come endpoint nel proprio ambiente. Usiamo una piccola funzione Python per analizzare l'output e simulare un test interattivo.

Distribuisci il modello di base Jurassic-2 Jumbo Instruct da un notebook

Puoi usare quanto segue taccuino di esempio per distribuire Jurassic-2 Jumbo Instruct utilizzando SageMaker. Si noti che questo esempio utilizza un'istanza ml.p4d.24xlarge. Se il tuo limite predefinito per il tuo account AWS è 0, devi farlo richiedere un aumento del limite per questa istanza GPU.

Creiamo l'endpoint utilizzando l'inferenza di SageMaker. Innanzitutto, impostiamo le variabili necessarie, quindi distribuiamo il modello dal pacchetto del modello:

endpoint_name = "j2-jumbo-instruct" content_type = "application/json" real_time_inference_instance_type = ( "ml.p4d.24xlarge"
) # create a deployable model from the model package.
model = ModelPackage(
role=role, model_package_arn=model_package_arn, sagemaker_session=sagemaker_session
) # Deploy the model
predictor = model.deploy(1, real_time_inference_instance_type, endpoint_name=endpoint_name,
model_data_download_timeout=3600,
container_startup_health_check_timeout=600,
)

Dopo la distribuzione dell'endpoint, puoi eseguire query di inferenza sul modello.

Dopo che il modello è stato distribuito, puoi interagire con l'endpoint distribuito utilizzando il seguente frammento di codice:

response = ai21.Completion.execute(sm_endpoint=endpoint_name,
prompt=instruction,
maxTokens=2048,
temperature=0.7,
numResults=1,
stopSequences=['##']) output = response['completions'][0]['data']['text']

Con il modello di base Jurassic-2 Jumbo Instruct distribuito su un endpoint SageMaker dell'istanza ml.p4d.24xlarge, puoi utilizzare un prompt con 4,096 token. Puoi prendere lo stesso suggerimento che abbiamo usato nel parco giochi e aggiungere molte altre domande. In questo esempio, abbiamo aggiunto l'intero file FAQ ML a basso codice section come contesto nel prompt.

AI21 Jurassic-2 Jumbo Istruire l'output del prompt dell'endpoint

Possiamo vedere l'output del modello, che ha generato un quiz a scelta multipla con quattro domande e quattro opzioni per ogni domanda.

Ora puoi sviluppare una funzione Python per analizzare l'output e creare un quiz interattivo a scelta multipla.

È abbastanza semplice sviluppare una funzione del genere con poche righe di codice. Puoi analizzare facilmente la risposta perché il modello ha creato una riga con "Risposta corretta:" per ogni domanda, esattamente come richiesto nel prompt. Non forniamo il codice Python per la generazione del quiz nell'ambito di questo post.

Esegui il quiz sul quaderno

Utilizzando la funzione Python creata in precedenza e l'output del modello di base Jurassic-2 Jumbo Instruct, eseguiamo il quiz interattivo nel notebook.

AI21 Jurassic-2 Jumbo Instruct endpoint: fai un test

Puoi vedere che ho risposto correttamente a tre domande su quattro e ho ottenuto un voto del 75%. Forse devo leggere le FAQ di SageMaker ancora qualche volta!

ripulire

Dopo aver provato l'endpoint, assicurati di rimuovere l'endpoint di inferenza SageMaker e il modello per evitare eventuali addebiti:

model.sagemaker_session.delete_endpoint(endpoint_name)
model.sagemaker_session.delete_endpoint_config(endpoint_name) model.delete_model()

Conclusione

In questo post, ti abbiamo mostrato come testare e utilizzare il modello Jurassic-21 Jumbo Instruct di AI2 utilizzando SageMaker per creare un sistema di generazione automatica di quiz. Ciò è stato ottenuto utilizzando un prompt piuttosto semplice con il testo di una pagina delle domande frequenti di SageMaker disponibile pubblicamente incorporato e alcune righe di codice Python.

Simile a questo esempio menzionato nel post, puoi personalizzare un modello di base per la tua attività con solo alcuni esempi etichettati. Poiché tutti i dati sono crittografati e non lasciano il tuo account AWS, puoi essere certo che i tuoi dati rimarranno privati e riservati.

Richiedi l'accesso a prova il modello di base in SageMaker oggi e facci sapere il tuo feedback!

L'autore

Eitan Sela è un architetto specializzato in soluzioni di machine learning con Amazon Web Services. Collabora con i clienti AWS per fornire guida e assistenza tecnica, aiutandoli a creare e utilizzare soluzioni di machine learning su AWS. Nel tempo libero, Eitan si diverte a fare jogging e leggere gli ultimi articoli sull'apprendimento automatico.