Richiesta zero-shot e pochi-shot per il modello di base BloomZ 176B con l'SDK JumpStart semplificato di Amazon SageMaker

Ripubblicato da Platone

Seguaci: 0

JumpStart di Amazon SageMaker è un hub di machine learning (ML) che offre algoritmi, modelli e soluzioni ML. Con SageMaker JumpStart, i professionisti del machine learning possono scegliere da un elenco in continua crescita di quelli con le migliori prestazioni e disponibili al pubblico modelli di fondazione (FM) come FIORITURA, lama 2, Falco-40B, Diffusione stabile, OpenLLaMA, Flan-T5/UL2, o FM da avere coesione ed Accendi.

In questo post e nel taccuino di accompagnamento, dimostriamo come distribuire il modello di base BloomZ 176B utilizzando il SageMaker Python SDK semplificato in JumpStart di Amazon SageMaker come endpoint e utilizzarlo per varie attività di elaborazione del linguaggio naturale (NLP). Puoi anche accedere ai modelli di fondazione tramite Amazon Sage Maker Studio. Il modello BloomZ 176B, uno dei più grandi modelli pubblicamente disponibili, è un modello ottimizzato per le istruzioni all'avanguardia in grado di eseguire varie attività di PNL di apprendimento di pochi colpi nel contesto e di apprendimento a colpo zero. L'ottimizzazione delle istruzioni è una tecnica che prevede la messa a punto di un modello linguistico su una raccolta di attività di PNL utilizzando le istruzioni. Per ulteriori informazioni sull'ottimizzazione delle istruzioni, fare riferimento a Richiesta zero-shot per il modello base Flan-T5 in Amazon SageMaker JumpStart.

L'apprendimento a colpo zero in PNL consente a un LLM pre-addestrato di generare risposte a compiti per i quali non è stato specificamente addestrato. In questa tecnica, al modello viene fornito un testo di input e un prompt che descrive l'output previsto dal modello in linguaggio naturale. L'apprendimento a colpo zero viene utilizzato in una varietà di attività di PNL, come le seguenti:

Testo multilingue e classificazione dei sentimenti
Domande e risposte multilingue
Generazione del codice
Riformulazione del paragrafo
Riassunto
Ragionamento di buon senso e inferenza del linguaggio naturale
Risposta alla domanda
Classificazione di frasi e sentimenti
Generazione immaginaria di articoli basata su un titolo
Riassumendo un titolo basato su un articolo

L'apprendimento in pochi colpi implica l'addestramento di un modello per eseguire nuove attività fornendo solo alcuni esempi. Ciò è utile quando sono disponibili dati etichettati limitati per l'addestramento. L'apprendimento a pochi spettacoli viene utilizzato in una varietà di attività, tra cui le seguenti:

Riepilogo del testo
Generazione del codice
Riconoscimento dell'entità del nome
Risposta alla domanda
Correzione grammaticale e ortografica
Descrizione e generalizzazione del prodotto
Classificazione di frasi e sentimenti
Chatbot e IA conversazionale
Generazione di tweet
Traduzione automatica
Classificazione degli intenti

A proposito di Bloom

Il modello linguistico BigScience Large Open-science Open-access Multilingual (BLOOM) è un modello LLM (Large Language Model) basato su Transformer. BLOOM è un LLM autoregressivo addestrato per continuare il testo da un prompt su grandi quantità di dati di testo utilizzando risorse computazionali su scala industriale. In quanto tale, è in grado di produrre un testo coerente difficilmente distinguibile dal testo scritto da esseri umani. BLOOM può anche essere istruito a eseguire compiti di testo per i quali non è stato esplicitamente addestrato lanciandoli come compiti di generazione di testo.

Con i suoi 176 miliardi di parametri, BLOOM è in grado di generare testo in 46 lingue naturali e 13 linguaggi di programmazione. Per quasi tutti, come lo spagnolo, il francese e l'arabo, BLOOM è il primo modello linguistico con oltre 100 miliardi di parametri mai creato. I ricercatori possono scarica, esegui e studia BLOOM indagare le prestazioni e il comportamento degli LLM sviluppati di recente fino alle loro operazioni interne più profonde.

Panoramica della soluzione

In questo post, mostriamo come utilizzare il modello BloomZ 176B ottimizzato per le istruzioni all'avanguardia da Abbracciare il viso per la generazione del testo. È possibile utilizzare il modello BloomZ 176B con l'apprendimento di pochi colpi e l'apprendimento di zero colpi per molte attività di PNL, senza mettere a punto il modello. Non è necessario addestrare un nuovo modello perché modelli come BloomZ 176B hanno un numero significativo di parametri tali da potersi adattare facilmente a molti contesti senza essere riaddestrati. Il modello BloomZ 176B è stato addestrato con una grande quantità di dati, rendendolo applicabile a molte attività generiche.

Il codice per tutti i passaggi di questa demo è disponibile di seguito taccuino.

Messa a punto delle istruzioni

Le dimensioni e la complessità degli LLM sono esplose negli ultimi anni. Gli LLM hanno dimostrato notevoli capacità nell'apprendimento della semantica del linguaggio naturale e nella produzione di risposte simili a quelle umane. Molti LLM recenti sono messi a punto con una tecnica potente chiamata messa a punto delle istruzioni, che aiuta il modello a eseguire nuove attività o a generare risposte a nuovi prompt senza una messa a punto specifica del prompt. Un modello ottimizzato per le istruzioni utilizza la sua comprensione di attività o concetti correlati per generare previsioni per nuovi prompt. Poiché questa tecnica non comporta l'aggiornamento dei pesi del modello, evita il processo lungo e computazionalmente costoso necessario per mettere a punto un modello per una nuova attività mai vista prima.

L'ottimizzazione delle istruzioni implica la messa a punto di un modello linguistico su una raccolta di attività di PNL utilizzando le istruzioni. In questa tecnica, il modello viene addestrato per eseguire attività seguendo istruzioni testuali anziché set di dati specifici per ciascuna attività. Il modello è messo a punto con una serie di esempi di input e output per ogni attività, consentendo al modello di generalizzare a nuove attività su cui non è stato addestrato in modo esplicito, purché vengano forniti prompt per le attività. L'ottimizzazione delle istruzioni aiuta a migliorare l'accuratezza e l'efficacia dei modelli ed è utile in situazioni in cui non sono disponibili set di dati di grandi dimensioni per attività specifiche.

Progettazione rapida per attività NLP zero-shot e few-shot sui modelli BLOOM

Ingegneria rapida si occupa di creare prompt di alta qualità per guidare il modello verso le risposte desiderate. I prompt devono essere progettati in base all'attività specifica e al set di dati utilizzato. L'obiettivo qui è fornire al modello le informazioni necessarie per generare risposte di alta qualità riducendo al minimo il rumore. Ciò potrebbe comportare parole chiave, contesti aggiuntivi, domande e altro.

Un prompt ben progettato può rendere il modello più creativo e generalizzato in modo che possa adattarsi facilmente a nuove attività. I prompt possono anche aiutare a incorporare la conoscenza del dominio su attività specifiche e migliorare l'interpretabilità. L'ingegnerizzazione rapida può migliorare notevolmente le prestazioni dei modelli di apprendimento zero-shot e few-shot. La creazione di prompt di alta qualità richiede un'attenta considerazione dell'attività da svolgere, nonché una profonda comprensione dei punti di forza e dei limiti del modello.

Nella tabella seguente, il modello BloomZ 176B viene utilizzato per generare risposte per varie attività NLP zero-shot e few-shot. La prima colonna mostra l'attività, la seconda colonna contiene il prompt fornito al modello (dove il testo del modello è in grassetto e il testo non in grassetto è l'input di esempio) e la terza colonna è la risposta del modello quando viene interrogata sul prompt

Per tutte le seguenti attività, impostiamo gli iperparametri come 600 per essere il max_length, num_return_sequences, top_k essere 250, top_p essere 0.95 e nessun campionamento.

Task	Immissione rapida	Uscita
Compiti di apprendimento a colpo zero
Testo multilingue o classificazione dei sentimenti (dal cinese all'inglese)	一个传奇的开端, 一个不灭的神话, 这不仅仅是一部电影, 而是作为一个走进新时代的标签, 永远彪炳史册.Valuteresti la recensione precedente come positiva, neutra o negativa?	positivo
Risposta multilingue alle domande (dall'inglese al cinese)	Spiegami in cinese tradizionale cos'è la retropropagazione	梯度反向传播算法是一种机器学习算法,用于训练人工神经网络。该算法使用梯度下降来最小化损失函数.
Generazione del codice	Scrivi a albero di ricerca binario con Complessità computazionale O(log(n)). {codice_inizio}	def ricerca_binaria(a, x): basso = 0 alto = len(a) – 1 mentre basso <= alto: medio = (basso + alto) // 2 se a[mid] < x: basso = medio + 1 elif a[metà] > x: alto = medio - 1 altro: ritorno a metà ritorno -1′ ... altro: ritorno a metà torna basso' L'output viene troncato
Paragrafo riformulato	Amazon Web Services (AWS) ha annunciato nove importanti nuovi aggiornamenti per la sua piattaforma di machine learning basata su cloud, SageMaker. SageMaker mira a fornire un servizio di apprendimento automatico che può essere utilizzato per creare, addestrare e distribuire modelli ML praticamente per qualsiasi caso d'uso. Durante la conferenza re:Invent di quest'anno, AWS ha fatto diversi annunci per migliorare ulteriormente le capacità di SageMaker.nnCome lo riformuleresti brevemente usando l'inglese?,Amazon Web Services (AWS) ha annunciato nove importanti nuovi aggiornamenti per la sua piattaforma di machine learning basata su cloud, SageMaker. SageMaker mira a fornire un servizio di apprendimento automatico che può essere utilizzato per creare, addestrare e distribuire modelli ML praticamente per qualsiasi caso d'uso. Durante la conferenza re:Invent di quest'anno, AWS ha fatto diversi annunci per migliorare ulteriormente le capacità di SageMaker. NLa frase sopra è molto complicata. Forniscimi una versione semplificata sinonimo composta da più frasi:	Amazon SageMaker ottiene un importante aggiornamento Amazon Web Services (AWS) ha annunciato nove importanti nuovi aggiornamenti per la sua piattaforma di machine learning basata su cloud, SageMaker. SageMaker mira a fornire un servizio di apprendimento automatico che può essere utilizzato per creare, addestrare e distribuire modelli ML praticamente per qualsiasi caso d'uso
Riassunto	Amazon Comprehend utilizza l'elaborazione del linguaggio naturale (NLP) per estrarre informazioni dettagliate sul contenuto dei documenti. Sviluppa intuizioni riconoscendo le entità, le frasi chiave, il linguaggio, i sentimenti e altri elementi comuni in un documento. Usa Amazon Comprehend per creare nuovi prodotti basati sulla comprensione della struttura dei documenti. Ad esempio, utilizzando Amazon Comprehend puoi cercare nei feed dei social network menzioni di prodotti o scansionare un intero repository di documenti per frasi chiave. Puoi accedere alle funzionalità di analisi dei documenti di Amazon Comprehend utilizzando la console di Amazon Comprehend o le API di Amazon Comprehend. È possibile eseguire analisi in tempo reale per piccoli carichi di lavoro o avviare processi di analisi asincrona per set di documenti di grandi dimensioni. Puoi utilizzare i modelli pre-addestrati forniti da Amazon Comprehend oppure puoi addestrare i tuoi modelli personalizzati per la classificazione e il riconoscimento delle entità. Tutte le funzionalità di Amazon Comprehend accettano documenti di testo UTF-8 come input. Inoltre, la classificazione personalizzata e il riconoscimento di entità personalizzate accettano file immagine, file PDF e file Word come input. Amazon Comprehend può esaminare e analizzare documenti in una varietà di lingue, a seconda della caratteristica specifica. Per ulteriori informazioni, consulta Lingue supportate in Amazon Comprehend. La funzionalità della lingua dominante di Amazon Comprehend può esaminare i documenti e determinare la lingua dominante per una selezione molto più ampia di lingue.nn===nScrivi un riassunto del testo precedente in inglese:	Amazon Comprehend utilizza l'elaborazione del linguaggio naturale (NLP) per estrarre informazioni dettagliate sul contenuto dei documenti. Sviluppa intuizioni riconoscendo le entità, le frasi chiave, il linguaggio, i sentimenti e altri elementi comuni in un documento. Usa Amazon Comprehend per creare nuovi prodotti basati sulla comprensione della struttura dei documenti. Ad esempio, utilizzando Amazon Comprehend puoi cercare nei feed dei social network menzioni di prodotti o scansionare un intero repository di documenti per frasi chiave. Puoi accedere alle funzionalità di analisi dei documenti di Amazon Comprehend utilizzando la console di Amazon Comprehend o le API di Amazon Comprehend. È possibile eseguire analisi in tempo reale per piccoli carichi di lavoro o avviare processi di analisi asincrona per set di documenti di grandi dimensioni. Puoi utilizzare i modelli pre-addestrati forniti da Amazon Comprehend oppure puoi addestrare i tuoi modelli personalizzati per la classificazione e il riconoscimento delle entità. Tutte le funzionalità di Amazon Comprehend accettano documenti di testo UTF-8 come input. Inoltre, la classificazione personalizzata e il riconoscimento di entità personalizzate accettano file immagine, file PDF e file Word come input. Amazon Comprehend può esaminare e analizzare documenti in una varietà di lingue, a seconda della caratteristica specifica. Per ulteriori informazioni, consulta Lingue supportate in Amazon Comprehend. La funzionalità della lingua dominante di Amazon Comprehend può esaminare i documenti e determinare la lingua dominante per una selezione di lingue molto più ampia.
Ragionamento di buon senso e inferenza del linguaggio naturale	Detto questo La coppa del mondo è iniziata a Los Angeles, negli Stati Uniti. Segue quello La coppa del mondo si svolge negli Stati Uniti. Sì o no?, La coppa del mondo è iniziata a Los Angeles, negli Stati Uniti. Usando solo la descrizione di cui sopra e ciò che sai del mondo, lo è “La coppa del mondo si svolge negli Stati Uniti” decisamente corretto? Sì o no?,	Sì
Risposta alla domanda	domanda: quali sono le caratteristiche principali del nuovo Kindle?nnContesto: Il Kindle più recente e innovativo ti consente di prendere appunti su milioni di libri e documenti, scrivere elenchi e diari e altro ancora. Per i lettori che hanno sempre desiderato poter scrivere nei loro eBook, il nuovo Kindle di Amazon consente loro di fare proprio questo. Kindle Scribe è il primo Kindle per la lettura e la scrittura e consente agli utenti di integrare i propri libri e documenti con note, elenchi e altro. Ecco tutto ciò che devi sapere su Kindle Scribe, comprese le domande frequenti. Kindle Scribe semplifica la lettura e la scrittura come faresti su carta Kindle Scribe presenta uno schermo antiriflesso da 10.2 pollici (il più grande di tutti i dispositivi Kindle), una nitida risoluzione di 300 ppi e 35 luci anteriori a LED che si adattano automaticamente al tuo ambiente. Personalizza ulteriormente la tua esperienza con la luce calda regolabile, le dimensioni dei caratteri, l'interlinea e altro ancora. Viene fornito con la tua scelta tra la penna base o la penna premium, che usi per scrivere sullo schermo come faresti su carta. Si attaccano anche magneticamente al tuo Kindle e non hanno mai bisogno di essere caricati. La penna Premium include una gomma dedicata e un pulsante di scelta rapida personalizzabile. Kindle Scribe ha il maggior numero di opzioni di archiviazione di tutti i dispositivi Kindle: scegli tra 8 GB, 16 GB o 32 GB in base al tuo livello di lettura e scrittura. nnRisposta	prendi appunti su milioni di libri e documenti, scrivi elenchi e riviste e altro ancora
Classificazione di frasi e sentimenti	Recensione: nQuesto film è così grande e ancora una volta ci abbaglia e ci delizianQuesta frase della recensione del film è negativa o positiva?nOPZIONI: n-positivo n-negativo	Positivo
Generazione immaginaria dell'articolo in base al titolo	Titolo: “L'università ha una nuova struttura in arrivo”nDato il titolo precedente di un articolo immaginario, immagina l'articolo.n”””	Il progetto da 1.2 milioni di sterline vedrà la creazione di un nuovo centro di insegnamento e apprendimento presso l'Università delle Highlands e delle Isole (UHI) a Inverness. Sarà costruito sul sito dell'ex Inverness College of Commerce. UHI ha affermato che la nuova struttura sarà utilizzata per l'insegnamento e l'apprendimento, nonché per il supporto e l'amministrazione degli studenti. L'università ha detto che sarebbe stato utilizzato anche per conferenze ed eventi. Il nuovo edificio sarà costruito sul sito dell'ex Inverness College of Commerce L'università ha detto che il nuovo edificio sarebbe stato costruito sul sito dell'ex Inverness College of Commerce, chiuso nel 2013. Ha affermato che la nuova struttura sarebbe stata utilizzata per l'insegnamento e l'apprendimento, nonché per il supporto e l'amministrazione degli studenti. Sarebbe anche utilizzato per conferenze ed eventi. UHI ha detto che la nuova struttura sarà costruita sul sito dell'ex Inverness College of Commerce L'università ha detto che il nuovo edificio sarebbe stato costruito sul sito dell'ex Inverness College of Commerce, chiuso nel 2013. Ha affermato che la nuova struttura sarebbe stata utilizzata per l'insegnamento e l'apprendimento, nonché per il supporto e l'amministrazione degli studenti. ... Sarebbe anche utilizzato per conferenze ed eventi. UHI ha detto che la nuova struttura sarebbe stata costruita sul sito dell'ex Inverness...
Riassumendo un titolo basato sull'articolo	'Il Kindle più nuovo e innovativo di sempre ti consente di prendere appunti su milioni di libri e documenti, scrivere elenchi e diari e altro ancora. Per i lettori che hanno sempre desiderato poter scrivere nei loro eBook, il nuovo Kindle di Amazon consente loro di fare proprio questo. Kindle Scribe è il primo Kindle per la lettura e la scrittura e consente agli utenti di integrare i propri libri e documenti con note, elenchi e altro. Ecco tutto ciò che devi sapere su Kindle Scribe, comprese le domande frequenti. Kindle Scribe semplifica la lettura e la scrittura come faresti su carta Kindle Scribe presenta uno schermo antiriflesso da 10.2 pollici (il più grande di tutti i dispositivi Kindle), una nitida risoluzione di 300 ppi e 35 luci anteriori a LED che si adattano automaticamente al tuo ambiente. Personalizza ulteriormente la tua esperienza con la luce calda regolabile, le dimensioni dei caratteri, l'interlinea e altro ancora. Viene fornito con la tua scelta tra la penna base o la penna premium, che usi per scrivere sullo schermo come faresti su carta. Si attaccano anche magneticamente al tuo Kindle e non hanno mai bisogno di essere caricati. La penna Premium include una gomma dedicata e un pulsante di scelta rapida personalizzabile. Kindle Scribe ha il maggior numero di opzioni di archiviazione di tutti i dispositivi Kindle: scegli tra 8 GB, 16 GB o 32 GB in base al tuo livello di lettura e scrittura. nnnnDammi un buon titolo per l'articolo qui sopra.	Kindle Scribe di Amazon: tutto ciò che devi sapere
Compiti di apprendimento a pochi colpi
Riassunto	[Originale]: Gli scienziati di Amazon, in collaborazione con i ricercatori dell'Università di Sheffield, stanno rendendo pubblicamente disponibile per la prima volta un set di dati di estrazione e verifica dei fatti su larga scala. Il set di dati, che comprende oltre 185,000 affermazioni supportate da prove, viene reso disponibile per catalizzare, si spera, ricerca e sviluppo che affrontino i problemi di estrazione e verifica dei fatti in applicazioni software o servizi basati su cloud che eseguono l'estrazione automatica delle informazioni. [sommario]: i ricercatori di Amazon e dell'università rendono pubblicamente disponibili i set di dati di estrazione e verifica dei fatti. ### [Originale]: Gli abbonati Prime negli Stati Uniti possono riceverne ancora di più a domicilio con un abbonamento Prime. I membri possono ora usufruire gratuitamente di un anno di Grubhub+ del valore di $ 9.99 al mese, senza costi aggiuntivi per il loro abbonamento Prime. Per attivare questa offerta, visita amazon.com/grubhub. Questa nuova offerta include spese illimitate per la consegna di cibo da $ 0 per ordini superiori a $ 12, nonché vantaggi esclusivi per i membri di Grubhub + e premi come cibo gratuito e sconti sugli ordini. Inoltre, i commensali possono "mangiare bene mentre fanno del bene" aderendo al programma Donate the Change di Grubhub, un'iniziativa di corrispondenza delle donazioni che ha raccolto più di 25 milioni di dollari solo nel 2021, a beneficio di oltre 20 organizzazioni di beneficenza in tutto il paese. [Sommario]: I membri Prime negli Stati Uniti possono usufruire gratuitamente di un anno di Grubhub+, senza costi di consegna del cibo per gli ordini idonei. ### [Originale]: Gli scienziati di Amazon, in collaborazione con i ricercatori dell'Università di Sheffield, stanno rendendo pubblicamente disponibile per la prima volta un set di dati di estrazione e verifica dei fatti su larga scala. Il set di dati, che comprende oltre 185,000 affermazioni supportate da prove, viene reso disponibile per catalizzare, si spera, ricerca e sviluppo che affrontino i problemi di estrazione e verifica dei fatti in applicazioni software o servizi basati su cloud che eseguono l'estrazione automatica delle informazioni. [Riepilogo]:	[Riepilogo]: I ricercatori di Amazon e dell'Università rendono pubblicamente disponibili i set di dati di estrazione e verifica dei fatti.
Generazione del codice	descrizione: un pulsante arancione che dice stop codice: Stop ### descrizione: una scatola blu che contiene cerchi gialli con bordi rossi codice: ### descrizione: un titolo che dice Benvenuto in AI codice:	codice: Benvenuto in AI '
Riconoscimento dell'entità del nome	[Testo]: Fred è un imprenditore seriale. Co-fondatore e CEO di Platform.sh, in precedenza ha co-fondato Commerce Guys, uno dei principali fornitori di e-commerce Drupal. La sua missione è garantire che mentre continuiamo in un viaggio ambizioso per trasformare profondamente il modo in cui il cloud computing viene utilizzato e percepito, manteniamo i piedi per terra continuando la rapida crescita di cui abbiamo goduto fino ad ora. [Nome]: Federico [Posizione]: co-fondatore e amministratore delegato [Azienda]: Platform.sh ### [Testo]: Microsoft (la parola è un portmanteau di "software per microcomputer") è stata fondata da Bill Gates il 4 aprile 1975, per sviluppare e vendere interpreti BASIC per l'Altair 8800. Steve Ballmer ha sostituito Gates come CEO nel 2000 e successivamente immaginato una strategia di "dispositivi e servizi". [Nome]: Steve Ballmer [Posizione]: CEO [Azienda]: Microsoft ### [Testo]: Franck Riboud è nato il 7 novembre 1955 a Lione. È il figlio di Antoine Riboud, l'ex CEO, che ha trasformato l'ex produttore di vetro europeo BSN Group in un attore leader nel settore alimentare. È l'amministratore delegato di Danone. [Nome]: Franck Riboud [Posizione]: CEO [Azienda]: Danone ### [Testo]: David Melvin è un professionista dei servizi finanziari e di investimento presso CITIC CLSA con oltre 30 anni di esperienza nell'investment banking e nel private equity. Attualmente è Senior Adviser di CITIC CLSA.	[Nome]: Federico [Posizione]: co-fondatore e amministratore delegato [Azienda]: Platform.sh
Risposta alla domanda	Contesto: NLP Cloud è stata fondata nel 2021 quando il team si è reso conto che non esisteva un modo semplice per sfruttare in modo affidabile l'elaborazione del linguaggio naturale in produzione. Domanda: Quando è stato fondato NLP Cloud? Risposta: 2021 ### Contesto: NLP Cloud ha sviluppato la propria API entro la metà del 2020 e da allora ha aggiunto molti modelli open source pre-addestrati. Domanda: cosa ha sviluppato NLP Cloud? Risposta: API ### Contesto: tutti i piani possono essere interrotti in qualsiasi momento. Paghi solo per il tempo in cui hai utilizzato il servizio. In caso di downgrade, otterrai uno sconto sulla tua prossima fattura. Domanda: quando è possibile interrompere i piani? Risposta: in qualsiasi momento ### Contesto: la sfida principale con GPT-J è il consumo di memoria. Si consiglia di utilizzare un piano GPU. Domanda: quale piano è consigliato per GPT-J? Risposta:"""	Risposta: piano GPU'
Correzione grammaticale e ortografica	Adoro andare in spiaggia. Correzione: amo andare in spiaggia. ### Fammi avere! Correzione: fammelo avere! ### Ha troppi svantaggi. Correzione: ha troppi inconvenienti. ### Non voglio andare Correzione:	Correzione: non voglio andare
Descrizione e generalizzazione del prodotto	Genera una descrizione del prodotto con parole chiave. Parole chiave: scarpe, donne, $ 59 Frase: Bellissime scarpe da donna al prezzo di $59. ### Parole chiave: pantaloni, uomo, $ 69 Frase: pantaloni moderni da uomo, a soli $ 69. ### Parole chiave: guanti, inverno, $ 19 Frase: guanti incredibilmente caldi per inverni freddi, a $ 19. ### Parole chiave: t-shirt, uomo, $ 39 Frase:	Frase: T-shirt cool per uomo, solo per $ 39.
Classificazione di frasi e sentimenti	Messaggio: Quando l'astronave è atterrata su Marte, l'intera umanità era eccitata Tema: lo spazio ### Messaggio: amo giocare a tennis ea golf. Mi alleno due volte a settimana. Tema: lo sport ### Messaggio: Gestire un team di venditori è un lavoro duro ma gratificante. Argomento: affari ### Messaggio: sto cercando di cucinare il pollo con i pomodori. Argomento:	Argomento: il cibo
Chatbot e IA conversazionale	Questa è una discussione tra un [umano] e un [robot]. Il [robot] è molto gentile ed empatico. [umano]: Ciao, piacere di conoscerti. [robot]: Anche io piacere di conoscerti. ### [umano]: Come va oggi? [robot]: Non così male, grazie! E tu? ### [umano]: Sto bene, ma sono un po' triste... [robot]: Ah? Perché quel? ### [umano]: Ho preso l'influenza [robot]:	[robot]: Oh no, mi dispiace sentirlo!
Generazione di tweet	parola chiave: mercati tweet: Prendi feedback dalla natura e dai mercati, non dalle persone ### parola chiave: bambini tweet: Forse moriamo per poter tornare bambini. ### parola chiave: startup tweet: Le startup non dovrebbero preoccuparsi di come spegnere gli incendi, dovrebbero preoccuparsi di come accenderli. ### parola chiave: nlp Tweet:	tweet: la PNL è uno strumento, non un obiettivo.
Traduzione automatica	Hugging Face è una rivoluzione nella PNL. Traduzione: Hugging Face ha rivoluzionato la PNL. ### Cela est incroyable! Traduzione: Questo è incredibile! ### Désolé je ne peux pas. Traduzione: Mi dispiace ma non posso. ### NLP Cloud consente di distribuire facilmente la PNL e la produzione. La traduzione:	Traduzione: NLP Cloud semplifica l'implementazione della NLP in produzione.
Classificazione degli intenti	Voglio iniziare a programmare domani perché sembra essere così divertente! Intento: avviare la codifica ### Fammi vedere le ultime foto che hai per favore. Intento: mostrare immagini ### Cerca tutti questi file il più velocemente possibile. Intento: cercare file ### Per favore, puoi insegnarmi il cinese la prossima settimana? Intento:	Intento: insegnami il cinese

Accedi al modello ottimizzato per le istruzioni BloomZ 176B in SageMaker

SageMaker JumpStart offre due modi per iniziare a utilizzare questi modelli Bloom regolati dalle istruzioni: Amazon Sage Maker Studio e l'SDK di SageMaker. Le sezioni seguenti illustrano l'aspetto di ciascuna di queste opzioni e come accedervi.

Accedi al modello con l'SDK SageMaker JumpStart semplificato

Il SDK SageMaker JumpStart semplificato facilita l'addestramento e la distribuzione di modelli SageMaker JumpStart integrati con un paio di righe di codice. Ciò consente di accedere all'intera libreria di modelli JumpStart di SageMaker, inclusi i modelli di base e i modelli di generazione di immagini più recenti, senza dover fornire alcun input oltre all'ID del modello.

Puoi sfruttare i valori predefiniti specifici del modello che forniamo per specificare la configurazione, come l'immagine Docker, il tipo di istanza ML, la posizione dell'artefatto del modello e gli iperparametri, tra gli altri campi. Questi attributi sono solo valori predefiniti; puoi sovrascriverli e mantenere il controllo granulare sui modelli AWS che crei. Come risultato di questi cambiamenti, lo sforzo di scrivere flussi di lavoro Python per distribuire e addestrare i modelli SageMaker JumpStart è stato ridotto, consentendoti di dedicare più tempo alle attività che contano. Questa funzione è disponibile in tutte le regioni in cui è supportato JumpStart ed è possibile accedervi con il SDK Python di SageMaker versione 2.154.0 o successiva.

Puoi distribuire un endpoint in modo programmatico tramite SageMaker SDK. Dovrai specificare l'ID del modello desiderato nell'hub del modello SageMaker e il tipo di istanza utilizzato per la distribuzione. L'URI del modello, che contiene lo script di inferenza, e l'URI del contenitore Docker vengono ottenuti tramite SageMaker SDK. Questi URI sono forniti da SageMaker JumpStart e possono essere utilizzati per inizializzare un oggetto modello SageMaker per la distribuzione.

Distribuire il modello ed eseguire query sull'endpoint

Questo taccuino richiede ipywidgets. Installa ipywidgets e quindi utilizza il ruolo di esecuzione associato al notebook corrente come ruolo dell'account AWS con accesso SageMaker.

Scegli il modello pre-addestrato

Scegliamo il bloomz-176b-fp16 modello pre-addestrato:

model_id = "huggingface-textgeneration1-bloomz-176b-fp16"

Il taccuino nelle sezioni seguenti utilizza Bloom Z 176B come esempio. Per un elenco completo dei modelli preaddestrati di SageMaker, fare riferimento a Algoritmi incorporati con tabella modello pre-addestrata.

Recupera gli artefatti e distribuisci un endpoint

Con SageMaker, possiamo eseguire l'inferenza sul modello pre-addestrato senza prima perfezionarlo su un nuovo set di dati. Iniziamo recuperando il file deploy_image_uri, deploy_source_urie model_uri per il modello pre-addestrato. Per ospitare il modello pre-addestrato, creiamo un'istanza di sagemaker.model.Model e distribuirlo. Questo potrebbe richiedere alcuni minuti.

Ora possiamo distribuire il modello utilizzando l'SDK SageMaker JumpStart semplificato con le seguenti righe di codice:

from sagemaker.jumpstart.model import JumpStartModel #if no instance for this model id is available, use a smaller id
model = JumpStartModel(model_id=model_id) # ml.p4de.24xlarge is used by default. You can add the kwarg
# instance_type to change this setting.
predictor = model.deploy() endpoint_name = predictor.endpoint_name

Usiamo Contenitori LMI (Large Model Inference) di SageMaker per ospitare il modello BloomZ 176B. LMI è uno stack software LLM (contenitore) creato da AWS che offre funzioni di facile utilizzo e prestazioni migliorate sui modelli di intelligenza artificiale generativa. È integrato con il parallelismo del modello, la compilazione, la quantizzazione e altri stack per accelerare l'inferenza. Per i dettagli, fare riferimento a Distribuisci BLOOM-176B e OPT-30B su Amazon SageMaker con inferenza di modelli di grandi dimensioni Deep Learning Containers e DeepSpeed.

Tieni presente che la distribuzione di questo modello richiede un'istanza p4de.24xlarge e la distribuzione in genere richiede circa 1 ora. Se non disponi di una quota per quell'istanza, richiedi un aumento della quota nella console AWS Service Quotas.

Interroga l'endpoint e analizza la risposta utilizzando vari parametri per controllare il testo generato

L'input per l'endpoint è qualsiasi stringa di testo formattata come JSON e codificata in formato utf-8. L'output dell'endpoint è un file JSON con testo generato.

Nell'esempio seguente, forniamo del testo di input di esempio. Puoi inserire qualsiasi testo e il modello prevede le parole successive nella sequenza. Sequenze di testo più lunghe possono essere generate richiamando ripetutamente il modello. Il codice seguente mostra come richiamare un endpoint con questi argomenti:

from sagemaker.predictor import retrieve_default predictor = retrieve_default(model_id=model_id, model_version="*", endpoint_name=endpoint=name)
response = predictor.predict("How to make a pasta?")
print(response["generated_text"])

Otteniamo il seguente output:

['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']

Accedi al modello in SageMaker Studio

È inoltre possibile accedere a questi modelli tramite il Pagina di destinazione JumpStart in Atelier. Questa pagina elenca le soluzioni ML end-to-end disponibili, i modelli con training preliminare e i notebook di esempio.

Al momento della pubblicazione del post, BloomZ 176B è disponibile solo nel formato us-east-2 Regione.

Accedi al modello in SageMaker Studio

È possibile scegliere la scheda del modello BloomZ 176B per visualizzare il notebook.

scegli la scheda modello BloomZ 176B

È quindi possibile importare il notebook per eseguirlo ulteriormente.

importare il taccuino

ripulire

Per evitare addebiti continui, elimina gli endpoint di inferenza SageMaker. Puoi eliminare gli endpoint tramite la console SageMaker o dal notebook SageMaker Studio utilizzando i seguenti comandi:

predictor.delete_model()
predictor.delete_endpoint()

Conclusione

In questo post, abbiamo fornito una panoramica dei vantaggi dell'apprendimento zero-shot e few-shot e descritto come l'ingegneria rapida può migliorare le prestazioni dei modelli ottimizzati per le istruzioni. Abbiamo anche mostrato come distribuire facilmente un modello BloomZ 176B ottimizzato per le istruzioni da SageMaker JumpStart e abbiamo fornito esempi per dimostrare come è possibile eseguire diverse attività NLP utilizzando l'endpoint del modello BloomZ 176B distribuito in SageMaker.

Ti invitiamo a implementare un modello BloomZ 176B da SageMaker JumpStart e a creare i tuoi prompt per i casi d'uso della PNL.

Per ulteriori informazioni su SageMaker JumpStart, dai un'occhiata a quanto segue:

Informazioni sugli autori

Rajakumar Sampathkumar è un Principal Technical Account Manager presso AWS, che fornisce ai clienti una guida sull'allineamento della tecnologia aziendale e supporta la reinvenzione dei loro modelli e processi operativi cloud. È appassionato di cloud e machine learning. Raj è anche uno specialista dell'apprendimento automatico e collabora con i clienti AWS per progettare, distribuire e gestire i carichi di lavoro e le architetture AWS.

Dott. Xin Huang è uno scienziato applicato per gli algoritmi integrati Amazon SageMaker JumpStart e Amazon SageMaker. Si concentra sullo sviluppo di algoritmi di apprendimento automatico scalabili. I suoi interessi di ricerca sono nell'area dell'elaborazione del linguaggio naturale, del deep learning spiegabile su dati tabulari e dell'analisi robusta del clustering spazio-temporale non parametrico. Ha pubblicato molti articoli su ACL, ICDM, conferenze KDD e Royal Statistical Society: rivista di serie A.

Evan Kravitz è un ingegnere del software presso Amazon Web Services, che lavora su SageMaker JumpStart. Gli piace cucinare e correre a New York City.