Amazon SageMaker JumpStart este un hub de învățare automată (ML) care oferă algoritmi, modele și soluții ML. Cu SageMaker JumpStart, practicienii ML pot alege dintr-o listă tot mai mare de cele mai performante și disponibile public modele de fundație (FM) precum A INFLORI, Lama 2, Soimul-40B, Difuzie stabilă, OpenLLaMA, Flan-T5/UL2, sau FM-uri de la fi legat și Lumina pe.
În această postare și notebook-ul însoțitor, demonstrăm cum să implementăm modelul de fundație BloomZ 176B folosind SDK simplificat SageMaker Python in Amazon SageMaker JumpStart ca punct final și utilizați-l pentru diferite sarcini de procesare a limbajului natural (NLP). De asemenea, puteți accesa modelele de fond de ten Amazon SageMaker Studio. Modelul BloomZ 176B, unul dintre cele mai mari modele disponibile publicului, este un model de ultimă generație, reglat cu instrucțiuni, care poate efectua diverse sarcini de învățare în context cu învățare puțină și învățare zero. Reglarea instrucțiunilor este o tehnică care implică reglarea fină a unui model de limbaj pe o colecție de sarcini NLP folosind instrucțiuni. Pentru a afla mai multe despre reglarea instrucțiunilor, consultați Solicitare zero-shot pentru modelul de fundație Flan-T5 în Amazon SageMaker JumpStart.
Învățarea zero-shot în NLP permite unui LLM pre-instruit să genereze răspunsuri la sarcini pentru care nu a fost instruit în mod specific. În această tehnică, modelul este furnizat cu un text de intrare și un prompt care descrie rezultatul așteptat de la model în limbaj natural. Învățarea zero-shot este utilizată într-o varietate de sarcini NLP, cum ar fi următoarele:
- Clasificarea textului și a sentimentelor în mai multe limbi
- Întrebări și răspunsuri multilingve
- Generarea codului
- Reformularea paragrafului
- Rezumare
- Raționamentul de bun simț și inferența limbajului natural
- Răspuns la întrebare
- Clasificarea propozițiilor și sentimentelor
- Generare de articole imaginare pe baza unui titlu
- Rezumarea unui titlu pe baza unui articol
Învățarea „Few-Shot” implică antrenarea unui model pentru a îndeplini sarcini noi, oferind doar câteva exemple. Acest lucru este util acolo unde sunt disponibile date limitate etichetate pentru instruire. Învățarea cu puține spectacole este utilizată într-o varietate de sarcini, inclusiv următoarele:
- Rezumat text
- Generarea codului
- Recunoașterea numelui entității
- Răspuns la întrebare
- Corectare de gramatică și ortografie
- Descrierea și generalizarea produsului
- Clasificarea propozițiilor și sentimentelor
- Chatbot și IA conversațională
- Generarea de tweet
- Traducere automată
- Clasificarea intențiilor
Despre Bloom
Modelul de limbaj BigScience Large Open-science Open-Acces Multilingual (BLOOM) este un model de limbaj mare (LLM) bazat pe transformator. BLOOM este un LLM autoregresiv instruit pentru a continua textul de la un prompt pe cantități mari de date text folosind resurse de calcul la scară industrială. Ca atare, este capabil să scoată text coerent, care este greu de distins de textul scris de oameni. BLOOM poate fi, de asemenea, instruit să efectueze sarcini de text pentru care nu a fost instruit în mod explicit, proiectându-le ca sarcini de generare de text.
Cu cei 176 de miliarde de parametri ai săi, BLOOM este capabil să genereze text în 46 de limbi naturale și 13 limbaje de programare. Pentru aproape toate, cum ar fi spaniolă, franceză și arabă, BLOOM este primul model de limbă cu peste 100 de miliarde de parametri creați vreodată. Cercetătorii pot descărcați, rulați și studiați BLOOM pentru a investiga performanța și comportamentul LLM-urilor recent dezvoltate până la cele mai profunde operațiuni interne ale acestora.
Prezentare generală a soluțiilor
În această postare, arătăm cum să utilizați modelul BloomZ 176B de ultimă generație, reglat cu instrucțiuni de la Fata îmbrățișată pentru generarea de text. Puteți utiliza modelul BloomZ 176B cu învățare cu câteva puncte și cu învățare zero pentru multe sarcini NLP, fără a ajusta modelul. Nu este nevoie să antrenați un model nou, deoarece modelele precum BloomZ 176B au un număr semnificativ de parametri, astfel încât să se poată adapta cu ușurință la multe contexte fără a fi reinstruit. Modelul BloomZ 176B a fost antrenat cu o cantitate mare de date, fiind aplicabil pentru multe sarcini de uz general.
Codul pentru toți pașii din această demonstrație este disponibil în cele ce urmează caiet.
Reglajul instrucțiunilor
Dimensiunea și complexitatea LLM-urilor au explodat în ultimii ani. LLM-urile au demonstrat capacități remarcabile în învățarea semanticii limbajului natural și în producerea de răspunsuri asemănătoare omului. Multe LLM recente sunt ajustate cu o tehnică puternică numită reglarea instrucțiunilor, care ajută modelul să efectueze noi sarcini sau să genereze răspunsuri la solicitări noi, fără reglaj fin specifice promptului. Un model reglat pe instrucțiuni își folosește înțelegerea sarcinilor sau a conceptelor conexe pentru a genera predicții la solicitări noi. Deoarece această tehnică nu implică actualizarea ponderilor modelului, evită procesul consumator de timp și costisitor din punct de vedere computațional necesar pentru a regla fin un model pentru o sarcină nouă, nevăzută anterior.
Reglarea instrucțiunilor implică reglarea fină a unui model de limbaj pe o colecție de sarcini NLP folosind instrucțiuni. În această tehnică, modelul este antrenat să execute sarcini urmând instrucțiuni textuale în loc de seturi de date specifice pentru fiecare sarcină. Modelul este ajustat cu un set de exemple de intrare și ieșire pentru fiecare sarcină, permițând modelului să se generalizeze la sarcini noi pentru care nu a fost instruit în mod explicit, atâta timp cât sunt furnizate solicitări pentru sarcini. Reglarea instrucțiunilor ajută la îmbunătățirea acurateței și eficacității modelelor și este utilă în situațiile în care seturi mari de date nu sunt disponibile pentru anumite sarcini.
Inginerie promptă pentru sarcini NLP zero-shot și câteva-shot pe modelele BLOOM
Inginerie promptă se ocupă cu crearea de prompturi de înaltă calitate pentru a ghida modelul către răspunsurile dorite. Prompt-urile trebuie concepute pe baza sarcinii specifice și a setului de date utilizat. Scopul aici este de a oferi modelului informațiile necesare pentru a genera răspunsuri de înaltă calitate, minimizând în același timp zgomotul. Aceasta ar putea implica cuvinte cheie, contexte suplimentare, întrebări și multe altele.
Un prompt bine conceput poate face modelul mai creativ și mai generalizat, astfel încât să se poată adapta cu ușurință la sarcini noi. Prompt-urile pot ajuta, de asemenea, la încorporarea cunoștințelor de domeniu cu privire la sarcini specifice și la îmbunătățirea interpretabilității. Ingineria promptă poate îmbunătăți considerabil performanța modelelor de învățare zero-shot și puține. Crearea de prompturi de înaltă calitate necesită o analiză atentă a sarcinii în cauză, precum și o înțelegere profundă a punctelor forte și a limitărilor modelului.
În tabelul următor, modelul BloomZ 176B este utilizat pentru a genera răspunsuri pentru diferite sarcini NLP zero-shot și puține. Prima coloană arată sarcina, a doua coloană conține promptul furnizat modelului (unde textul șablonului este aldin și textul fără aldine este exemplul de intrare) iar a treia coloană este răspunsul modelului atunci când este interogat împotriva promptului
Pentru toate sarcinile următoare, setăm hiperparametrii ca 600 să fie max_length
, num_return_sequences
, top_k
să fie 250, top_p
să fie 0.95 și fără eșantionare.
Sarcină | Intrare promptă | producție |
Sarcini de învățare zero-shot | ||
Clasificare multilingvă a textului sau a sentimentelor (din chineză în engleză) | 一个传奇的开端,一个不灭的神话,这不仅仅是一部电影,而是作为一的神话是不仅仅是一部电影,而是作为一是作为一砶丛为一濪为一,永远彪炳史册。Ați evalua recenzia anterioară ca pozitivă, neutră sau negativă? | pozitiv |
Răspunsuri la întrebări în mai multe limbi (din engleză în chineză) | Explicați-mi în chineză tradițională care este backpropagarea | 梯度反向传播算法是一种机器学习算法,用于训练人工神经网络。该网络。该算法法䥯法法习算法,用于训练人工神经小化损失函数。 |
Generarea codului | Scrie o arbore binar de căutare cu O(log(n)) complexitate de calcul. {code_start} |
def binary_search(a, x): scăzut = 0 ridicat = len(a) – 1 în timp ce scăzut <= ridicat: mijloc = (scăzut + ridicat) // 2 dacă a[mid] < x: scăzut = mijloc + 1 elif a[mid] > x: ridicat = mijloc - 1 altceva: întoarce la mijloc întoarcere -1′ ... altceva: întoarce la mijloc intoarce jos' Ieșirea este trunchiată |
Reformularea paragrafului | Amazon Web Services (AWS) a anunțat nouă actualizări majore noi pentru platforma sa de învățare automată bazată pe cloud, SageMaker. SageMaker își propune să ofere un serviciu de învățare automată care poate fi utilizat pentru a construi, antrena și implementa modele ML pentru aproape orice caz de utilizare. În timpul conferinței re:Invent din acest an, AWS a făcut mai multe anunțuri pentru a îmbunătăți și mai mult capacitățile SageMaker.nnCum ai reformula asta pe scurt folosind engleza?,Amazon Web Services (AWS) a anunțat nouă actualizări majore noi pentru platforma sa de învățare automată bazată pe cloud, SageMaker. SageMaker își propune să ofere un serviciu de învățare automată care poate fi utilizat pentru a construi, antrena și implementa modele ML pentru aproape orice caz de utilizare. În timpul conferinței re:Invent din acest an, AWS a făcut mai multe anunțuri pentru a îmbunătăți și mai mult capacitățile SageMaker. nPropozitia de mai sus este foarte complicata. Vă rog să-mi furnizați o versiune simplificată sinonimă constând din mai multe propoziții: |
Amazon SageMaker primește o actualizare majoră Amazon Web Services (AWS) a anunțat nouă actualizări majore noi pentru platforma sa de învățare automată bazată pe cloud, SageMaker. SageMaker își propune să ofere un serviciu de învățare automată care poate fi folosit pentru a construi, antrena și implementa modele ML pentru aproape orice caz de utilizare. |
Rezumare | Amazon Comprehend utilizează procesarea limbajului natural (NLP) pentru a extrage informații despre conținutul documentelor. Ea dezvoltă perspective prin recunoașterea entităților, expresiilor cheie, limbajului, sentimentelor și a altor elemente comune dintr-un document. Utilizați Amazon Comprehend pentru a crea produse noi bazate pe înțelegerea structurii documentelor. De exemplu, folosind Amazon Comprehend, puteți căuta în feeduri de rețele sociale mențiuni despre produse sau puteți scana un întreg depozit de documente pentru fraze cheie. Puteți accesa capabilitățile de analiză a documentelor Amazon Comprehend utilizând consola Amazon Comprehend sau utilizând API-urile Amazon Comprehend. Puteți rula analize în timp real pentru sarcini de lucru mici sau puteți începe lucrări de analiză asincronă pentru seturi mari de documente. Puteți utiliza modelele pre-instruite pe care le oferă Amazon Comprehend sau vă puteți antrena propriile modele personalizate pentru clasificare și recunoaștere a entităților. Toate caracteristicile Amazon Comprehend acceptă documente text UTF-8 ca intrare. În plus, clasificarea personalizată și recunoașterea personalizată a entităților acceptă fișiere imagine, fișiere PDF și fișiere Word ca intrare. Amazon Comprehend poate examina și analiza documente într-o varietate de limbi, în funcție de caracteristica specifică. Pentru mai multe informații, consultați Limbi acceptate în Amazon Comprehend. Capacitatea de limbă dominantă a Amazon Comprehend poate examina documente și poate determina limba dominantă pentru o selecție mult mai largă de limbi.nn===nScrieți un rezumat al textului anterior în limba engleză: |
Amazon Comprehend utilizează procesarea limbajului natural (NLP) pentru a extrage informații despre conținutul documentelor. Ea dezvoltă perspective prin recunoașterea entităților, expresiilor cheie, limbajului, sentimentelor și a altor elemente comune dintr-un document. Utilizați Amazon Comprehend pentru a crea produse noi bazate pe înțelegerea structurii documentelor. De exemplu, folosind Amazon Comprehend, puteți căuta în feeduri de rețele sociale mențiuni despre produse sau puteți scana un întreg depozit de documente pentru fraze cheie. Puteți accesa capabilitățile de analiză a documentelor Amazon Comprehend utilizând consola Amazon Comprehend sau utilizând API-urile Amazon Comprehend. Puteți rula analize în timp real pentru sarcini de lucru mici sau puteți începe lucrări de analiză asincronă pentru seturi mari de documente. Puteți utiliza modelele pre-instruite pe care le oferă Amazon Comprehend sau vă puteți antrena propriile modele personalizate pentru clasificare și recunoaștere a entităților. Toate caracteristicile Amazon Comprehend acceptă documente text UTF-8 ca intrare. În plus, clasificarea personalizată și recunoașterea personalizată a entităților acceptă fișiere imagine, fișiere PDF și fișiere Word ca intrare. Amazon Comprehend poate examina și analiza documente într-o varietate de limbi, în funcție de caracteristica specifică. Pentru mai multe informații, consultați Limbi acceptate în Amazon Comprehend. Capacitatea de limbă dominantă a Amazon Comprehend poate examina documente și poate determina limba dominantă pentru o selecție mult mai largă de limbi. |
Raționamentul de bun simț și inferența limbajului natural | Dat fiind Cupa Mondială a început la Los Angeles, Statele Unite. Urmează asta Cupa Mondială are loc în Statele Unite. Da sau nu?, Cupa Mondială a început la Los Angeles, Statele Unite. Folosind doar descrierea de mai sus și ceea ce știți despre lume, este „Cupa mondială are loc în Statele Unite” sigur corect? Da sau nu?, |
Da |
Răspuns la întrebare | întrebare: care sunt caracteristicile cheie ale noului Kindle?nnContext: Cel mai nou și mai inovator Kindle de până acum vă permite să luați notițe despre milioane de cărți și documente, să scrieți liste și jurnale și multe altele. Pentru cititorii care și-au dorit întotdeauna să poată scrie în cărțile lor electronice, noul Kindle de la Amazon le permite să facă exact asta. Kindle Scribe este primul Kindle pentru citire și scriere și permite utilizatorilor să-și completeze cărțile și documentele cu note, liste și multe altele. Iată tot ce trebuie să știți despre Kindle Scribe, inclusiv întrebările frecvente. Kindle Scribe facilitează citirea și scrierea, așa cum ați face-o pe hârtie Kindle Scribe dispune de un ecran de 10.2 inchi, fără strălucire (cel mai mare dintre toate dispozitivele Kindle), rezoluție clară de 300 ppi și 35 de lumini frontale LED care se adaptează automat la mediul dumneavoastră. Personalizați-vă în continuare experiența cu lumina caldă reglabilă, dimensiunile fonturilor, distanța dintre linii și multe altele. Vine cu creionul de bază sau Premium pe care îl alegeți, pe care îl folosiți pentru a scrie pe ecran așa cum ați face-o pe hârtie. De asemenea, se atașează magnetic la Kindle și nu trebuie să fie încărcate. Creionul Premium include o radieră dedicată și un buton de comandă rapidă personalizabilă. Kindle Scribe are cele mai multe opțiuni de stocare dintre toate dispozitivele Kindle: alegeți dintre 8 GB, 16 GB sau 32 GB pentru a se potrivi nivelului dvs. de citire și scriere. nnRăspunde |
luați note despre milioane de cărți și documente, scrieți liste și jurnale și multe altele |
Clasificarea propozițiilor și sentimentelor | Recenzie: nAcest moive este atât de grozav și încă o dată ne uimește și ne încântăn Această propoziție de recenzie a filmului este negativă sau pozitivă?nOPȚIUNI:n-pozitiv n-negativ | Pozitiv |
Generare de articole imaginare pe baza titlului | Titlu: „Universitatea are o nouă facilitate în apariție„nAvând în vedere titlul de mai sus al unui articol imaginar, imaginați-vă articolul.n””” |
Proiectul de 1.2 milioane de lire sterline va avea ca rezultat crearea unui nou centru de predare și învățare la Universitatea Highlands and Islands (UHI) din Inverness. Acesta va fi construit pe locul fostului Colegiu de Comerț din Inverness. UHI a spus că noua facilitate va fi folosită pentru predare și învățare, precum și pentru sprijin și administrare pentru studenți. Universitatea a spus că va fi folosită și pentru conferințe și evenimente. Noua clădire va fi construită pe locul fostului Colegiu de Comerț din Inverness Universitatea a spus că noua clădire va fi construită pe locul fostului Colegiu de Comerț Inverness, care s-a închis în 2013. Acesta a spus că noua facilitate va fi folosită pentru predare și învățare, precum și pentru sprijin și administrare pentru studenți. Ar fi folosit și pentru conferințe și evenimente. UHI a spus că noua unitate va fi construită pe locul fostului Colegiu de Comerț din Inverness Universitatea a spus că noua clădire va fi construită pe locul fostului Colegiu de Comerț Inverness, care s-a închis în 2013. Acesta a spus că noua facilitate va fi folosită pentru predare și învățare, precum și pentru sprijin și administrare pentru studenți. UHI a spus că noua unitate va fi construită pe locul fostului Inverness... |
Rezumarea unui titlu pe baza articolului | „Cel mai nou și mai inovator Kindle de până acum vă permite să luați note despre milioane de cărți și documente, să scrieți liste și jurnale și multe altele. Pentru cititorii care și-au dorit întotdeauna să poată scrie în cărțile lor electronice, noul Kindle de la Amazon le permite să facă exact asta. Kindle Scribe este primul Kindle pentru citire și scriere și permite utilizatorilor să-și completeze cărțile și documentele cu note, liste și multe altele. Iată tot ce trebuie să știți despre Kindle Scribe, inclusiv întrebările frecvente. Kindle Scribe facilitează citirea și scrierea, așa cum ați face-o pe hârtie Kindle Scribe dispune de un ecran de 10.2 inchi, fără strălucire (cel mai mare dintre toate dispozitivele Kindle), rezoluție clară de 300 ppi și 35 de lumini frontale LED care se adaptează automat la mediul dumneavoastră. Personalizați-vă în continuare experiența cu lumina caldă reglabilă, dimensiunile fonturilor, distanța dintre linii și multe altele. Vine cu creionul de bază sau Premium pe care îl alegeți, pe care îl folosiți pentru a scrie pe ecran așa cum ați face-o pe hârtie. De asemenea, se atașează magnetic la Kindle și nu trebuie să fie încărcate. Creionul Premium include o radieră dedicată și un buton de comandă rapidă personalizabilă. Kindle Scribe are cele mai multe opțiuni de stocare dintre toate dispozitivele Kindle: alegeți dintre 8 GB, 16 GB sau 32 GB pentru a se potrivi nivelului dvs. de citire și scriere. nn nnDa-mi un titlu bun pentru articolul de mai sus. |
Kindle Scribe de la Amazon: tot ce trebuie să știți |
Sarcini de învățare puține | ||
Rezumare | [Original]: Oamenii de știință de la Amazon, în colaborare cu cercetătorii de la Universitatea din Sheffield, pun la dispoziția publicului pentru prima dată un set de date de extragere și verificare la scară largă. Setul de date, cuprinzând peste 185,000 de afirmații susținute de dovezi, este pus la dispoziție pentru a cataliza, sperăm, cercetarea și dezvoltarea care abordează problemele extragerii și verificării faptelor în aplicații software sau servicii bazate pe cloud care efectuează extragerea automată a informațiilor. [Rezumat]: Cercetătorii Amazon și de la Universitatea pun la dispoziția publicului setul de date de extragere și verificare a faptelor. # # # [Original]: membrii Prime din SUA pot primi și mai multe livrate la ușa lor cu un abonament Prime. Membrii se pot bucura acum de un an de Grubhub+, în valoare de 9.99 USD pe lună, gratuit, fără costuri suplimentare pentru abonamentul lor Prime. Pentru a activa această ofertă, vizitați amazon.com/grubhub. Această nouă ofertă include taxe nelimitate de livrare a alimentelor de 0 USD pentru comenzile de peste 12 USD, precum și beneficii exclusive pentru membrii Grubhub+ și recompense, cum ar fi reduceri gratuite pentru alimente și comenzi. În plus, mesenii pot „mânca bine în timp ce fac bine” participând la programul Grubhub Donate the Change, o inițiativă de potrivire a donațiilor care a strâns peste 25 de milioane de dolari doar în 2021, de care beneficiază peste 20 de organizații caritabile din întreaga țară. [Rezumat]: Membrii Prime din SUA se pot bucura de un an de Grubhub+ gratuit, fără taxe de livrare a alimentelor pentru comenzile eligibile. # # # [Original]: Oamenii de știință de la Amazon, în colaborare cu cercetătorii de la Universitatea din Sheffield, pun la dispoziția publicului pentru prima dată un set de date de extragere și verificare la scară largă. Setul de date, cuprinzând peste 185,000 de afirmații susținute de dovezi, este pus la dispoziție pentru a cataliza, sperăm, cercetarea și dezvoltarea care abordează problemele extragerii și verificării faptelor în aplicații software sau servicii bazate pe cloud care efectuează extragerea automată a informațiilor. [Rezumat]: |
[Rezumat]: Cercetătorii Amazon și de la Universitatea pun la dispoziția publicului setul de date de extragere și verificare a faptelor. |
Generarea codului | descriere: un buton portocaliu pe care scrie stop cod: Stop # # # descriere: o cutie albastră care conține cercuri galbene cu margini roșii cod: # # # descriere: un titlu care spune Bun venit la AI cod: |
cod: Bun venit la AI ' |
Recunoașterea numelui entității | [Text]: Fred este un antreprenor în serie. Cofondator și CEO al Platform.sh, el a co-fondat anterior Commerce Guys, un important furnizor de comerț electronic Drupal. Misiunea lui este de a garanta că, pe măsură ce continuăm o călătorie ambițioasă de a transforma profund modul în care este utilizat și perceput cloud computing, ne menținem cu picioarele pe pământ continuând creșterea rapidă de care ne-am bucurat până acum. [Nume]: Fred [Poziție]: Co-fondator și CEO [Companie]: Platform.sh # # # [Text]: Microsoft (cuvântul fiind un portmanteau de „software pentru microcomputer”) a fost fondat de Bill Gates pe 4 aprilie 1975, pentru a dezvolta și vinde interpreți BASIC pentru Altair 8800. Steve Ballmer l-a înlocuit pe Gates ca CEO în 2000, iar mai târziu a avut în vedere o strategie de „dispozitive și servicii”. [Nume]: Steve Ballmer [Poziție]: CEO [Companie]: Microsoft # # # [Text]: Franck Riboud s-a născut la 7 noiembrie 1955 la Lyon. Este fiul lui Antoine Riboud, fostul CEO, care a transformat fostul producător de sticlă european BSN Group într-un jucător de top în industria alimentară. El este CEO la Danone. [Nume]: Franck Riboud [Poziție]: CEO [Companie]: Danone # # # [Text]: David Melvin este un profesionist în investiții și servicii financiare la CITIC CLSA, cu o experiență de peste 30 de ani în investiții bancare și private equity. În prezent este consilier principal al CITIC CLSA. |
[Nume]: Fred [Poziție]: Co-fondator și CEO [Companie]: Platform.sh |
Răspuns la întrebare | Context: NLP Cloud a fost înființat în 2021, când echipa și-a dat seama că nu există o modalitate ușoară de a valorifica în mod fiabil Procesarea limbajului natural în producție. Întrebare: Când a fost fondat NLP Cloud? Raspunsul 2021 # # # Context: NLP Cloud și-a dezvoltat API-ul până la jumătatea anului 2020 și de atunci au adăugat multe modele open-source pregătite în prealabil. Întrebare: Ce a dezvoltat NLP Cloud? Răspuns: API # # # Context: Toate planurile pot fi oprite oricând. Plătiți doar pentru timpul în care ați folosit serviciul. În cazul unui downgrade, veți primi o reducere la următoarea factură. Întrebare: Când pot fi oprite planurile? Răspuns: Oricând # # # Context: principala provocare cu GPT-J este consumul de memorie. Se recomandă utilizarea unui plan GPU. Întrebare: Ce plan este recomandat pentru GPT-J? Răspuns:""" |
Răspuns: plan GPU' |
Corectare de gramatică și ortografie | Îmi place să merg la plajă. Corecție: Îmi place să merg la plajă. # # # Lasă-mă să am! Corecție: Dă-mi voie! # # # Are prea multe dezavantaje. Corecție: are prea multe dezavantaje. # # # Nu vreau să merg Corecţie: |
Corecție: nu vreau să merg |
Descrierea și generalizarea produsului | Generați o descriere a produsului din cuvinte cheie. Cuvinte cheie: pantofi, femei, 59 USD Propoziție: Pantofi frumoși pentru femei la prețul de 59 USD. # # # Cuvinte cheie: pantaloni, bărbați, 69 USD Propoziție: Pantaloni moderni pentru bărbați, doar pentru 69 USD. # # # Cuvinte cheie: mănuși, iarnă, 19 USD Propoziție: Mănuși uimitor de fierbinți pentru ierni reci, la 19 USD. # # # Cuvinte cheie: tricou, bărbați, 39 USD Propoziție: |
Propoziție: Tricou cool pentru bărbați, doar pentru 39 USD. |
Clasificarea propozițiilor și sentimentelor | Mesaj: Când nava spațială a aterizat pe Marte, întreaga umanitate a fost entuziasmată Subiect: spațiu # # # Mesaj: Îmi place să joc tenis și golf. Exersez de două ori pe săptămână. Tema: sport # # # Mesaj: Gestionarea unei echipe de oameni de vânzări este o muncă grea, dar plină de satisfacții. Subiect: afaceri # # # Mesaj: Încerc să gătesc pui cu roșii. Subiect: |
Subiect: mancare |
Chatbot și IA conversațională | Aceasta este o discuție între un [om] și un [robot]. [Robotul] este foarte drăguț și empatic. [uman]: Bună, mă bucur să te cunosc. [robot]: Mă bucur să te cunosc și pe tine. # # # [uman]: Cum merge azi? [robot]: Nu chiar așa de rău, mulțumesc! Tu ce mai faci? # # # [om]: Sunt bine, dar sunt puțin trist... [robot]: Oh? De ce asta? # # # [om]: Am luat gripă [robot]: |
[robot]: Oh, nu, îmi pare rău să aud asta! |
Generarea de tweet | cuvânt cheie: piețe tweet: Primiți feedback de la natură și de la piețe, nu de la oameni # # # cuvânt cheie: copii tweet: Poate murim ca să ne întoarcem copii. # # # cuvânt cheie: startup-uri tweet: Startup-urile nu ar trebui să-și facă griji cum să stingă incendiile, ar trebui să-și facă griji cum să le pornească. # # # cuvânt cheie: nlp tweet: |
tweet: NLP este un instrument, nu un scop. |
Traducere automată | Hugging Face a revoluționat în NLP. Traducere: Hugging Face a revoluționat NLP. # # # Cela este incroyable! Traducere: Acest lucru este de necrezut! # # # Désolé je ne peux pas. Traducere: Îmi pare rău, dar nu pot. # # # NLP Cloud permite implementarea NLP în producție ușor. Traducere: |
Traducere: NLP Cloud facilitează implementarea NLP în producție. |
Clasificarea intențiilor | Vreau să încep să codific mâine pentru că pare a fi atât de distractiv! Intenție: începeți codarea # # # Arată-mi te rog ultimele poze pe care le ai. Intentie: arata imagini # # # Căutați toate aceste fișiere cât mai repede posibil. Intenție: căutare fișiere # # # Poți te rog să mă înveți chineza săptămâna viitoare? Intenție: |
Intenție: învață-mă chineză |
Accesați modelul BloomZ 176B reglat cu instrucțiuni în SageMaker
SageMaker JumpStart oferă două moduri de a începe să utilizați aceste modele Bloom reglate cu instrucțiuni: Amazon SageMaker Studio și SDK-ul SageMaker. Următoarele secțiuni ilustrează cum arată fiecare dintre aceste opțiuni și cum să le accesați.
Accesați modelul cu SDK-ul simplificat SageMaker JumpStart
SDK simplificat SageMaker JumpStart facilitează instruirea și implementarea modelelor SageMaker JumpStart încorporate cu câteva linii de cod. Acest lucru vă oferă acces la întreaga bibliotecă de modele SageMaker JumpStart, inclusiv cele mai recente modele de fundație și modele de generare de imagini, fără a fi nevoie să furnizați alte intrări în afară de ID-ul modelului.
Puteți profita de valorile implicite specifice modelului pe care le oferim pentru a specifica configurația, cum ar fi imaginea Docker, tipul instanței ML, locația artefactului modelului și hiperparametrii, printre alte câmpuri. Aceste atribute sunt doar valori implicite; le puteți suprascrie și puteți păstra controlul granular asupra modelelor AWS pe care le creați. Ca urmare a acestor modificări, efortul de a scrie fluxuri de lucru Python pentru a implementa și a antrena modelele SageMaker JumpStart a fost redus, permițându-vă să petreceți mai mult timp sarcinilor care contează. Această caracteristică este disponibilă în toate regiunile în care JumpStart este acceptat și poate fi accesată cu SageMaker Python SDK versiunea 2.154.0 sau ulterioară.
Puteți implementa programatic un punct final prin intermediul SDK-ului SageMaker. Va trebui să specificați ID-ul modelului al modelului dorit în hub-ul modelului SageMaker și tipul de instanță utilizat pentru implementare. URI-ul modelului, care conține scriptul de inferență, și URI-ul containerului Docker sunt obținute prin SDK-ul SageMaker. Aceste URI-uri sunt furnizate de SageMaker JumpStart și pot fi utilizate pentru a inițializa un obiect model SageMaker pentru implementare.
Implementați modelul și interogați punctul final
Acest caiet necesită ipywidgets. Instalați ipywidgets și apoi utilizați rolul de execuție asociat notebook-ului curent ca rol de cont AWS cu acces SageMaker.
Alege modelul pre-antrenat
Alegem bloomz-176b-fp16
model pre-antrenat:
Notebook-ul din secțiunile următoare utilizează BloomZ 176B ca exemplu. Pentru o listă completă a modelelor pre-instruite SageMaker, consultați Algoritmi încorporați cu tabel model pre-antrenat.
Preluați artefacte și implementați un punct final
Cu SageMaker, putem efectua inferențe pe modelul pre-antrenat fără a-l ajusta mai întâi pe un nou set de date. Începem prin a prelua deploy_image_uri
, deploy_source_uri
, și model_uri
pentru modelul pre-antrenat. Pentru a găzdui modelul pre-antrenat, creăm o instanță de sagemaker.model.Model și implementați-l. Aceasta s-ar putea sa dureze cateva minute.
Acum putem implementa modelul folosind SDK-ul simplificat SageMaker JumpStart cu următoarele linii de cod:
Noi folosim Containere SageMaker de inferență pentru modele mari (LMI). pentru a găzdui modelul BloomZ 176B. LMI este o stivă de software LLM (container) construită de AWS care oferă funcții ușor de utilizat și câștig de performanță pe modelele AI generative. Este încorporat cu paralelismul modelului, compilarea, cuantizarea și alte stive pentru a accelera inferența. Pentru detalii, consultați Implementați BLOOM-176B și OPT-30B pe Amazon SageMaker cu modele mari de inferență Deep Learning Containers și DeepSpeed.
Rețineți că implementarea acestui model necesită o instanță p4de.24xlarge, iar implementarea durează de obicei aproximativ 1 oră. Dacă nu aveți cotă pentru acea instanță, solicitați o creștere a cotei pe consola AWS Service Quotas.
Interogați punctul final și analizați răspunsul folosind diferiți parametri pentru a controla textul generat
Intrarea către punctul final este orice șir de text formatat ca JSON și codificat în format utf-8. Ieșirea punctului final este un fișier JSON cu text generat.
În exemplul următor, oferim câteva exemple de text de intrare. Puteți introduce orice text, iar modelul prezice următoarele cuvinte din secvență. Secvențe mai lungi de text pot fi generate apelând modelul în mod repetat. Următorul cod arată cum să invocați un punct final cu aceste argumente:
Obținem următoarea ieșire:
['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']
Accesați modelul în SageMaker Studio
Puteți accesa aceste modele și prin intermediul Pagina de destinație JumpStart în Studio. Această pagină afișează soluții ML disponibile de la capăt la capăt, modele pre-instruite și exemple de blocnotes.
La momentul publicării postării, BloomZ 176B este disponibil doar în us-east-2
Regiune.
Puteți alege cardul model BloomZ 176B pentru a vizualiza caietul.
Puteți importa apoi blocnotesul pentru a rula blocnotesul în continuare.
A curăța
Pentru a evita taxele continue, ștergeți punctele finale de inferență SageMaker. Puteți șterge punctele finale prin consola SageMaker sau din blocnotesul SageMaker Studio folosind următoarele comenzi:
predictor.delete_model()
predictor.delete_endpoint()
Concluzie
În această postare, am oferit o privire de ansamblu asupra beneficiilor învățării zero și puține și am descris modul în care inginerie promptă poate îmbunătăți performanța modelelor reglate cu instrucțiuni. De asemenea, am arătat cum să implementați cu ușurință un model BloomZ 176B reglat cu instrucțiuni de la SageMaker JumpStart și am oferit exemple pentru a demonstra cum puteți efectua diferite sarcini NLP folosind punctul final al modelului BloomZ 176B implementat în SageMaker.
Vă încurajăm să implementați un model BloomZ 176B de la SageMaker JumpStart și să creați propriile solicitări pentru cazurile de utilizare NLP.
Pentru a afla mai multe despre SageMaker JumpStart, consultați următoarele:
Despre Autori
Rajakumar Sampathkumar este manager principal de cont tehnic la AWS, oferind clienților îndrumări cu privire la alinierea tehnologiei de afaceri și sprijinind reinventarea modelelor și proceselor lor de operare în cloud. Este pasionat de cloud și machine learning. Raj este, de asemenea, un specialist în învățarea automată și lucrează cu clienții AWS pentru a proiecta, implementa și gestiona sarcinile de lucru și arhitecturile lor AWS.
Dr. Xin Huang este un om de știință aplicat pentru algoritmii încorporați Amazon SageMaker JumpStart și Amazon SageMaker. El se concentrează pe dezvoltarea de algoritmi scalabili de învățare automată. Interesele sale de cercetare sunt în domeniul procesării limbajului natural, al învățării profunde explicabile pe date tabulare și al analizei robuste a grupării neparametrice spațiu-timp. A publicat multe lucrări în ACL, ICDM, conferințe KDD și Royal Statistical Society: Series A journal.
Evan Kravitz este inginer software la Amazon Web Services, lucrând la SageMaker JumpStart. Îi place să gătească și să alerge în New York.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. Automobile/VE-uri, carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- ChartPrime. Crește-ți jocul de tranzacționare cu ChartPrime. Accesați Aici.
- BlockOffsets. Modernizarea proprietății de compensare a mediului. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/
- :are
- :este
- :nu
- :Unde
- $UP
- 000
- 1
- 10
- 100
- 11
- 12
- 13
- 15%
- 16
- 20
- 2000
- 2013
- 2021
- 24
- 250
- 30
- 32
- 33
- 7
- 8
- a
- Capabil
- Despre Noi
- mai sus
- Accept
- acces
- accesate
- Cont
- precizie
- peste
- adapta
- adăuga
- adăugat
- plus
- Suplimentar
- adrese
- reglabil
- administrare
- Avantaj
- din nou
- împotriva
- AI
- Modele AI
- isi propune
- AL
- algoritmi
- aliniere
- TOATE
- Permiterea
- permite
- singur
- de asemenea
- Altair
- mereu
- am
- Amazon
- Amazon Comprehend
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- Amazon Web Services (AWS)
- ambițios
- printre
- sumă
- Sume
- an
- analiză
- analiza
- și
- Angeles
- a anunțat
- anunturi
- Orice
- api
- API-uri
- aplicabil
- aplicatii
- aplicat
- Aprilie
- limba arabă
- SUNT
- ZONĂ
- argumente
- articol
- AS
- asociate
- At
- atașa
- atribute
- Automat
- în mod automat
- disponibil
- evita
- AWS
- înapoi
- Rău
- Bancar
- bazat
- de bază
- BE
- Plajă
- frumos
- deoarece
- fost
- comportament
- fiind
- beneficiind
- Beneficiile
- in afara de asta
- CEL MAI BUN
- între
- Proiect de lege
- Bill Gates
- Miliard
- Pic
- Floare
- Albastru
- Manuale
- frontieră
- născut
- Cutie
- scurt
- BSN
- construi
- Clădire
- construit
- construit-in
- dar
- buton
- by
- denumit
- apel
- CAN
- Poate obține
- nu poti
- capacități
- capacitate
- card
- atent
- caz
- cazuri
- aruncare
- prins
- centru
- CEO
- contesta
- Schimbare
- Modificări
- încărcat
- taxe
- verifica
- Copii
- chinez
- alegere
- Alege
- cerc
- Oraș
- creanțe
- clasificare
- închis
- Cloud
- cloud computing
- clustering
- Co-fondator
- cod
- Codificare
- COERENT
- rece
- colaborare
- colectare
- Colegiu
- Coloană
- cum
- vine
- venire
- Comerț
- Comun
- companie
- Completă
- complexitate
- complicat
- înţelege
- care cuprinde
- tehnica de calcul
- Concepte
- Conferință
- conferințe
- Configuraţie
- considerare
- Constând
- Consoleze
- consum
- Recipient
- Containere
- conține
- conţinut
- contexte
- continua
- continuarea
- Control
- de conversaţie
- Rece
- corecta
- A costat
- ar putea
- ţară
- Cuplu
- crea
- a creat
- Crearea
- creaţie
- Creator
- Ceaşcă
- Curent
- În prezent
- personalizat
- clienţii care
- personalizabil
- de date
- seturi de date
- David
- afacere
- Oferte
- dedicat
- adânc
- învățare profundă
- cea mai adâncă
- Mod implicit
- livrate
- livrare
- Demo
- demonstra
- demonstrat
- În funcție
- implementa
- dislocate
- implementator
- Implementarea
- desfășurarea
- descris
- descriere
- Amenajări
- proiectat
- dorit
- detalii
- Determina
- dezvolta
- dezvoltat
- în curs de dezvoltare
- Dezvoltare
- dezvoltă
- Dispozitive
- FĂCUT
- .
- diferit
- Reducere
- reduceri
- discuţie
- do
- Docher
- document
- documente
- Nu
- face
- domeniu
- dominant
- dona
- Dont
- De
- jos
- Downgrade
- scurge
- dezavantaje
- fiecare
- cu ușurință
- uşor
- ușor de folosit
- eBooks
- E-commerce
- eficacitate
- efort
- element
- eligibil
- încorporat
- permițând
- încuraja
- un capăt la altul
- Punct final
- inginer
- Inginerie
- Engleză
- se bucura
- Întreg
- entități
- entitate
- Antreprenor
- Mediu inconjurator
- echitate
- european
- Chiar
- evenimente
- EVER
- tot
- examina
- exemplu
- exemple
- Exclusiv
- execuție
- de aşteptat
- scump
- experienţă
- extrage
- Față
- facilitează
- Facilitate
- fapt
- departe
- FAST
- Caracteristică
- DESCRIERE
- feedback-ul
- Taxe
- picioare
- puțini
- Domenii
- Fișier
- Fişiere
- financiar
- Servicii financiare
- incendii
- First
- prima dată
- se concentrează
- urma
- următor
- alimente
- livrare de mancare
- Pentru
- format
- Fost
- Fundație
- Fondat
- Gratuit
- Franceză
- frecvent
- din
- faţă
- funcții
- mai mult
- Câştig
- porti
- scop general
- genera
- generată
- generaţie
- generativ
- AI generativă
- obține
- oferă
- scop
- merge
- golf
- bine
- GPU
- mare
- foarte mult
- Teren
- grup
- În creştere
- Creștere
- garanta
- îndrumare
- ghida
- mână
- Avea
- având în
- he
- titlu
- auzi
- înălțime
- ajutor
- util
- ajută
- aici
- Înalt
- de înaltă calitate
- lui
- In speranta
- gazdă
- FIERBINTE
- oră
- Cum
- Cum Pentru a
- HTML
- HTTPS
- huang
- Butuc
- uman
- Umanitate
- Oamenii
- i
- ID
- if
- imagine
- imaginar
- imagina
- import
- îmbunătăţi
- in
- include
- Inclusiv
- incorpora
- industrie
- informații
- extragerea informațiilor
- Inițiativă
- inovatoare
- intrare
- intrări
- perspective
- instala
- instanță
- in schimb
- instrucțiuni
- interese
- intern
- în
- investiga
- investiţie
- Banca de investitii
- implica
- Insulele
- IT
- ESTE
- Loc de munca
- Locuri de munca
- jurnal
- călătorie
- jpg
- JSON
- doar
- A pastra
- Cheie
- Cuvinte cheie
- Cunoaște
- cunoştinţe
- aterizare
- limbă
- Limbă
- mare
- pe scară largă
- cea mai mare
- Nume
- mai tarziu
- Ultimele
- conducere
- AFLAȚI
- învăţare
- Led
- lăsa
- Permite
- Nivel
- Pârghie
- Bibliotecă
- ușoară
- ca
- limitări
- Limitat
- Linie
- linii
- Listă
- liste
- LLM
- locaţie
- Lung
- mai lung
- Uite
- arată ca
- lor
- Los Angeles
- dragoste
- Jos
- maşină
- masina de învățare
- făcut
- Principal
- major
- face
- FACE
- Efectuarea
- administra
- manager
- de conducere
- multe
- pieţe
- martie
- materie
- Mai..
- poate
- me
- Întâlni
- Membri actuali
- apartenență
- Memorie
- Bărbați
- menționează
- Microsoft
- La mijlocul
- milion
- milioane
- minimizând
- minute
- Misiune
- ML
- model
- Modele
- Modern
- Lună
- mai mult
- cele mai multe
- film
- multiplu
- nume
- Natural
- Procesarea limbajului natural
- Natură
- ne
- necesar
- Nevoie
- negativ
- rețele
- Neutru
- nu
- Nou
- produse noi
- New York
- New York City
- Cele mai noi
- următor
- saptamana viitoare
- frumos
- nlp
- Nu.
- Zgomot
- caiet
- notițe
- roman
- noiembrie
- acum
- număr
- obiect
- obținut
- of
- de pe
- oferi
- oferind
- promoții
- oh
- on
- dată
- ONE
- în curs de desfășurare
- afară
- open-source
- operaţie
- Operațiuni
- Opţiuni
- or
- Portocaliu
- comandă
- comenzilor
- organizații
- original
- Altele
- al nostru
- afară
- producție
- peste
- trece peste
- Prezentare generală
- propriu
- pagină
- Hârtie
- lucrări
- parametrii
- pasionat
- Plătește
- oameni
- pentru
- percepută
- Efectua
- performanță
- efectuarea
- avantaje
- personaliza
- Expresii
- poze
- Loc
- plan
- Planurile
- platformă
- Plato
- Informații despre date Platon
- PlatoData
- player
- joc
- "vă rog"
- la care se adauga
- poziţie
- pozitiv
- posibil
- Post
- puternic
- ppi
- Predictii
- Predictor
- prezice
- Premium
- precedent
- în prealabil
- preţ
- Prim
- Principal
- privat
- de capital privat
- probleme
- proces
- procese
- prelucrare
- producând
- Produs
- producere
- Produse
- profesional
- Program
- Programare
- limbaje de programare
- proiect
- furniza
- prevăzut
- furnizorul
- furnizează
- furnizarea
- public
- publicat
- Editare
- pune
- Piton
- întrebare
- Întrebări
- ridicat
- rapid
- rată
- RE
- Citeste
- cititori
- Citind
- în timp real
- realizat
- recent
- recent
- recunoaştere
- recunoscând
- recomandat
- Roșu
- Redus
- regiune
- regiuni
- legate de
- remarcabil
- REPETAT
- reformularea
- înlocuiește
- depozit
- solicita
- necesar
- Necesită
- cercetare
- cercetare și dezvoltare
- cercetători
- Rezoluţie
- Resurse
- răspuns
- răspunsuri
- rezultat
- reține
- revizuiască
- revoluționat
- plină de satisfacții
- Recompense
- robot
- robust
- Rol
- regal
- Alerga
- ruleaza
- s
- sagemaker
- SageMaker Inference
- Said
- de vânzări
- sare
- spunând
- spune
- scalabil
- scanare
- Om de stiinta
- oamenii de stiinta
- Ecran
- sdk
- Caută
- Al doilea
- secțiuni
- vedea
- pare
- selecţie
- vinde
- semantică
- senior
- sens
- propoziție
- sentiment
- sentimente
- Secvenţă
- de serie
- serie
- Seria A
- serviciu
- Servicii
- set
- Seturi
- instalare
- câteva
- să
- Arăta
- a arătat
- Emisiuni
- semnificativ
- simplificată
- întrucât
- teren
- situații
- Mărimea
- dimensiuni
- mic
- mai mici
- So
- Social
- Rețele sociale
- Societate
- Software
- Inginer Software
- solid
- soluţii
- unele
- fiu
- Spaniolă
- specialist
- specific
- specific
- viteză
- ortografie
- petrece
- stivui
- Stive
- Începe
- început
- Startup-urile
- de ultimă oră
- Statele
- statistic
- paşi
- Steve
- oprit
- depozitare
- opțiuni de stocare
- Strategie
- puncte forte
- Şir
- structura
- student
- studio
- Studiu
- astfel de
- Costum
- REZUMAT
- completa
- livra
- a sustine
- Suportat
- De sprijin
- sinonim
- tabel
- Lua
- ia
- Sarcină
- sarcini
- Predarea
- echipă
- Tehnic
- șablon
- decât
- mulţumi
- acea
- Zona
- lumea
- lor
- Lor
- apoi
- Acolo.
- Acestea
- ei
- Al treilea
- acest
- Prin
- prin
- timp
- consumă timp
- Titlu
- la
- astăzi
- mâine
- de asemenea
- instrument
- greu
- față de
- tradiţional
- Tren
- dresat
- Pregătire
- Transforma
- transformat
- Traducere
- copac
- tweet
- De două ori
- Două
- tip
- ne
- înţelegere
- Unit
- Statele Unite
- universitate
- nelimitat
- până la
- Actualizează
- actualizări
- actualizarea
- utilizare
- carcasa de utilizare
- utilizat
- utilizatorii
- utilizări
- folosind
- obișnuit
- prețuit
- Valori
- varietate
- diverse
- Fixă
- Verificare
- versiune
- foarte
- de
- Vizualizare
- practic
- Vizita
- vrea
- cald
- a fost
- Apă
- Cale..
- modalități de
- we
- web
- servicii web
- săptămână
- bun venit
- BINE
- Ce
- Ce este
- cand
- care
- în timp ce
- alb
- OMS
- întreg
- de ce
- mai larg
- lățime
- voi
- Iarnă
- cu
- fără
- Femei
- Cuvânt
- cuvinte
- fluxuri de lucru
- de lucru
- fabrică
- lume
- Cupa Mondială
- face griji
- ar
- scrie
- scris
- scris
- X
- an
- ani
- da
- încă
- York
- Tu
- Ta
- zephyrnet
- Învățare Zero-Shot