Amazon SageMaker JumpStart er en maskinlæringshub (ML), der tilbyder algoritmer, modeller og ML-løsninger. Med SageMaker JumpStart kan ML-udøvere vælge fra en voksende liste over bedst ydende og offentligt tilgængelige fundament modeller (FM'er) som f.eks BLOOM, Lama 2, Falcon-40B, Stabil diffusion, ÅbenLLaMA, Flan-T5/UL2, eller FM'er fra Sammenhæng , Lys på.
I dette indlæg og den tilhørende notesbog viser vi, hvordan man implementerer BloomZ 176B-fundamentmodellen ved hjælp af SageMaker Python forenklet SDK in Amazon SageMaker JumpStart som et slutpunkt og bruge det til forskellige NLP-opgaver (natural language processing). Du kan også få adgang til fundamentmodellerne gennem Amazon SageMaker Studio. BloomZ 176B-modellen, en af de største offentligt tilgængelige modeller, er en state-of-the-art instruktionstunet model, der kan udføre forskellige in-context few-shot learning og zero-shot learning NLP opgaver. Instruktionsjustering er en teknik, der involverer finjustering af en sprogmodel på en samling af NLP-opgaver ved hjælp af instruktioner. For at lære mere om instruktionsindstilling, se Zero-shot prompting for Flan-T5-fundamentmodellen i Amazon SageMaker JumpStart.
Zero-shot learning i NLP gør det muligt for en præ-trænet LLM at generere svar på opgaver, som den ikke er blevet specifikt trænet til. I denne teknik er modellen forsynet med en inputtekst og en prompt, der beskriver det forventede output fra modellen i naturligt sprog. Zero-shot learning bruges i en række NLP-opgaver, såsom følgende:
- Flersproget tekst og følelsesklassificering
- Flersproget spørgsmål og svar
- Generering af kode
- Omformulering af afsnit
- Resumé
- Sund fornuft ræsonnement og naturlig sproglig slutning
- Besvarelse af spørgsmål
- Sætnings- og følelsesklassificering
- Imaginær artikelgenerering baseret på en titel
- Opsummering af en titel baseret på en artikel
Få-skudslæring involverer træning af en model til at udføre nye opgaver ved kun at give nogle få eksempler. Dette er nyttigt, hvor begrænsede mærkede data er tilgængelige til træning. Få-show-læring bruges i en række forskellige opgaver, herunder følgende:
- Tekstopsummering
- Generering af kode
- Genkendelse af navnenhed
- Besvarelse af spørgsmål
- Grammatik og stave korrektion
- Produktbeskrivelse og generalisering
- Sætnings- og følelsesklassificering
- Chatbot og konversations-AI
- Tweet generation
- Maskinoversættelse
- Hensigtsklassificering
Om Bloom
BigScience Large Open-science Open-access Multilingual (BLOOM) sprogmodel er en transformatorbaseret storsprogmodel (LLM). BLOOM er en autoregressiv LLM, der er trænet til at fortsætte tekst fra en prompt på enorme mængder tekstdata ved hjælp af beregningsressourcer i industriel skala. Som sådan er den i stand til at udskrive sammenhængende tekst, der næppe kan skelnes fra tekst skrevet af mennesker. BLOOM kan også instrueres i at udføre tekstopgaver, som det ikke er blevet eksplicit trænet til, ved at caste dem som tekstgenereringsopgaver.
Med sine 176 milliarder parametre er BLOOM i stand til at generere tekst på 46 naturlige sprog og 13 programmeringssprog. For næsten alle af dem, såsom spansk, fransk og arabisk, er BLOOM den første sprogmodel med over 100 milliarder parametre, der nogensinde er oprettet. Det kan forskere downloade, køre og studere BLOOM at undersøge ydeevnen og adfærden for nyligt udviklede LLM'er ned til deres dybeste interne operationer.
Løsningsoversigt
I dette indlæg viser vi, hvordan du bruger den topmoderne instruktionstunede BloomZ 176B-model fra Knusende ansigt til tekstgenerering. Du kan bruge BloomZ 176B-modellen med få-skuds-læring og nul-skuds-læring til mange NLP-opgaver uden at finjustere modellen. Der er ingen grund til at træne en ny model, fordi modeller som BloomZ 176B har et betydeligt antal parametre, så de nemt kan tilpasse sig mange sammenhænge uden at blive genoplært. BloomZ 176B-modellen er blevet trænet med en stor mængde data, hvilket gør den anvendelig til mange generelle opgaver.
Koden til alle trinene i denne demo er tilgængelig i det følgende notesbog.
Instruktion tuning
Størrelsen og kompleksiteten af LLM'er er eksploderet i de sidste par år. LLM'er har vist bemærkelsesværdige evner til at lære det naturlige sprogs semantik og producere menneskelignende svar. Mange nyere LLM'er er finjusteret med en kraftfuld teknik kaldet instruktion tuning, som hjælper modellen med at udføre nye opgaver eller generere svar på nye prompter uden prompt-specifik finjustering. En instruktionsjusteret model bruger sin forståelse af relaterede opgaver eller koncepter til at generere forudsigelser til nye prompter. Fordi denne teknik ikke involverer opdatering af modelvægte, undgår den den tidskrævende og beregningsmæssigt dyre proces, der kræves for at finjustere en model til en ny, hidtil uset opgave.
Instruktionsjustering involverer finjustering af en sprogmodel på en samling af NLP-opgaver ved hjælp af instruktioner. I denne teknik trænes modellen til at udføre opgaver ved at følge tekstinstruktioner i stedet for specifikke datasæt for hver opgave. Modellen er finjusteret med et sæt input- og output-eksempler for hver opgave, hvilket gør det muligt for modellen at generalisere til nye opgaver, som den ikke eksplicit er blevet trænet i, så længe der gives prompter til opgaverne. Instruktionsjustering hjælper med at forbedre nøjagtigheden og effektiviteten af modeller og er nyttig i situationer, hvor store datasæt ikke er tilgængelige til specifikke opgaver.
Hurtig ingeniørarbejde til nul- og få-skuds NLP-opgaver på BLOOM-modeller
Hurtig ingeniørarbejde beskæftiger sig med at skabe prompter af høj kvalitet til at guide modellen mod de ønskede svar. Prompter skal designes baseret på den specifikke opgave og det datasæt, der bruges. Målet her er at give modellen den nødvendige information til at generere højkvalitetssvar og samtidig minimere støj. Dette kunne involvere nøgleord, yderligere sammenhænge, spørgsmål og mere.
En veldesignet prompt kan gøre modellen mere kreativ og generaliseret, så den nemt kan tilpasse sig nye opgaver. Prompter kan også hjælpe med at inkorporere domæneviden om specifikke opgaver og forbedre fortolkningen. Hurtig ingeniørarbejde kan i høj grad forbedre ydeevnen af nul-skuds- og få-skuds-læringsmodeller. At skabe prompter af høj kvalitet kræver omhyggelig overvejelse af den aktuelle opgave, samt en dyb forståelse af modellens styrker og begrænsninger.
I den følgende tabel bruges BloomZ 176B-modellen til at generere svar for forskellige nul-skuds- og få-skuds NLP-opgaver. Den første kolonne viser opgaven, den anden kolonne indeholder den prompt, der er givet til modellen (hvor skabelonteksten er fed, og den ikke-fed tekst er eksempelinput), og den tredje kolonne er svaret fra modellen, når der forespørges mod prompten
For alle de følgende opgaver sætter vi hyperparametrene som 600 for at være max_length
, num_return_sequences
, top_k
at være 250, top_p
at være 0.95, og ingen prøveudtagning.
Opgaver | Prompt input | Produktion |
Zero-shot læringsopgaver | ||
Flersproget tekst eller følelsesklassificering (kinesisk til engelsk) | 一个传奇的开端,一个不灭的神话,这不仅仅是一部电影,而是作为丰是作为丰是作为丰,永远彪炳史册.Vil du vurdere den tidligere anmeldelse som positiv, neutral eller negativ? | positiv |
Flersproget besvarelse af spørgsmål (engelsk til kinesisk) | Forklar mig på traditionel kinesisk hvad er tilbageformeringen | 梯度反向传播算法是一种机器学习算法,用于训练人工神经网络适该算注小化损失函数. |
Generering af kode | Skriv en binært søgetræ med O(log(n)) beregningsmæssig kompleksitet. {code_start} |
def binær_søgning(a, x): lav = 0 høj = len(a) – 1 mens lav <= høj: mid = (lav + høj) // 2 hvis en[mid] < x: lav = mellem + 1 elif a[mid] > x: høj = mellem – 1 andet: retur midt retur -1′ ... andet: retur midt tilbage lavt' Output er afkortet |
Omformulering af afsnit | Amazon Web Services (AWS) har annonceret ni store nye opdateringer til sin cloud-baserede maskinlæringsplatform, SageMaker. SageMaker sigter mod at levere en maskinlæringstjeneste, som kan bruges til at bygge, træne og implementere ML-modeller til stort set enhver brug. Under dette års re:Invent-konference kom AWS med adskillige meddelelser for yderligere at forbedre SageMakers muligheder.nnHvordan ville du omformulere det kort ved at bruge engelsk?,Amazon Web Services (AWS) har annonceret ni store nye opdateringer til sin cloud-baserede maskinlæringsplatform, SageMaker. SageMaker sigter mod at levere en maskinlæringstjeneste, som kan bruges til at bygge, træne og implementere ML-modeller til stort set enhver brug. Under dette års re:Invent-konference kom AWS med adskillige meddelelser for yderligere at forbedre SageMakers muligheder. nOvenstående sætning er meget kompliceret. Giv mig venligst en forenklet synonym version bestående af flere sætninger: |
Amazon SageMaker får en større opdatering Amazon Web Services (AWS) har annonceret ni store nye opdateringer til sin cloud-baserede maskinlæringsplatform, SageMaker. SageMaker sigter mod at levere en maskinlæringstjeneste, der kan bruges til at bygge, træne og implementere ML-modeller til stort set enhver brugssituation |
Resumé | Amazon Comprehend bruger naturlig sprogbehandling (NLP) til at udtrække indsigt om indholdet af dokumenter. Det udvikler indsigt ved at genkende entiteter, nøglesætninger, sprog, følelser og andre almindelige elementer i et dokument. Brug Amazon Comprehend til at skabe nye produkter baseret på forståelse af strukturen af dokumenter. Ved at bruge Amazon Comprehend kan du for eksempel søge i sociale netværksfeeds for omtaler af produkter eller scanne et helt dokumentlager for nøglesætninger. Du kan få adgang til Amazon Comprehend-dokumentanalysefunktioner ved hjælp af Amazon Comprehend-konsollen eller ved hjælp af Amazon Comprehend API'er. Du kan køre realtidsanalyse for små arbejdsbelastninger, eller du kan starte asynkrone analysejob for store dokumentsæt. Du kan bruge de fortrænede modeller, som Amazon Comprehend leverer, eller du kan træne dine egne tilpassede modeller til klassificering og enhedsgenkendelse. Alle Amazon Comprehend-funktionerne accepterer UTF-8-tekstdokumenter som input. Derudover accepterer brugerdefineret klassificering og brugerdefineret enhedsgenkendelse billedfiler, PDF-filer og Word-filer som input. Amazon Comprehend kan undersøge og analysere dokumenter på en række forskellige sprog, afhængigt af den specifikke funktion. For mere information, se Sprog, der understøttes i Amazon Comprehend. Amazon Comprehends Dominant Language-kapacitet kan undersøge dokumenter og bestemme det dominerende sprog for et langt bredere udvalg af sprog.nn===nSkriv et resumé af den foregående tekst på engelsk: |
Amazon Comprehend bruger naturlig sprogbehandling (NLP) til at udtrække indsigt om indholdet af dokumenter. Det udvikler indsigt ved at genkende entiteter, nøglesætninger, sprog, følelser og andre almindelige elementer i et dokument. Brug Amazon Comprehend til at skabe nye produkter baseret på forståelse af strukturen af dokumenter. Ved at bruge Amazon Comprehend kan du for eksempel søge i sociale netværksfeeds for omtaler af produkter eller scanne et helt dokumentlager for nøglesætninger. Du kan få adgang til Amazon Comprehend-dokumentanalysefunktioner ved hjælp af Amazon Comprehend-konsollen eller ved hjælp af Amazon Comprehend API'er. Du kan køre realtidsanalyse for små arbejdsbelastninger, eller du kan starte asynkrone analysejob for store dokumentsæt. Du kan bruge de fortrænede modeller, som Amazon Comprehend leverer, eller du kan træne dine egne tilpassede modeller til klassificering og enhedsgenkendelse. Alle Amazon Comprehend-funktionerne accepterer UTF-8-tekstdokumenter som input. Derudover accepterer brugerdefineret klassificering og brugerdefineret enhedsgenkendelse billedfiler, PDF-filer og Word-filer som input. Amazon Comprehend kan undersøge og analysere dokumenter på en række forskellige sprog, afhængigt af den specifikke funktion. For mere information, se Sprog, der understøttes i Amazon Comprehend. Amazon Comprehends Dominant Language-kapacitet kan undersøge dokumenter og bestemme det dominerende sprog for et langt bredere udvalg af sprog. |
Sund fornuft ræsonnement og naturlig sproglig slutning | Eftersom VM er skudt i gang i Los Angeles, USA. Følger det det VM finder sted i USA. Ja eller nej?, VM er skudt i gang i Los Angeles, USA. Brug kun ovenstående beskrivelse og hvad du ved om verden, er "VM finder sted i USA" helt sikkert rigtigt? Ja eller nej?, |
Ja |
Besvarelse af spørgsmål | spørgsmål: hvad er de vigtigste funktioner i den nye Kindle?nnKontekst: Den nyeste og mest innovative Kindle til dato giver dig mulighed for at tage noter om millioner af bøger og dokumenter, skrive lister og journaler og meget mere. For læsere, der altid har ønsket, at de kunne skrive i deres e-bøger, lader Amazons nye Kindle dem gøre netop det. Kindle Scribe er den første Kindle til læsning og skrivning og giver brugerne mulighed for at supplere deres bøger og dokumenter med noter, lister og mere. Her er alt, hvad du behøver at vide om Kindle Scribe, inklusive ofte stillede spørgsmål. Kindle Scribe gør det nemt at læse og skrive, som du ville gøre på papir Kindle Scribe har en 10.2-tommer, blændfri skærm (den største af alle Kindle-enheder), skarp opløsning på 300 ppi og 35 LED-frontlygter, der automatisk tilpasser sig dit miljø. Tilpas din oplevelse yderligere med det justerbare varme lys, skriftstørrelser, linjeafstand og meget mere. Den leveres med dit valg af Basic Pen eller Premium Pen, som du bruger til at skrive på skærmen, som du ville gøre på papir. De fastgøres også magnetisk til din Kindle og behøver aldrig at blive opladet. Premium Pen inkluderer et dedikeret viskelæder og en tilpasselig genvejsknap. Kindle Scribe har flest lagermuligheder af alle Kindle-enheder: vælg mellem 8 GB, 16 GB eller 32 GB, så det passer til dit læse- og skriveniveau. nnSvar |
tage noter om millioner af bøger og dokumenter, skrive lister og journaler og meget mere |
Sætnings- og følelsesklassificering | Anmeldelse:nDette motiv er så fantastisk og igen blænder og glæder osnEr denne filmanmeldelsessætning negativ eller positiv?nVALGMULIGHEDER:n-positiv n-negativ | Positiv |
Imaginær artikelgenerering baseret på titel | Titel: "Universitetet har ny facilitet på vej"nForestil dig artiklen i betragtning af ovenstående titel på en imaginær artikel.n""" |
Projektet på £1.2 mio. vil se oprettelsen af et nyt undervisnings- og læringscenter ved University of the Highlands and Islands (UHI) i Inverness. Det vil blive bygget på stedet for det tidligere Inverness College of Commerce. UHI sagde, at den nye facilitet ville blive brugt til undervisning og læring samt studerendes støtte og administration. Universitetet sagde, at det også ville blive brugt til konferencer og arrangementer. Den nye bygning vil blive bygget på stedet for det tidligere Inverness College of Commerce Universitetet sagde, at den nye bygning ville blive bygget på stedet for det tidligere Inverness College of Commerce, som lukkede i 2013. Den sagde, at den nye facilitet ville blive brugt til undervisning og læring, såvel som studerendes støtte og administration. Det vil også blive brugt til konferencer og arrangementer. UHI sagde, at det nye anlæg ville blive bygget på stedet for det tidligere Inverness College of Commerce Universitetet sagde, at den nye bygning ville blive bygget på stedet for det tidligere Inverness College of Commerce, som lukkede i 2013. Den sagde, at den nye facilitet ville blive brugt til undervisning og læring, såvel som studerendes støtte og administration. UHI sagde, at det nye anlæg ville blive bygget på stedet for det tidligere Inverness... |
Opsummering af en titel baseret på artiklen | 'Den nyeste og mest innovative Kindle til dato giver dig mulighed for at tage noter på millioner af bøger og dokumenter, skrive lister og journaler og meget mere. For læsere, der altid har ønsket, at de kunne skrive i deres e-bøger, lader Amazons nye Kindle dem gøre netop det. Kindle Scribe er den første Kindle til læsning og skrivning og giver brugerne mulighed for at supplere deres bøger og dokumenter med noter, lister og mere. Her er alt, hvad du behøver at vide om Kindle Scribe, inklusive ofte stillede spørgsmål. Kindle Scribe gør det nemt at læse og skrive, som du ville gøre på papir Kindle Scribe har en 10.2-tommer, blændfri skærm (den største af alle Kindle-enheder), skarp opløsning på 300 ppi og 35 LED-frontlygter, der automatisk tilpasser sig dit miljø. Tilpas din oplevelse yderligere med det justerbare varme lys, skriftstørrelser, linjeafstand og meget mere. Den leveres med dit valg af Basic Pen eller Premium Pen, som du bruger til at skrive på skærmen, som du ville gøre på papir. De fastgøres også magnetisk til din Kindle og behøver aldrig at blive opladet. Premium Pen inkluderer et dedikeret viskelæder og en tilpasselig genvejsknap. Kindle Scribe har flest lagermuligheder af alle Kindle-enheder: vælg mellem 8 GB, 16 GB eller 32 GB, så det passer til dit læse- og skriveniveau. nn nnGiv mig en god titel til artiklen ovenfor. |
Amazons Kindle Scribe: Alt hvad du behøver at vide |
Få-skudte læringsopgaver | ||
Resumé | [Original]: Amazon-forskere gør i samarbejde med forskere fra University of Sheffield for første gang et storstilet faktaudtræk og verifikationsdatasæt offentligt tilgængeligt. Datasættet, der omfatter mere end 185,000 evidensunderbyggede påstande, bliver gjort tilgængeligt for forhåbentlig at katalysere forskning og udvikling, der adresserer problemerne med faktaudtræk og verifikation i softwareapplikationer eller cloud-baserede tjenester, der udfører automatisk informationsudtræk. [Opsummering]: Amazon- og universitetsforskere gør datasæt til faktaudtræk og verifikation offentligt tilgængeligt. ### [Original]: Prime-medlemmer i USA kan få endnu mere leveret til døren med et Prime-medlemskab. Medlemmer kan nu nyde et års Grubhub+ til en værdi af $9.99 per måned gratis – uden ekstra omkostninger til deres Prime-medlemskab. Besøg amazon.com/grubhub for at aktivere denne aftale. Dette nye tilbud inkluderer ubegrænsede, $0 madleveringsgebyrer på ordrer over $12 samt eksklusive frynsegoder til Grubhub+-medlemmer og belønninger som gratis mad og ordrerabatter. Derudover kan spisende gæster "spise godt, mens de gør godt" ved at tilmelde sig Grubhubs Donate the Change-program, et donationsmatchende initiativ, der alene i 25 rejste mere end $2021 millioner til gavn for mere end 20 velgørende organisationer over hele landet. [Opsummering]: Prime-medlemmer i USA kan nyde et års Grubhub+ gratis, uden madleveringsgebyrer på kvalificerede ordrer. ### [Original]: Amazon-forskere gør i samarbejde med forskere fra University of Sheffield for første gang et storstilet faktaudtræk og verifikationsdatasæt offentligt tilgængeligt. Datasættet, der omfatter mere end 185,000 evidensunderbyggede påstande, bliver gjort tilgængeligt for forhåbentlig at katalysere forskning og udvikling, der adresserer problemerne med faktaudtræk og verifikation i softwareapplikationer eller cloud-baserede tjenester, der udfører automatisk informationsudtræk. [Resumé]: |
[Resumé]: Amazon- og universitetsforskere gør dataudtræk og verifikationsdatasæt offentligt tilgængeligt. |
Generering af kode | beskrivelse: en orange knap, der siger stop kode: Stop ### beskrivelse: en blå boks, der indeholder gule cirkler med røde kanter kode: ### beskrivelse: en overskrift, der siger Velkommen til AI kode: |
kode: Velkommen til AI ' |
Genkendelse af navnenhed | [Tekst]: Fred er en serieiværksætter. Medstifter og administrerende direktør for Platform.sh, han var tidligere medstifter af Commerce Guys, en førende Drupal e-handelsudbyder. Hans mission er at garantere, at når vi fortsætter på en ambitiøs rejse til dybtgående transformation af, hvordan cloud computing bruges og opfattes, holder vi vores fødder godt på jorden og fortsætter den hurtige vækst, vi har haft indtil nu. [Navn]: Fred [Position]: Medstifter og administrerende direktør [Virksomhed]: Platform.sh ### [Tekst]: Microsoft (ordet er et portmanteau af "mikrocomputersoftware") blev grundlagt af Bill Gates den 4. april 1975 for at udvikle og sælge BASIC tolke til Altair 8800. Steve Ballmer erstattede Gates som administrerende direktør i 2000, og senere forestillede sig en "enheder og tjenester"-strategi. [Navn]: Steve Ballmer [Position]: CEO [Virksomhed]: Microsoft ### [Tekst]: Franck Riboud blev født den 7. november 1955 i Lyon. Han er søn af Antoine Riboud, den tidligere administrerende direktør, som forvandlede den tidligere europæiske glasproducent BSN Group til en førende aktør i fødevareindustrien. Han er CEO hos Danone. [Navn]: Franck Riboud [Position]: CEO [Virksomhed]: Danone ### [Tekst]: David Melvin er professionel i investerings- og finanstjenester hos CITIC CLSA med over 30 års erfaring inden for investeringsbank og private equity. Han er i øjeblikket seniorrådgiver for CITIC CLSA. |
[Navn]: Fred [Position]: Medstifter og administrerende direktør [Virksomhed]: Platform.sh |
Besvarelse af spørgsmål | Kontekst: NLP Cloud blev grundlagt i 2021, da teamet indså, at der ikke var nogen nem måde at pålideligt udnytte Natural Language Processing i produktionen. Spørgsmål: Hvornår blev NLP Cloud grundlagt? Svar: 2021 ### Kontekst: NLP Cloud udviklede deres API i midten af 2020, og de tilføjede mange forudtrænede open source-modeller siden da. Spørgsmål: Hvad udviklede NLP Cloud? Svar: API ### Kontekst: Alle planer kan stoppes når som helst. Du betaler kun for den tid, du har brugt tjenesten. I tilfælde af en nedjustering får du rabat på din næste faktura. Spørgsmål: Hvornår kan planerne stoppes? Svar: Når som helst ### Kontekst: Hovedudfordringen med GPT-J er hukommelsesforbrug. Det anbefales at bruge en GPU-plan. Spørgsmål: Hvilken plan anbefales til GPT-J? Svar:""" |
Svar: GPU-plan' |
Grammatik og stave korrektion | Jeg elsker at gå på stranden. Rettelse: Jeg elsker at gå til stranden. ### Lad mig få det! Rettelse: Lad mig få det! ### Det har for mange ulemper. Rettelse: Det har for mange ulemper. ### Jeg gider ikke gå Rettelse: |
Rettelse: Jeg vil ikke gå |
Produktbeskrivelse og generalisering | Generer en produktbeskrivelse ud fra søgeord. Nøgleord: sko, kvinder, $59 Sætning: Smukke sko til kvinder til en pris af $59. ### Nøgleord: bukser, mænd, $69 Sætning: Moderne bukser til mænd, kun for 69 $. ### Nøgleord: handsker, vinter, $19 Sætning: Utroligt varme handsker til kolde vintre, til $19. ### Nøgleord: t-shirt, mænd, $39 Dømme: |
Sætning: Fed t-shirt til mænd, for kun 39 $. |
Sætnings- og følelsesklassificering | Besked: Da rumskibet landede på Mars, var hele menneskeheden begejstret Emne: rum ### Besked: Jeg elsker at spille tennis og golf. Jeg træner to gange om ugen. Emne: sport ### Budskab: At lede et team af sælgere er et hårdt, men givende job. Emne: forretning ### Besked: Jeg forsøger at tilberede kylling med tomater. Emne: |
Emne: mad |
Chatbot og konversations-AI | Dette er en diskussion mellem et [menneske] og en [robot]. [Roboten] er meget sød og empatisk. [menneske]: Hej rart at møde dig. [robot]: Rart også at møde dig. ### [menneske]: Hvordan går det i dag? [robot]: Ikke så slemt, tak! Hvad med dig? ### [menneske]: Jeg er okay, men jeg er lidt ked af det... [robot]: Åh? Hvorfor det? ### [menneske]: Jeg fik influenza [robot]: |
[robot]: Åh nej, det er jeg ked af at høre! |
Tweet generation | nøgleord: markeder tweet: Tag feedback fra naturen og markederne, ikke fra mennesker ### nøgleord: børn tweet: Måske dør vi, så vi kan komme tilbage som børn. ### nøgleord: startups tweet: Startups bør ikke bekymre sig om, hvordan man slukker brande, de bør bekymre sig om, hvordan de starter dem. ### nøgleord: nlp tweet: |
tweet: NLP er et værktøj, ikke et mål. |
Maskinoversættelse | Hugging Face a révolutionné le NLP. Oversættelse: Hugging Face revolutionerede NLP. ### Cela est uhyggeligt! Oversættelse: Det er utroligt! ### Désolé je ne peux pas. Oversættelse: Undskyld, men jeg kan ikke. ### NLP Cloud tillader deployer af NLP og produktionsfacilitet. Oversættelse: |
Oversættelse: NLP Cloud gør det nemt at implementere NLP i produktionen. |
Hensigtsklassificering | Jeg vil begynde at kode i morgen, fordi det ser ud til at være så sjovt! Hensigt: start kodning ### Vis mig venligst de sidste billeder du har. Hensigt: Vis billeder ### Søg i alle disse filer så hurtigt som muligt. Hensigt: søg filer ### Kan du venligst lære mig kinesisk i næste uge? Hensigt: |
Hensigt: Lær mig kinesisk |
Få adgang til BloomZ 176B instruktionstunede model i SageMaker
SageMaker JumpStart giver to måder at komme i gang med at bruge disse instruktionsjusterede Bloom-modeller: Amazon SageMaker Studio og SageMaker SDK. De følgende afsnit illustrerer, hvordan hver af disse muligheder ser ud, og hvordan du får adgang til dem.
Få adgang til modellen med det forenklede SageMaker JumpStart SDK
forenklet SageMaker JumpStart SDK letter træning og implementering af indbyggede SageMaker JumpStart-modeller med et par linjer kode. Dette giver dig adgang til hele biblioteket af SageMaker JumpStart-modeller, inklusive de nyeste fundamentmodeller og billedgenereringsmodeller, uden at skulle angive nogen input udover model-id'et.
Du kan drage fordel af de modelspecifikke standardværdier, vi leverer, til at specificere konfigurationen, såsom Docker-billedet, ML-instanstype, modelartefaktplacering og hyperparametre blandt andre felter. Disse attributter er kun standardværdier; du kan tilsidesætte dem og bevare detaljeret kontrol over de AWS-modeller, du opretter. Som et resultat af disse ændringer er indsatsen for at skrive Python-arbejdsgange for at implementere og træne SageMaker JumpStart-modeller blevet reduceret, hvilket gør det muligt for dig at bruge mere tid på de opgaver, der betyder noget. Denne funktion er tilgængelig i alle regioner, hvor JumpStart er understøttet, og kan tilgås med SageMaker Python SDK version 2.154.0 eller senere.
Du kan programmæssigt implementere et slutpunkt gennem SageMaker SDK. Du skal angive model-id'et for din ønskede model i SageMaker-modelhubben og den instanstype, der bruges til implementeringen. Model-URI'en, som indeholder inferensscriptet, og URI'en for Docker-beholderen opnås gennem SageMaker SDK. Disse URI'er leveres af SageMaker JumpStart og kan bruges til at initialisere et SageMaker-modelobjekt til implementering.
Implementer modellen og forespørg slutpunktet
Denne notesbog kræver ipywidgets. Installer ipywidgets, og brug derefter den udførelsesrolle, der er knyttet til den aktuelle notesbog, som AWS-kontorollen med SageMaker-adgang.
Vælg den fortrænede model
Vi vælger bloomz-176b-fp16
præ-trænet model:
Notesbogen i de følgende afsnit bruger BloomZ 176B som et eksempel. For en komplet liste over SageMaker fortrænede modeller, se Indbyggede algoritmer med fortrænet modelbord.
Hent artefakter og implementer et slutpunkt
Med SageMaker kan vi udføre inferens på den fortrænede model uden at finjustere den først på et nyt datasæt. Vi starter med at hente deploy_image_uri
, deploy_source_uri
og model_uri
for den fortrænede model. For at være vært for den præ-trænede model opretter vi en instans af sagemaker.model.Model og implementere det. Dette kan tage et par minutter.
Nu kan vi implementere modellen ved hjælp af den forenklede SageMaker JumpStart SDK med følgende kodelinjer:
Vi anvender SageMaker store model inferens (LMI) containere at være vært for BloomZ 176B-modellen. LMI er en AWS-bygget LLM-softwarestak (container), der tilbyder brugervenlige funktioner og ydeevneforøgelse på generative AI-modeller. Det er indlejret med modelparallelisme, kompilering, kvantisering og andre stakke for at fremskynde inferens. For detaljer henvises til Implementer BLOOM-176B og OPT-30B på Amazon SageMaker med store modelinferens Deep Learning Containers og DeepSpeed.
Bemærk, at implementering af denne model kræver en p4de.24xlarge-instans, og implementeringen tager normalt omkring 1 time. Hvis du ikke har en kvote for den instans, skal du anmode om en kvoteforøgelse på AWS Service Quotas-konsollen.
Forespørg på slutpunktet og parse svaret ved hjælp af forskellige parametre til at kontrollere den genererede tekst
Inputtet til slutpunktet er enhver tekststreng, der er formateret som JSON og kodet i utf-8-format. Outputtet af endepunktet er en JSON-fil med genereret tekst.
I det følgende eksempel giver vi nogle eksempler på inputtekst. Du kan indtaste enhver tekst, og modellen forudsiger de næste ord i rækkefølgen. Længere tekstsekvenser kan genereres ved at kalde modellen gentagne gange. Følgende kode viser, hvordan man kalder et slutpunkt med disse argumenter:
Vi får følgende output:
['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']
Få adgang til modellen i SageMaker Studio
Du kan også få adgang til disse modeller gennem JumpStart landingsside i studiet. Denne side viser tilgængelige end-to-end ML-løsninger, fortrænede modeller og eksempler på notebooks.
På tidspunktet for udgivelsen af indlægget er BloomZ 176B kun tilgængelig i us-east-2
Område.
Du kan vælge BloomZ 176B-modelkortet for at se notebook'en.
Du kan derefter importere notesbogen for at køre den videre.
Ryd op
For at undgå løbende opkrævninger skal du slette SageMaker-slutpunkterne. Du kan slette slutpunkterne via SageMaker-konsollen eller fra SageMaker Studio-notesbogen ved at bruge følgende kommandoer:
predictor.delete_model()
predictor.delete_endpoint()
Konklusion
I dette indlæg gav vi et overblik over fordelene ved nul-skuds- og få-skuds-læring og beskrev, hvordan prompt engineering kan forbedre ydeevnen af instruktionstunede modeller. Vi viste også, hvordan man nemt implementerer en instruktionsjusteret BloomZ 176B-model fra SageMaker JumpStart og gav eksempler for at demonstrere, hvordan du kan udføre forskellige NLP-opgaver ved hjælp af det implementerede BloomZ 176B-modelslutpunkt i SageMaker.
Vi opfordrer dig til at implementere en BloomZ 176B-model fra SageMaker JumpStart og oprette dine egne prompter til NLP-brugssager.
For at lære mere om SageMaker JumpStart, tjek følgende:
Om forfatterne
Rajakumar Sampathkumar er en Principal Technical Account Manager hos AWS, der giver kunderne vejledning om forretningsteknologisk tilpasning og understøtter genopfindelsen af deres cloud-driftsmodeller og -processer. Han brænder for cloud og machine learning. Raj er også maskinlæringsspecialist og arbejder med AWS-kunder for at designe, implementere og administrere deres AWS-arbejdsbelastninger og -arkitekturer.
Dr. Xin Huang er en Applied Scientist for Amazon SageMaker JumpStart og Amazon SageMaker indbyggede algoritmer. Han fokuserer på at udvikle skalerbare maskinlæringsalgoritmer. Hans forskningsinteresser er inden for området naturlig sprogbehandling, forklarlig dyb læring på tabeldata og robust analyse af ikke-parametrisk rum-tid-klynger. Han har publiceret mange artikler i ACL, ICDM, KDD-konferencer og Royal Statistical Society: Series A journal.
Evan Kravitz er softwareingeniør hos Amazon Web Services, der arbejder på SageMaker JumpStart. Han nyder at lave mad og løbe i New York City.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
- PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
- PlatoESG. Automotive/elbiler, Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
- PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
- ChartPrime. Løft dit handelsspil med ChartPrime. Adgang her.
- BlockOffsets. Modernisering af miljømæssig offset-ejerskab. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/
- :har
- :er
- :ikke
- :hvor
- $OP
- 000
- 1
- 10
- 100
- 11
- 12
- 13
- 15 %
- 16
- 20
- 2000
- 2013
- 2021
- 24
- 250
- 30
- 32
- 33
- 7
- 8
- a
- I stand
- Om
- over
- Acceptere
- adgang
- af udleverede
- Konto
- nøjagtighed
- tværs
- tilpasse
- tilføje
- tilføjet
- Desuden
- Yderligere
- adresser
- justerbar
- administration
- Fordel
- igen
- mod
- AI
- AI modeller
- målsætninger
- AL
- algoritmer
- tilpasning
- Alle
- tillade
- tillader
- alene
- også
- Altair
- altid
- am
- Amazon
- Amazon Comprehend
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- Amazon Web Services (AWS)
- ambitiøst
- blandt
- beløb
- beløb
- an
- analyse
- analysere
- ,
- Angeles
- annoncerede
- Meddelelser
- enhver
- api
- API'er
- anvendelig
- applikationer
- anvendt
- april
- arabisk
- ER
- OMRÅDE
- argumenter
- artikel
- AS
- forbundet
- At
- vedhæfte
- attributter
- Automatisk Ur
- automatisk
- til rådighed
- undgå
- AWS
- tilbage
- Bad
- Bank
- baseret
- grundlæggende
- BE
- Beach
- smuk
- fordi
- været
- adfærd
- være
- gavn
- fordele
- udover
- BEDSTE
- mellem
- Bill
- Bill Gates
- Billion
- Bit
- Bloom
- Blå
- pin
- Bøger
- grænse
- født
- Boks
- kortvarigt
- BSN
- bygge
- Bygning
- bygget
- indbygget
- men
- .
- by
- kaldet
- ringer
- CAN
- Kan få
- kan ikke
- kapaciteter
- kapacitet
- kort
- forsigtig
- tilfælde
- tilfælde
- støbning
- fanget
- center
- Direktør
- udfordre
- lave om
- Ændringer
- opladet
- afgifter
- kontrollere
- Børn
- kinesisk
- valg
- Vælg
- kredse
- By
- fordringer
- klassificering
- lukket
- Cloud
- cloud computing
- klyngedannelse
- Medstifter
- kode
- Kodning
- SAMMENHÆNGENDE
- forkølelse
- samarbejde
- samling
- Kollegium
- Kolonne
- Kom
- kommer
- kommer
- Handel
- Fælles
- selskab
- fuldføre
- kompleksitet
- kompliceret
- forstå
- omfattende
- computing
- begreber
- Konference
- konferencer
- Konfiguration
- overvejelse
- Bestående
- Konsol
- forbrug
- Container
- Beholdere
- indeholder
- indhold
- sammenhænge
- fortsæt
- fortsættende
- kontrol
- konversation
- Cool
- korrigere
- Koste
- kunne
- land
- Par
- skabe
- oprettet
- Oprettelse af
- skabelse
- Kreativ
- Kop
- Nuværende
- For øjeblikket
- skik
- Kunder
- tilpasses
- data
- datasæt
- David
- deal
- Tilbud
- dedikeret
- dyb
- dyb læring
- dybeste
- Standard
- leveret
- levering
- demo
- demonstrere
- demonstreret
- Afhængigt
- indsætte
- indsat
- deployer
- implementering
- implementering
- beskrevet
- beskrivelse
- Design
- konstrueret
- ønskes
- detaljer
- Bestem
- udvikle
- udviklet
- udvikling
- Udvikling
- udvikler
- Enheder
- DID
- Die
- forskellige
- Rabat
- rabatter
- diskussion
- do
- Docker
- dokumentet
- dokumenter
- Er ikke
- gør
- domæne
- dominerende
- donere
- Dont
- Ved
- ned
- Nedjustering
- dræne
- ulemper
- hver
- nemt
- let
- nem at bruge
- eBooks
- ecommerce
- effektivitet
- indsats
- elementer
- berettiget
- indlejret
- muliggør
- tilskynde
- ende til ende
- Endpoint
- ingeniør
- Engineering
- Engelsk
- nyde
- Hele
- enheder
- enhed
- Entrepreneur
- Miljø
- egenkapital
- europæisk
- Endog
- begivenheder
- NOGENSINDE
- at alt
- undersøge
- eksempel
- eksempler
- Eksklusiv
- udførelse
- forventet
- dyrt
- erfaring
- ekstrakt
- Ansigtet
- letter
- Facility
- Faktisk
- langt
- FAST
- Feature
- Funktionalitet
- tilbagemeldinger
- Gebyrer
- Feet
- få
- Fields
- File (Felt)
- Filer
- finansielle
- finansielle tjenesteydelser
- brande
- Fornavn
- første gang
- fokuserer
- følger
- efter
- mad
- mad levering
- Til
- format
- Tidligere
- Foundation
- Grundlagt
- Gratis
- Fransk
- hyppigt
- fra
- forsiden
- funktioner
- yderligere
- Gevinst
- Gates
- generelle formål
- generere
- genereret
- generation
- generative
- Generativ AI
- få
- giver
- mål
- gå
- golf
- godt
- GPU
- stor
- stærkt
- Ground
- gruppe
- Dyrkning
- Vækst
- garanti
- vejledning
- vejlede
- hånd
- Have
- have
- he
- overskrift
- høre
- højde
- hjælpe
- hjælpsom
- hjælper
- link.
- Høj
- høj kvalitet
- hans
- Forhåbentlig
- host
- HOT
- time
- Hvordan
- How To
- HTML
- HTTPS
- Huang
- Hub
- menneskelig
- Menneskelighed
- Mennesker
- i
- ID
- if
- billede
- imaginær
- billede
- importere
- Forbedre
- in
- omfatter
- Herunder
- indarbejde
- industrien
- oplysninger
- informationsudtræk
- initiativ
- innovativ
- indgang
- indgange
- indsigt
- installere
- instans
- i stedet
- anvisninger
- interesser
- interne
- ind
- undersøge
- investering
- Investeringsbank
- involvere
- Islands
- IT
- ITS
- Job
- Karriere
- tidsskrift
- rejse
- jpg
- json
- lige
- Holde
- Nøgle
- søgeord
- Kend
- viden
- landing
- Sprog
- Sprog
- stor
- storstilet
- største
- Efternavn
- senere
- seneste
- førende
- LÆR
- læring
- Led
- lad
- Lets
- Niveau
- Leverage
- Bibliotek
- lys
- ligesom
- begrænsninger
- Limited
- Line (linje)
- linjer
- Liste
- Lister
- LLM
- placering
- Lang
- længere
- Se
- ligner
- den
- Los Angeles
- kærlighed
- Lav
- maskine
- machine learning
- lavet
- Main
- større
- lave
- maerker
- Making
- administrere
- leder
- styring
- mange
- Markeder
- mars
- Matter
- Kan..
- kan være
- me
- Mød
- Medlemmer
- medlemskab
- Hukommelse
- Hudpleje
- nævner
- microsoft
- Mid
- million
- millioner
- minimering
- minutter
- Mission
- ML
- model
- modeller
- Moderne
- Måned
- mere
- mest
- film
- flere
- navn
- Natural
- Natural Language Processing
- Natur
- ne
- nødvendig
- Behov
- negativ
- netværk
- Neutral
- aldrig
- Ny
- nye produkter
- New York
- New York
- Nyeste
- næste
- næste uge
- rart
- NLP
- ingen
- Støj
- notesbog
- Noter
- roman
- november
- nu
- nummer
- objekt
- opnået
- of
- off
- tilbyde
- tilbyde
- Tilbud
- oh
- on
- engang
- ONE
- igangværende
- kun
- open source
- drift
- Produktion
- Indstillinger
- or
- Orange
- ordrer
- ordrer
- organisationer
- original
- Andet
- vores
- ud
- output
- i løbet af
- overstyring
- oversigt
- egen
- side
- Papir
- papirer
- parametre
- lidenskabelige
- Betal
- Mennesker
- per
- opfattet
- Udfør
- ydeevne
- udfører
- frynsegoder
- Tilpas
- sætninger
- Billeder
- Place
- fly
- planer
- perron
- plato
- Platon Data Intelligence
- PlatoData
- spiller
- spiller
- Vær venlig
- plus
- position
- positiv
- mulig
- Indlæg
- vigtigste
- ppi
- Forudsigelser
- Predictor
- forudser
- Premium
- tidligere
- tidligere
- pris
- Prime
- Main
- private
- Kapitalfond
- problemer
- behandle
- Processer
- forarbejdning
- producerer
- Produkt
- produktion
- Produkter
- professionel
- Program
- Programmering
- programmeringssprog
- projekt
- give
- forudsat
- udbyder
- giver
- leverer
- offentligt
- offentliggjort
- Publicering
- sætte
- Python
- spørgsmål
- Spørgsmål
- hævet
- hurtige
- Sats
- RE
- Læs
- læsere
- Læsning
- realtid
- gik op for
- nylige
- for nylig
- anerkendelse
- anerkende
- anbefales
- Rød
- Reduceret
- region
- regioner
- relaterede
- bemærkelsesværdig
- GENTAGNE GANGE
- omformulering
- udskiftes
- Repository
- anmode
- påkrævet
- Kræver
- forskning
- forskning og udvikling
- forskere
- Løsning
- Ressourcer
- svar
- reaktioner
- resultere
- tilbageholde
- gennemgå
- revolutioneret
- givende
- Belønninger
- robot
- robust
- roller
- Royal
- Kør
- løber
- s
- sagemaker
- SageMaker Inference
- Said
- salg
- salt
- siger
- siger
- skalerbar
- scanne
- Videnskabsmand
- forskere
- Skærm
- SDK
- Søg
- Anden
- sektioner
- se
- synes
- valg
- sælger
- semantik
- senior
- forstand
- dømme
- stemningen
- følelser
- Sequence
- seriel
- Series
- Serie A
- tjeneste
- Tjenester
- sæt
- sæt
- indstilling
- flere
- bør
- Vis
- viste
- Shows
- signifikant
- forenklet
- siden
- websted
- situationer
- Størrelse
- størrelser
- lille
- mindre
- So
- Social
- sociale netværk
- Samfund
- Software
- Software Engineer
- solid
- Løsninger
- nogle
- dens
- Spansk
- specialist
- specifikke
- specifikt
- hastighed
- stavning
- tilbringe
- stable
- Stakke
- starte
- påbegyndt
- Nystartede
- state-of-the-art
- Stater
- statistiske
- Steps
- Steve
- stoppet
- opbevaring
- opbevaringsmuligheder
- Strategi
- styrker
- String
- struktur
- studerende
- Studio
- Studere
- sådan
- Dragt
- RESUMÉ
- supplere
- forsyne
- support
- Understøttet
- Støtte
- synonym
- bord
- Tag
- tager
- Opgaver
- opgaver
- Undervisning
- hold
- Teknisk
- skabelon
- end
- takke
- at
- Området
- verdenen
- deres
- Them
- derefter
- Der.
- Disse
- de
- Tredje
- denne
- Gennem
- thru
- tid
- tidskrævende
- Titel
- til
- i dag
- i morgen
- også
- værktøj
- hård
- mod
- traditionelle
- Tog
- uddannet
- Kurser
- Transform
- omdannet
- Oversættelse
- træ
- tweet
- To gange
- to
- typen
- os
- forståelse
- Forenet
- Forenede Stater
- universitet
- ubegrænset
- indtil
- Opdatering
- opdateringer
- opdatering
- brug
- brug tilfælde
- anvendte
- brugere
- bruger
- ved brug af
- sædvanligvis
- værdiansættes
- Værdier
- række
- forskellige
- Vast
- Verifikation
- udgave
- meget
- via
- Specifikation
- næsten
- Besøg
- ønsker
- varm
- var
- Vand
- Vej..
- måder
- we
- web
- webservices
- uge
- velkommen
- GODT
- Hvad
- Hvad er
- hvornår
- som
- mens
- hvid
- WHO
- Hele
- hvorfor
- bredere
- bredde
- vilje
- Vinter
- med
- uden
- Dame
- ord
- ord
- arbejdsgange
- arbejder
- virker
- world
- Verdens cup
- bekymre sig
- ville
- skriver
- skrivning
- skriftlig
- X
- år
- år
- Ja
- endnu
- york
- Du
- Din
- zephyrnet
- Zero-Shot Learning