Amazon SageMaker JumpStart är ett nav för maskininlärning (ML) som erbjuder algoritmer, modeller och ML-lösningar. Med SageMaker JumpStart kan ML-utövare välja från en växande lista över bäst presterande och allmänt tillgängliga grundmodeller (FM) som t.ex BLOMMA, Lama 2, Falcon-40B, Stabil diffusion, ÖppnaLLaMA, Flan-T5/UL2, eller FMs från Hänga ihop och Ljuset på.
I det här inlägget och den medföljande anteckningsboken visar vi hur man distribuerar BloomZ 176B-grundmodellen med hjälp av SageMaker Python förenklad SDK in Amazon SageMaker JumpStart som en slutpunkt och använd den för olika NLP-uppgifter (natural language processing). Du kan också komma åt grundmodellerna via Amazon SageMaker Studio. BloomZ 176B-modellen, en av de största allmänt tillgängliga modellerna, är en toppmodern instruktionsinställd modell som kan utföra olika NLP-uppgifter i sammanhanget få-shot-inlärning och noll-shot-inlärning. Instruktionsjustering är en teknik som går ut på att finjustera en språkmodell på en samling NLP-uppgifter med hjälp av instruktioner. För att lära dig mer om instruktionsinställning, se Zero-shot-uppmaning för Flan-T5-grundmodellen i Amazon SageMaker JumpStart.
Zero-shot learning i NLP gör att en förutbildad LLM kan generera svar på uppgifter som den inte har utbildats specifikt för. I denna teknik är modellen försedd med en inmatningstext och en prompt som beskriver den förväntade produktionen från modellen på naturligt språk. Zero-shot learning används i en mängd olika NLP-uppgifter, till exempel följande:
- Flerspråkig text och sentimentklassificering
- Flerspråkig fråga och svar
- Kodgenerering
- Omformulering av stycke
- Sammanfattning
- Sunt förnuftsresonemang och naturliga språkslutningar
- Frågesvar
- Menings- och sentimentklassificering
- Imaginär artikelgenerering baserad på en titel
- Sammanfatta en titel baserad på en artikel
Få-shot-inlärning innebär att man tränar en modell för att utföra nya uppgifter genom att bara ge några få exempel. Detta är användbart där begränsad märkt data är tillgänglig för utbildning. Få-show-inlärning används i en mängd olika uppgifter, inklusive följande:
- Textsammanfattning
- Kodgenerering
- Namnenhetsidentifiering
- Frågesvar
- Grammatik och stavningskorrigering
- Produktbeskrivning och generalisering
- Menings- och sentimentklassificering
- Chatbot och konversations-AI
- Tweet generation
- Maskinöversättning
- Avsiktsklassificering
Om Bloom
BigScience Large Open-science Open-access Multilingual (BLOOM) språkmodell är en transformatorbaserad storspråksmodell (LLM). BLOOM är en autoregressiv LLM utbildad för att fortsätta text från en prompt på stora mängder textdata med hjälp av beräkningsresurser i industriell skala. Som sådan kan den mata ut sammanhängande text som knappast går att särskilja från text skriven av människor. BLOOM kan också instrueras att utföra textuppgifter som det inte uttryckligen har tränats för genom att casta dem som textgenereringsuppgifter.
Med sina 176 miljarder parametrar kan BLOOM generera text på 46 naturliga språk och 13 programmeringsspråk. För nästan alla av dem, som spanska, franska och arabiska, är BLOOM den första språkmodellen med över 100 miljarder parametrar som någonsin skapats. Forskare kan ladda ner, kör och studera BLOOM att undersöka prestanda och beteende hos nyligen utvecklade LLM:er ner till deras djupaste interna verksamhet.
Lösningsöversikt
I det här inlägget visar vi hur du använder den toppmoderna instruktionsjusterade BloomZ 176B-modellen från Kramande ansikte för textgenerering. Du kan använda BloomZ 176B-modellen med få-shot-inlärning och noll-shot-inlärning för många NLP-uppgifter, utan att finjustera modellen. Det finns inget behov av att träna en ny modell eftersom modeller som BloomZ 176B har ett betydande antal parametrar så att de enkelt kan anpassa sig till många sammanhang utan att omskolas. BloomZ 176B-modellen har tränats med en stor mängd data, vilket gör den tillämpbar för många allmänna uppgifter.
Koden för alla steg i denna demo finns tillgänglig i följande anteckningsbok.
Instruktionsjustering
Storleken och komplexiteten hos LLM har exploderat under de senaste åren. LLM:er har visat anmärkningsvärda möjligheter att lära sig semantiken i naturligt språk och producera mänskliga svar. Många nyare LLM är finjusterade med en kraftfull teknik som kallas instruktionsjustering, som hjälper modellen att utföra nya uppgifter eller generera svar på nya uppmaningar utan promptspecifik finjustering. En instruktionsinställd modell använder sin förståelse av relaterade uppgifter eller begrepp för att generera förutsägelser till nya uppmaningar. Eftersom denna teknik inte involverar uppdatering av modellvikter undviker den den tidskrävande och beräkningsmässigt dyra processen som krävs för att finjustera en modell för en ny, tidigare osynlig uppgift.
Instruktionsjustering innebär att finjustera en språkmodell på en samling NLP-uppgifter med hjälp av instruktioner. I denna teknik tränas modellen för att utföra uppgifter genom att följa textinstruktioner istället för specifika datamängder för varje uppgift. Modellen är finjusterad med en uppsättning ingångs- och utdataexempel för varje uppgift, vilket gör att modellen kan generaliseras till nya uppgifter som den inte explicit har tränats på så länge som uppmaningar ges för uppgifterna. Instruktionsjustering hjälper till att förbättra modellernas noggrannhet och effektivitet och är till hjälp i situationer där stora datamängder inte är tillgängliga för specifika uppgifter.
Snabb konstruktion för noll- och få-shot NLP-uppgifter på BLOOM-modeller
Snabb ingenjörskonst handlar om att skapa uppmaningar av hög kvalitet för att styra modellen mot önskade svar. Uppmaningar måste utformas baserat på den specifika uppgiften och datamängden som används. Målet här är att förse modellen med nödvändig information för att generera högkvalitativa svar samtidigt som bullret minimeras. Det kan handla om nyckelord, ytterligare sammanhang, frågor och mer.
En väldesignad prompt kan göra modellen mer kreativ och generaliserad så att den lätt kan anpassa sig till nya uppgifter. Uppmaningar kan också hjälpa till att införliva domänkunskap om specifika uppgifter och förbättra tolkningsbarheten. Snabb ingenjörskonst kan avsevärt förbättra prestandan för inlärningsmodeller med noll och få skott. Att skapa uppmaningar av hög kvalitet kräver noggrann övervägande av den aktuella uppgiften, såväl som en djup förståelse för modellens styrkor och begränsningar.
I följande tabell används BloomZ 176B-modellen för att generera svar för olika noll- och få-shot NLP-uppgifter. Den första kolumnen visar uppgiften, den andra kolumnen innehåller prompten som ges till modellen (där malltexten är fetstil och den icke fetstilta texten är exemplet) och den tredje kolumnen är svaret från modellen när den frågas mot prompten
För alla följande uppgifter ställer vi in hyperparametrarna som 600 för att vara max_length
, num_return_sequences
, top_k
att vara 250, top_p
till 0.95 och ingen provtagning.
uppgift | Snabbinmatning | Produktion |
Zero-shot inlärningsuppgifter | ||
Flerspråkig text eller sentimentklassificering (kinesiska till engelska) | 一个传奇的开端,一个不灭的神话,这不仅仅是一部电影,而是作为丰是作为丰是作为縰,永远彪炳史册。Skulle du betygsätta den tidigare recensionen som positiv, neutral eller negativ? | positiv |
Flerspråkig fråga svar (engelska till kinesiska) | Förklara för mig på traditionell kinesiska vad är backpropagation | Mer小化损失函数. |
Kodgenerering | Skriv en binärt sökträd med O(log(n)) beräkningskomplexitet. {code_start} |
def binär_sökning(a, x): låg = 0 hög = len(a) – 1 medan låg <= hög: mid = (låg + hög) // 2 om en [mellan] < x: låg = mitten + 1 elif a[mid] > x: hög = mitten – 1 annan: återvända mitten retur -1′ . annan: återvända mitten återvänd lågt' Utgången är trunkerad |
Omformulering av stycket | Amazon Web Services (AWS) har meddelat nio stora nya uppdateringar för sin molnbaserade maskininlärningsplattform, SageMaker. SageMaker syftar till att tillhandahålla en maskininlärningstjänst som kan användas för att bygga, träna och distribuera ML-modeller för praktiskt taget alla användningsfall. Under årets re:Invent-konferens gjorde AWS flera tillkännagivanden för att ytterligare förbättra SageMakers möjligheter.nnHur skulle du omformulera det kortfattat med engelska?,Amazon Web Services (AWS) har meddelat nio stora nya uppdateringar för sin molnbaserade maskininlärningsplattform, SageMaker. SageMaker syftar till att tillhandahålla en maskininlärningstjänst som kan användas för att bygga, träna och distribuera ML-modeller för praktiskt taget alla användningsfall. Under årets re:Invent-konferens gjorde AWS flera tillkännagivanden för att ytterligare förbättra SageMakers möjligheter. nOvanstående mening är mycket komplicerad. Vänligen ge mig en förenklad synonym version som består av flera meningar: |
Amazon SageMaker får en rejäl uppdatering Amazon Web Services (AWS) har meddelat nio stora nya uppdateringar för sin molnbaserade maskininlärningsplattform, SageMaker. SageMaker syftar till att tillhandahålla en maskininlärningstjänst som kan användas för att bygga, träna och distribuera ML-modeller för praktiskt taget alla användningsfall |
Sammanfattning | Amazon Comprehend använder naturlig språkbehandling (NLP) för att extrahera insikter om innehållet i dokument. Den utvecklar insikter genom att känna igen enheter, nyckelfraser, språk, känslor och andra vanliga element i ett dokument. Använd Amazon Comprehend för att skapa nya produkter baserade på att förstå strukturen i dokument. Med hjälp av Amazon Comprehend kan du till exempel söka i sociala nätverksflöden efter omnämnanden av produkter eller skanna ett helt dokumentlager efter nyckelfraser. Du kan komma åt Amazon Comprehends dokumentanalysfunktioner med Amazon Comprehend-konsolen eller med Amazon Comprehend API:er. Du kan köra realtidsanalys för små arbetsbelastningar eller så kan du starta asynkrona analysjobb för stora dokumentuppsättningar. Du kan använda de förtränade modellerna som Amazon Comprehend tillhandahåller, eller så kan du träna dina egna anpassade modeller för klassificering och enhetsigenkänning. Alla Amazon Comprehend-funktioner accepterar UTF-8-textdokument som indata. Dessutom accepterar anpassad klassificering och anpassad enhetsigenkänning bildfiler, PDF-filer och Word-filer som indata. Amazon Comprehend kan granska och analysera dokument på en mängd olika språk, beroende på den specifika funktionen. För mer information, se Språk som stöds i Amazon Comprehend. Amazon Comprehends Dominant Language-kapacitet kan granska dokument och bestämma det dominerande språket för ett mycket bredare urval av språk.nn===nSkriv en sammanfattning av föregående text på engelska: |
Amazon Comprehend använder naturlig språkbehandling (NLP) för att extrahera insikter om innehållet i dokument. Den utvecklar insikter genom att känna igen enheter, nyckelfraser, språk, känslor och andra vanliga element i ett dokument. Använd Amazon Comprehend för att skapa nya produkter baserade på att förstå strukturen i dokument. Med hjälp av Amazon Comprehend kan du till exempel söka i sociala nätverksflöden efter omnämnanden av produkter eller skanna ett helt dokumentlager efter nyckelfraser. Du kan komma åt Amazon Comprehends dokumentanalysfunktioner med Amazon Comprehend-konsolen eller med Amazon Comprehend API:er. Du kan köra realtidsanalys för små arbetsbelastningar eller så kan du starta asynkrona analysjobb för stora dokumentuppsättningar. Du kan använda de förtränade modellerna som Amazon Comprehend tillhandahåller, eller så kan du träna dina egna anpassade modeller för klassificering och enhetsigenkänning. Alla Amazon Comprehend-funktioner accepterar UTF-8-textdokument som indata. Dessutom accepterar anpassad klassificering och anpassad enhetsigenkänning bildfiler, PDF-filer och Word-filer som indata. Amazon Comprehend kan granska och analysera dokument på en mängd olika språk, beroende på den specifika funktionen. För mer information, se Språk som stöds i Amazon Comprehend. Amazon Comprehends Dominant Language-kapacitet kan granska dokument och bestämma det dominerande språket för ett mycket bredare urval av språk. |
Sunt förnuftsresonemang och naturliga språkslutningar | Givet att Världscupen har börjat i Los Angeles, USA. Följer det det Världscupen äger rum i USA. Ja eller nej?, Världscupen har börjat i Los Angeles, USA. Att bara använda ovanstående beskrivning och vad du vet om världen, är "VM äger rum i USA" helt klart rätt? Ja eller nej?, |
Ja |
Frågesvar | fråga: vilka är nyckelfunktionerna i nya Kindle?nnKontext: Den senaste och mest innovativa Kindle hittills låter dig göra anteckningar om miljontals böcker och dokument, skriva listor och tidskrifter och mer. För läsare som alltid har önskat att de kunde skriva i sina e-böcker, låter Amazons nya Kindle dem göra just det. Kindle Scribe är den första Kindle för läsning och skrivning och låter användare komplettera sina böcker och dokument med anteckningar, listor och mer. Här är allt du behöver veta om Kindle Scribe, inklusive vanliga frågor. Kindle Scribe gör det enkelt att läsa och skriva som på papper Kindle Scribe har en 10.2-tums, bländfri skärm (den största av alla Kindle-enheter), skarp upplösning på 300 ppi och 35 LED-frontljus som automatiskt anpassar sig till din miljö. Anpassa din upplevelse ytterligare med det justerbara varma ljuset, teckenstorlekar, radavstånd och mer. Den levereras med ditt val av Basic Pen eller Premium Pen, som du använder för att skriva på skärmen som på papper. De fäster även magnetiskt på din Kindle och behöver aldrig laddas. Premium Pen innehåller ett dedikerat suddgummi och en anpassningsbar genvägsknapp. Kindle Scribe har flest lagringsalternativ av alla Kindle-enheter: välj mellan 8 GB, 16 GB eller 32 GB för att passa din läs- och skrivnivå. nnSvara |
göra anteckningar om miljontals böcker och dokument, skriva listor och tidskrifter och mer |
Menings- och sentimentklassificering | Recension:nDenna rörelse är så stor och återigen bländar och gläder ossnÄr denna filmrecensionssats negativ eller positiv?nALTERNATIV:n-positiv n-negativ | Positiv |
Imaginär artikelgenerering baserat på titel | Titel: "Universitetet har en ny anläggning på gång”nMed tanke på ovanstående titel på en tänkt artikel, föreställ dig artikeln.n””” |
Projektet på 1.2 miljoner pund kommer att skapa ett nytt undervisnings- och lärcentrum vid University of the Highlands and Islands (UHI) i Inverness. Det kommer att byggas på platsen för det tidigare Inverness College of Commerce. UHI sa att den nya anläggningen skulle användas för undervisning och lärande, såväl som studentstöd och administration. Universitetet sa att det också skulle användas för konferenser och evenemang. Den nya byggnaden kommer att byggas på platsen för det tidigare Inverness College of Commerce Universitetet sa att den nya byggnaden skulle byggas på platsen för det tidigare Inverness College of Commerce, som stängdes 2013. Den sade att den nya anläggningen skulle användas för undervisning och lärande, såväl som studentstöd och administration. Den skulle även användas för konferenser och evenemang. UHI sa att den nya anläggningen skulle byggas på platsen för det tidigare Inverness College of Commerce Universitetet sa att den nya byggnaden skulle byggas på platsen för det tidigare Inverness College of Commerce, som stängdes 2013. Den sade att den nya anläggningen skulle användas för undervisning och lärande, såväl som studentstöd och administration. UHI sa att den nya anläggningen skulle byggas på platsen för det tidigare Inverness... |
Sammanfatta en titel baserad på artikeln | 'Den nyaste och mest innovativa Kindle hittills låter dig göra anteckningar om miljontals böcker och dokument, skriva listor och tidskrifter och mer. För läsare som alltid har önskat att de kunde skriva i sina e-böcker, låter Amazons nya Kindle dem göra just det. Kindle Scribe är den första Kindle för läsning och skrivning och låter användare komplettera sina böcker och dokument med anteckningar, listor och mer. Här är allt du behöver veta om Kindle Scribe, inklusive vanliga frågor. Kindle Scribe gör det enkelt att läsa och skriva som på papper Kindle Scribe har en 10.2-tums, bländfri skärm (den största av alla Kindle-enheter), skarp upplösning på 300 ppi och 35 LED-frontljus som automatiskt anpassar sig till din miljö. Anpassa din upplevelse ytterligare med det justerbara varma ljuset, teckenstorlekar, radavstånd och mer. Den levereras med ditt val av Basic Pen eller Premium Pen, som du använder för att skriva på skärmen som på papper. De fäster även magnetiskt på din Kindle och behöver aldrig laddas. Premium Pen innehåller ett dedikerat suddgummi och en anpassningsbar genvägsknapp. Kindle Scribe har flest lagringsalternativ av alla Kindle-enheter: välj mellan 8 GB, 16 GB eller 32 GB för att passa din läs- och skrivnivå. nn nnGe mig en bra rubrik på artikeln ovan. |
Amazons Kindle Scribe: Allt du behöver veta |
Få-shot inlärningsuppgifter | ||
Sammanfattning | [Original]: Amazons forskare, i samarbete med forskare från University of Sheffield, gör en storskalig faktaextraktion och verifieringsdatauppsättning offentligt tillgänglig för första gången. Datauppsättningen, som omfattar mer än 185,000 XNUMX evidensstödda påståenden, görs tillgänglig för att förhoppningsvis katalysera forskning och utveckling som tar itu med problemen med faktaextraktion och verifiering i mjukvaruapplikationer eller molnbaserade tjänster som utför automatisk informationsextraktion. [Sammanfattning]: Amazon- och universitetsforskare gör faktaextraktion och verifieringsdatauppsättning offentligt tillgänglig. # # # [Original]: Prime-medlemmar i USA kan få ännu mer hem till dörren med ett Prime-medlemskap. Medlemmar kan nu njuta av ett års Grubhub+ till ett värde av $9.99 per månad gratis – utan extra kostnad för deras Prime-medlemskap. För att aktivera detta erbjudande, besök amazon.com/grubhub. Det här nya erbjudandet inkluderar obegränsade, $0 matleveransavgifter på beställningar över $12 samt exklusiva förmåner för Grubhub+-medlemmar och belöningar som gratis mat och beställningsrabatter. Dessutom kan matgäster "äta gott samtidigt som de gör gott" genom att gå med i Grubhubs Donate the Change-program, ett donationsmatchande initiativ som samlade in mer än 25 miljoner USD enbart under 2021, till förmån för mer än 20 välgörenhetsorganisationer över hela landet. [Sammanfattning]: Prime-medlemmar i USA kan njuta av ett års Grubhub+ gratis, utan matleveransavgifter på berättigade beställningar. # # # [Original]: Amazons forskare, i samarbete med forskare från University of Sheffield, gör en storskalig faktaextraktion och verifieringsdatauppsättning offentligt tillgänglig för första gången. Datauppsättningen, som omfattar mer än 185,000 XNUMX evidensstödda påståenden, görs tillgänglig för att förhoppningsvis katalysera forskning och utveckling som tar itu med problemen med faktaextraktion och verifiering i mjukvaruapplikationer eller molnbaserade tjänster som utför automatisk informationsextraktion. [Sammanfattning]: |
[Sammanfattning]: Amazon- och universitetsforskare gör faktaextraktion och verifieringsdatauppsättning offentligt tillgänglig. |
Kodgenerering | beskrivning: en orange knapp som säger stopp kod: Stopp # # # beskrivning: en blå ruta som innehåller gula cirklar med röda kanter koda: # # # beskrivning: en rubrik som säger Välkommen till AI koda: |
koda: Välkommen till AI ' |
Namnenhetsidentifiering | [Text]: Fred är en serieentreprenör. Medgrundare och VD för Platform.sh, han var tidigare med och grundade Commerce Guys, en ledande Drupal e-handelsleverantör. Hans uppdrag är att garantera att när vi fortsätter på en ambitiös resa för att på djupet förändra hur molnbaserad datoranvändning används och uppfattas, håller vi fötterna väl på jorden och fortsätter den snabba tillväxten vi har haft fram till nu. [Namn]: Fred [Position]: Medgrundare och VD [Företag]: Platform.sh # # # [Text]: Microsoft (ordet är en portmanteau av "mikrodatormjukvara") grundades av Bill Gates den 4 april 1975 för att utveckla och sälja BASIC-tolkar för Altair 8800. Steve Ballmer ersatte Gates som VD 2000, och senare föreställde sig en strategi för "enheter och tjänster". [Namn]: Steve Ballmer [Position]: VD [Företag]: Microsoft # # # [Text]: Franck Riboud föddes den 7 november 1955 i Lyon. Han är son till Antoine Riboud, den tidigare VD:n, som förvandlade den tidigare europeiska glastillverkaren BSN Group till en ledande aktör inom livsmedelsindustrin. Han är VD på Danone. [Namn]: Franck Riboud [Position]: VD [Företag]: Danone # # # [Text]: David Melvin är professionell inom investerings- och finanstjänster på CITIC CLSA med över 30 års erfarenhet av investmentbanking och private equity. Han är för närvarande senior rådgivare för CITIC CLSA. |
[Namn]: Fred [Position]: Medgrundare och VD [Företag]: Platform.sh |
Frågesvar | Sammanhang: NLP Cloud grundades 2021 när teamet insåg att det inte fanns något enkelt sätt att tillförlitligt utnyttja Natural Language Processing i produktionen. Fråga: När grundades NLP Cloud? Svar: 2021 # # # Sammanhang: NLP Cloud utvecklade sitt API i mitten av 2020 och de har lagt till många förtränade open source-modeller sedan dess. Fråga: Vad utvecklade NLP Cloud? Svar: API # # # Sammanhang: Alla planer kan stoppas när som helst. Du betalar endast för den tid du använt tjänsten. Vid en nedgradering får du rabatt på din nästa faktura. Fråga: När kan planerna stoppas? Svar: När som helst # # # Sammanhang: Den största utmaningen med GPT-J är minnesförbrukning. Att använda en GPU-plan rekommenderas. Fråga: Vilken plan rekommenderas för GPT-J? Svar:""" |
Svar: GPU-plan' |
Grammatik och stavningskorrigering | Jag älskar att gå till stranden. Rättelse: Jag älskar att gå till stranden. # # # Låt mig ha det! Rättelse: Låt mig få det! # # # Det har för många nackdelar. Rättelse: Det har för många nackdelar. # # # Jag vill inte gå Rättelse: |
Rättelse: Jag vill inte gå |
Produktbeskrivning och generalisering | Skapa en produktbeskrivning av sökord. Nyckelord: skor, kvinnor, $59 Mening: Vackra skor för kvinnor till priset av $59. # # # Nyckelord: byxor, herr, $69 Mening: Moderna byxor för män, endast för $69. # # # Nyckelord: handskar, vinter, $19 Mening: Otroligt varma handskar för kalla vintrar, för $19. # # # Nyckelord: t-shirt, herr, $39 Mening: |
Mening: Cool t-shirt för män, endast för $39. |
Menings- och sentimentklassificering | Meddelande: När rymdskeppet landade på Mars var hela mänskligheten upprymd Ämne: rymd # # # Meddelande: Jag älskar att spela tennis och golf. Jag tränar två gånger i veckan. Ämne: sport # # # Budskap: Att leda ett team av säljare är ett tufft men givande jobb. Ämne: affärer # # # Meddelande: Jag försöker laga kyckling med tomater. Ämne: |
Ämne: mat |
Chatbot och konversations-AI | Det här är en diskussion mellan en [människa] och en [robot]. [Roboten] är väldigt trevlig och empatisk. [människa]: Hej trevligt att träffa dig. [robot]: Trevligt att träffa dig också. # # # [människa]: Hur går det idag? [robot]: Inte så illa, tack! Och du då? # # # [människa]: Jag är okej, men jag är lite ledsen... [robot]: Åh? Varför det? # # # [människa]: Jag fick influensa [robot]: |
[robot]: Åh nej, jag är ledsen att höra det! |
Tweet generation | nyckelord: marknader tweet: Ta feedback från naturen och marknaderna, inte från människor # # # nyckelord: barn tweet: Vi kanske dör så att vi kan komma tillbaka som barn. # # # nyckelord: nystartade företag tweet: Nystartade företag ska inte oroa sig för hur de ska släcka bränder, de bör oroa sig för hur de ska starta dem. # # # nyckelord: nlp tweet: |
tweet: NLP är ett verktyg, inte ett mål. |
Maskinöversättning | Kramar Face a révolutionné le NLP. Översättning: Hugging Face revolutionerade NLP. # # # Cela est obevekligt! Översättning: Det här är otroligt! # # # Désolé je ne peux pas. Översättning: Förlåt men jag kan inte. # # # NLP Cloud tillåter driftsättning av NLP och produktionsfacilitet. Översättning: |
Översättning: NLP Cloud gör det enkelt att distribuera NLP i produktionen. |
Avsiktsklassificering | Jag vill börja koda imorgon för det verkar vara så roligt! Avsikt: börja koda # # # Visa mig de sista bilderna du har snälla. Avsikt: visa bilder # # # Sök igenom alla dessa filer så fort som möjligt. Avsikt: sök filer # # # Kan du lära mig kinesiska nästa vecka? Avsikt: |
Avsikt: lär mig kinesiska |
Få tillgång till den instruktionsjusterade modellen BloomZ 176B i SageMaker
SageMaker JumpStart erbjuder två sätt att komma igång med dessa instruktionsinställda Bloom-modeller: Amazon SageMaker Studio och SageMaker SDK. Följande avsnitt illustrerar hur vart och ett av dessa alternativ ser ut och hur man kommer åt dem.
Få tillgång till modellen med den förenklade SageMaker JumpStart SDK
Smakämnen förenklad SageMaker JumpStart SDK underlättar utbildning och distribution av inbyggda SageMaker JumpStart-modeller med ett par rader kod. Detta ger dig tillgång till hela biblioteket av SageMaker JumpStart-modeller, inklusive de senaste grundmodellerna och bildgenereringsmodellerna, utan att behöva ange några ingångar förutom modell-ID.
Du kan dra nytta av de modellspecifika standardvärdena vi tillhandahåller för att specificera konfigurationen, såsom Docker-bilden, ML-instanstyp, modellartefaktplacering och hyperparametrar, bland andra fält. Dessa attribut är endast standardvärden; du kan åsidosätta dem och behålla granulär kontroll över AWS-modellerna du skapar. Som ett resultat av dessa förändringar har arbetet med att skriva Python-arbetsflöden för att distribuera och träna SageMaker JumpStart-modeller minskat, vilket gör att du kan lägga mer tid på de uppgifter som är viktiga. Den här funktionen är tillgänglig i alla regioner där JumpStart stöds och kan nås med SageMaker Python SDK version 2.154.0 eller senare.
Du kan programmera distribuera en slutpunkt genom SageMaker SDK. Du måste ange modell-ID för din önskade modell i SageMaker-modellhubben och instanstypen som används för distribution. Modell-URI, som innehåller slutledningsskriptet, och URI för Docker-behållaren erhålls genom SageMaker SDK. Dessa URI:er tillhandahålls av SageMaker JumpStart och kan användas för att initiera ett SageMaker-modellobjekt för distribution.
Distribuera modellen och fråga efter slutpunkten
Den här anteckningsboken kräver ipywidgets. Installera ipywidgets och använd sedan exekveringsrollen som är kopplad till den aktuella anteckningsboken som AWS-kontorollen med SageMaker-åtkomst.
Välj den förtränade modellen
Vi väljer bloomz-176b-fp16
förtränad modell:
Anteckningsboken i följande avsnitt använder BloomZ 176B som ett exempel. För en komplett lista över SageMaker förutbildade modeller, se Inbyggda algoritmer med förtränad modellbord.
Hämta artefakter och distribuera en slutpunkt
Med SageMaker kan vi utföra slutledning på den förtränade modellen utan att finjustera den först på en ny datamängd. Vi börjar med att hämta deploy_image_uri
, deploy_source_uri
och model_uri
för den förtränade modellen. För att vara värd för den förtränade modellen skapar vi en instans av sagemaker.model.Modell och distribuera den. Detta kan ta några minuter.
Nu kan vi distribuera modellen med den förenklade SageMaker JumpStart SDK med följande kodrader:
Vi använder SageMaker stora modellinferens (LMI) behållare att vara värd för BloomZ 176B-modellen. LMI är en AWS-byggd LLM-mjukvarustack (behållare) som erbjuder lättanvända funktioner och prestandavinst på generativa AI-modeller. Den är inbäddad med modellparallellism, kompilering, kvantisering och andra stackar för att påskynda slutledningar. För detaljer, se Distribuera BLOOM-176B och OPT-30B på Amazon SageMaker med stor modellinferens Deep Learning Containers och DeepSpeed.
Observera att implementering av den här modellen kräver en p4de.24xlarge-instans och distributionen tar vanligtvis cirka 1 timme. Om du inte har en kvot för den instansen, begär en ökning av kvoten på AWS Service Quotas-konsolen.
Fråga slutpunkten och analysera svaret med hjälp av olika parametrar för att styra den genererade texten
Indata till slutpunkten är valfri textsträng formaterad som JSON och kodad i utf-8-format. Utdata från slutpunkten är en JSON-fil med genererad text.
I följande exempel ger vi exempel på inmatningstext. Du kan mata in vilken text som helst och modellen förutsäger nästa ord i sekvensen. Längre textsekvenser kan genereras genom att anropa modellen upprepade gånger. Följande kod visar hur man anropar en slutpunkt med dessa argument:
Vi får följande utdata:
['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']
Få åtkomst till modellen i SageMaker Studio
Du kan också komma åt dessa modeller via JumpStart-målsidan i studio. Den här sidan listar tillgängliga end-to-end ML-lösningar, förutbildade modeller och exempel på bärbara datorer.
Vid tidpunkten för publicering av inlägget är BloomZ 176B endast tillgänglig i us-east-2
Område.
Du kan välja modellkortet BloomZ 176B för att se den bärbara datorn.
Du kan sedan importera anteckningsboken för att köra anteckningsboken vidare.
Städa upp
För att undvika pågående avgifter, ta bort SageMaker slutpunkterna. Du kan ta bort slutpunkterna via SageMaker-konsolen eller från SageMaker Studio-anteckningsboken med hjälp av följande kommandon:
predictor.delete_model()
predictor.delete_endpoint()
Slutsats
I det här inlägget gav vi en översikt över fördelarna med noll- och få-shot-inlärning och beskrev hur snabb ingenjörskonst kan förbättra prestandan hos instruktionsinställda modeller. Vi visade också hur man enkelt distribuerar en instruktionsjusterad BloomZ 176B-modell från SageMaker JumpStart och gav exempel för att visa hur du kan utföra olika NLP-uppgifter med den distribuerade BloomZ 176B-modellens slutpunkt i SageMaker.
Vi uppmuntrar dig att distribuera en BloomZ 176B-modell från SageMaker JumpStart och skapa dina egna uppmaningar för NLP-användningsfall.
För att lära dig mer om SageMaker JumpStart, kolla in följande:
Om författarna
Rajakumar Sampathkumar är en Principal Technical Account Manager på AWS, som ger kunder vägledning om affärsteknologisk anpassning och stödjer återuppfinnandet av deras molndriftsmodeller och -processer. Han brinner för moln och maskininlärning. Raj är också en maskininlärningsspecialist och arbetar med AWS-kunder för att designa, distribuera och hantera deras AWS-arbetsbelastningar och -arkitekturer.
Dr Xin Huang är en tillämpad forskare för Amazon SageMaker JumpStart och Amazon SageMaker inbyggda algoritmer. Han fokuserar på att utveckla skalbara maskininlärningsalgoritmer. Hans forskningsintressen är inom området naturlig språkbehandling, förklarlig djupinlärning på tabelldata och robust analys av icke-parametrisk rum-tid-klustring. Han har publicerat många artiklar i ACL, ICDM, KDD-konferenser och Royal Statistical Society: Series A journal.
Evan Kravitz är en mjukvaruingenjör på Amazon Web Services och arbetar på SageMaker JumpStart. Han tycker om att laga mat och springa i New York City.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
- PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
- Platoesg. Fordon / elbilar, Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
- PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
- ChartPrime. Höj ditt handelsspel med ChartPrime. Tillgång här.
- BlockOffsets. Modernisera miljökompensation ägande. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/
- : har
- :är
- :inte
- :var
- $UPP
- 000
- 1
- 10
- 100
- 11
- 12
- 13
- 15%
- 16
- 20
- 2000
- 2013
- 2021
- 24
- 250
- 30
- 32
- 33
- 7
- 8
- a
- Able
- Om oss
- ovan
- Acceptera
- tillgång
- Accessed
- Konto
- noggrannhet
- tvärs
- anpassa
- lägga till
- lagt till
- Dessutom
- Annat
- adresser
- justerbar
- administrering
- Fördel
- igen
- mot
- AI
- AI-modeller
- Syftet
- AL
- algoritmer
- uppriktning
- Alla
- tillåta
- tillåter
- ensam
- också
- Altair
- alltid
- am
- amason
- Amazon Comprehend
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- Amazon Web Services (AWS)
- ambitiösa
- bland
- mängd
- mängder
- an
- analys
- analysera
- och
- Angeles
- meddelade
- Meddelanden
- vilken som helst
- api
- API: er
- tillämplig
- tillämpningar
- tillämpas
- April
- arabiska
- ÄR
- OMRÅDE
- argument
- Artikeln
- AS
- associerad
- At
- bifoga
- attribut
- Automat
- automatiskt
- tillgänglig
- undvika
- AWS
- tillbaka
- Badrum
- Banking
- baserat
- grundläggande
- BE
- Beach
- vackert
- därför att
- varit
- beteende
- Där vi får lov att vara utan att konstant prestera,
- gynnar
- Fördelarna
- förutom
- BÄST
- mellan
- Bill
- Bill Gates
- Miljarder
- Bit
- Bloom
- Blå
- nål
- Böcker
- gränsen
- födda
- Box
- i korthet
- BSN
- SLUTRESULTAT
- Byggnad
- byggt
- inbyggd
- men
- Knappen
- by
- kallas
- anropande
- KAN
- Kan få
- kan inte
- kapacitet
- kapacitet
- kortet
- noggrann
- Vid
- fall
- gjutning
- fångas
- centrum
- VD
- utmanar
- byta
- Förändringar
- laddad
- avgifter
- ta
- Barn
- kinesisk
- val
- Välja
- cirklar
- Stad
- hävdar
- klassificering
- stängt
- cloud
- cloud computing
- klustring
- Medgrundare
- koda
- Kodning
- SAMMANHÄNGANDE
- förkylning
- samverkan
- samling
- College
- Kolumn
- komma
- kommer
- kommande
- Commerce
- Gemensam
- företag
- fullborda
- Komplexiteten
- komplicerad
- förstå
- innefattande
- databehandling
- Begreppen
- Konferens
- konferenser
- konfiguration
- övervägande
- Bestående
- Konsol
- konsumtion
- Behållare
- Behållare
- innehåller
- innehåll
- kontexter
- fortsätta
- fortsätter
- kontroll
- konversera
- kyla
- korrekt
- Pris
- kunde
- land
- Par
- skapa
- skapas
- Skapa
- skapande
- Kreativ
- Cup
- Aktuella
- För närvarande
- beställnings
- Kunder
- anpassningsbar
- datum
- datauppsättningar
- David
- behandla
- Erbjudanden
- dedicerad
- djup
- djupt lärande
- djupaste
- Standard
- levereras
- leverans
- demo
- demonstrera
- demonstreras
- beroende
- distribuera
- utplacerade
- utställare
- utplacera
- utplacering
- beskriven
- beskrivning
- Designa
- utformade
- önskas
- detaljer
- Bestämma
- utveckla
- utvecklade
- utveckla
- Utveckling
- utvecklar
- enheter
- DID
- den
- olika
- Rabatt
- rabatter
- diskussion
- do
- Hamnarbetare
- dokumentera
- dokument
- inte
- gör
- domän
- dominerande
- donera
- inte
- Dörr
- ner
- Nedgradera
- dränera
- nackdelar
- varje
- lätt
- lätt
- LÄTTANVÄND
- e-böcker
- e-handel
- effektivitet
- ansträngning
- element
- berättigad
- inbäddade
- möjliggör
- uppmuntra
- början till slut
- Slutpunkt
- ingenjör
- Teknik
- Engelska
- njuta
- Hela
- enheter
- enhet
- Entrepreneur
- Miljö
- eget kapital
- Giltigt körkort
- Även
- händelser
- NÅGONSIN
- allt
- undersöka
- exempel
- exempel
- Exklusiv
- utförande
- förväntat
- dyra
- erfarenhet
- extrahera
- Ansikte
- underlättar
- Facility
- Faktum
- långt
- SNABB
- Leverans
- Funktioner
- återkoppling
- avgifter
- fot
- få
- Fält
- Fil
- Filer
- finansiella
- finansiella tjänster
- bränder
- Förnamn
- första gången
- fokuserar
- följer
- efter
- livsmedelsproduktion
- matleverans
- För
- format
- Tidigare
- fundament
- Grundad
- Fri
- franska
- ofta
- från
- främre
- funktioner
- ytterligare
- Få
- grindar
- generell mening
- generera
- genereras
- generering
- generativ
- Generativ AI
- skaffa sig
- ger
- Målet
- kommer
- golf
- god
- GPU
- stor
- kraftigt
- Marken
- Grupp
- Odling
- Tillväxt
- garanti
- vägleda
- styra
- sidan
- Har
- har
- he
- rubrik
- höra
- höjd
- hjälpa
- hjälp
- hjälper
- här.
- Hög
- hög kvalitet
- hans
- Förhoppningsvis
- värd
- HET
- timme
- Hur ser din drömresa ut
- How To
- html
- HTTPS
- huang
- Nav
- humant
- Mänskligheten
- Människa
- i
- ID
- if
- bild
- imaginär
- bild
- importera
- förbättra
- in
- innefattar
- Inklusive
- införliva
- industrin
- informationen
- information utvinning
- Initiativ
- innovativa
- ingång
- ingångar
- insikter
- installera
- exempel
- istället
- instruktioner
- intressen
- inre
- in
- undersöka
- investering
- investeringsbanker
- engagera
- Öar
- IT
- DESS
- Jobb
- Lediga jobb
- tidskriften
- resa
- jpg
- json
- bara
- Ha kvar
- Nyckel
- nyckelord
- Vet
- kunskap
- landning
- språk
- Språk
- Large
- storskalig
- största
- Efternamn
- senare
- senaste
- ledande
- LÄRA SIG
- inlärning
- Led
- Låt
- Lets
- Nivå
- Hävstång
- Bibliotek
- ljus
- tycka om
- begränsningar
- Begränsad
- linje
- rader
- Lista
- listor
- LLM
- läge
- Lång
- längre
- se
- ser ut som
- den
- Los Angeles
- älskar
- Låg
- Maskinen
- maskininlärning
- gjord
- Huvudsida
- större
- göra
- GÖR
- Framställning
- hantera
- chef
- hantera
- många
- Marknader
- Mars
- Materia
- Maj..
- kanske
- me
- Möt
- Medlemmar
- medlemskap
- Minne
- Män
- nämner
- Microsoft
- Mid
- miljon
- miljoner
- minimerande
- minuter
- Mission
- ML
- modell
- modeller
- Modern Konst
- Månad
- mer
- mest
- film
- multipel
- namn
- Natural
- Naturlig språkbehandling
- Natur
- ne
- nödvändigt för
- Behöver
- negativ
- nätverk
- Neutral
- aldrig
- Nya
- nya produkter
- New York
- new york city
- Senaste
- Nästa
- nästa vecka
- trevligt
- nlp
- Nej
- Brus
- anteckningsbok
- Anmärkningar
- roman
- November
- nu
- antal
- objektet
- erhållna
- of
- sänkt
- erbjudanden
- erbjuda
- Erbjudanden
- oh
- on
- gång
- ONE
- pågående
- endast
- öppen källkod
- drift
- Verksamhet
- Tillbehör
- or
- Orange
- beställa
- ordrar
- organisationer
- ursprungliga
- Övriga
- vår
- ut
- produktion
- över
- åsidosätta
- Översikt
- egen
- sida
- Papper
- papper
- parametrar
- brinner
- Betala
- Personer
- för
- uppfattas
- Utföra
- prestanda
- utför
- förmåner
- personifiera
- fraser
- Bilder
- Plats
- Planen
- planer
- plattform
- plato
- Platon Data Intelligence
- PlatonData
- Spelaren
- i
- snälla du
- plus
- placera
- positiv
- möjlig
- Inlägg
- den mäktigaste
- ppi
- Förutsägelser
- Predictor
- Förutspår
- Premium
- föregående
- tidigare
- pris
- Prime
- Principal
- privat
- Privatkapital
- problem
- process
- processer
- bearbetning
- producerande
- Produkt
- Produktion
- Produkter
- professionell
- Program
- Programmering
- programmeringsspråk
- projektet
- ge
- förutsatt
- leverantör
- ger
- tillhandahålla
- publicly
- publicerade
- publicering
- sätta
- Python
- fråga
- frågor
- insamlat
- snabb
- Betygsätta
- RE
- Läsa
- läsare
- Läsning
- realtid
- insåg
- senaste
- nyligen
- erkännande
- känna igen
- rekommenderas
- Red
- Minskad
- region
- regioner
- relaterad
- anmärkningsvärd
- UPPREPAT
- omformulering
- ersättas
- Repository
- begära
- Obligatorisk
- Kräver
- forskning
- forskning och utveckling
- forskare
- Upplösning
- Resurser
- respons
- svar
- resultera
- behålla
- översyn
- revolution
- givande
- Belöningar
- Roboten
- robusta
- Roll
- kungliga
- Körning
- kör
- s
- sagemaker
- SageMaker Inference
- Nämnda
- försäljning
- salt
- säger
- säger
- skalbar
- scanna
- Forskare
- vetenskapsmän
- screen
- sDK
- Sök
- Andra
- sektioner
- se
- verkar
- Val
- sälja
- semantik
- senior
- känsla
- mening
- känsla
- känslor
- Sekvens
- seriell
- Serier
- Serie A
- service
- Tjänster
- in
- uppsättningar
- inställning
- flera
- skall
- show
- visade
- Visar
- signifikant
- förenklade
- eftersom
- webbplats
- situationer
- Storlek
- storlekar
- Small
- mindre
- So
- Social hållbarhet
- Sociala nätverk
- Samhället
- Mjukvara
- Programvara ingenjör
- fast
- Lösningar
- några
- dess
- spanska
- specialist
- specifik
- specifikt
- fart
- stavning
- spendera
- stapel
- Stacks
- starta
- igång
- Startups
- state-of-the-art
- Stater
- statistisk
- Steg
- Steve
- slutade
- förvaring
- lagringsalternativ
- Strategi
- styrkor
- Sträng
- struktur
- student
- studio
- Läsa på
- sådana
- följer
- SAMMANFATTNING
- komplettera
- leverera
- stödja
- Som stöds
- Stödjande
- synonym
- bord
- Ta
- tar
- uppgift
- uppgifter
- Undervisning
- grupp
- Teknisk
- mall
- än
- tack
- den där
- Smakämnen
- Området
- världen
- deras
- Dem
- sedan
- Där.
- Dessa
- de
- Tredje
- detta
- Genom
- thru
- tid
- tidskrävande
- Titel
- till
- i dag
- i morgon
- alltför
- verktyg
- seg
- mot
- traditionell
- Tåg
- tränad
- Utbildning
- Förvandla
- transformerad
- Översättning
- träd
- tweet
- Dubbelt
- två
- Typ
- oss
- förståelse
- United
- USA
- universitet
- obegränsat
- tills
- Uppdatering
- Uppdateringar
- uppdatering
- användning
- användningsfall
- Begagnade
- användare
- användningar
- med hjälp av
- vanligen
- värderas
- Värden
- mängd
- olika
- Omfattande
- Verifiering
- version
- mycket
- via
- utsikt
- praktiskt taget
- Besök
- vill
- varm
- var
- Vatten
- Sätt..
- sätt
- we
- webb
- webbservice
- vecka
- välkommen
- VÄL
- Vad
- Vad är
- när
- som
- medan
- vit
- VEM
- Hela
- varför
- bredare
- bredd
- kommer
- Vinter
- med
- utan
- Kvinnor
- ord
- ord
- arbetsflöden
- arbetssätt
- fungerar
- världen
- världscupen
- oro
- skulle
- skriva
- skrivning
- skriven
- X
- år
- år
- ja
- ännu
- york
- Om er
- Din
- zephyrnet
- Zero-Shot Learning