Tänään meillä on ilo ilmoittaa, että voit nyt suorittaa erämuunnoksia Amazon SageMaker JumpStart suuret kielimallit (LLM) Text2Text Generationille. Erämuunnokset ovat hyödyllisiä tilanteissa, joissa vastausten ei tarvitse olla reaaliaikaisia, ja siksi voit tehdä johtopäätöksiä erässä suurille tietojoukoille. Erämuunnokselle suoritetaan erätyö, joka ottaa eräsyötteen tietojoukona ja esiopetettuna mallina ja tulostaa ennusteet jokaiselle tietojoukon tietopisteelle. Erämuunnos on kustannustehokas, koska toisin kuin reaaliaikaisissa isännöidyissä päätepisteissä, joissa on pysyvä laitteisto, erämuunnosklusterit puretaan, kun työ on valmis, ja siksi laitteistoa käytetään vain erätyön keston ajan.
Joissakin käyttötapauksissa reaaliaikaiset päättelypyynnöt voidaan ryhmitellä pieniin eriin eräkäsittelyä varten reaaliaikaisten tai lähes reaaliaikaisten vastausten luomiseksi. Jos esimerkiksi sinun on käsiteltävä jatkuvaa datavirtaa alhaisella viiveellä ja suurella suorituskyvyllä, reaaliaikaisen päätepisteen kutsuminen jokaiselle pyynnölle erikseen vaatisi enemmän resursseja ja voi kestää kauemmin kaikkien pyyntöjen käsittelyssä, koska käsittely suoritetaan sarjassa. . Parempi tapa olisi ryhmitellä jotkin pyynnöt ja kutsua reaaliaikaista päätepistettä eräpäätelmätilassa, joka käsittelee pyyntösi mallin yhdellä eteenpäinsiirrolla ja palauttaa pyynnön joukkovastauksen reaaliajassa tai lähes reaaliajassa. . Vastauksen latenssi riippuu ryhmittämiesi pyyntöjen määrästä ja ilmentymän muistin koosta, joten voit säätää eräkokoa yrityksesi viiveen ja suorituskyvyn vaatimusten mukaan. Kutsumme tätä reaaliaikainen eräpäätelmä koska se yhdistää eräajon käsitteen ja tarjoaa silti reaaliaikaisia vastauksia. Reaaliaikaisen eräpäätelmän avulla voit saavuttaa tasapainon alhaisen viiveen ja suuren suorituskyvyn välillä, jolloin voit käsitellä suuria tietomääriä oikea-aikaisesti ja tehokkaasti.
Jumpstart erämuunnos Text2Text Generation -malleille mahdollistaa erän hyperparametrien välittämisen ympäristömuuttujien kautta, jotka lisäävät edelleen suorituskykyä ja minimoivat latenssia.
JumpStart tarjoaa valmiiksi koulutettuja avoimen lähdekoodin malleja monenlaisille ongelmatyypeille, jotka auttavat sinua pääsemään alkuun koneoppimisen (ML) kanssa. Voit asteittain kouluttaa ja virittää näitä malleja ennen käyttöönottoa. JumpStart tarjoaa myös ratkaisumalleja, jotka määrittävät infrastruktuurin yleisiä käyttötapauksia varten, ja suoritettavia esimerkkimuistikirjoja ML:lle Amazon Sage Maker. Pääset valmiiksi koulutettuihin malleihin, ratkaisumalleihin ja esimerkkeihin JumpStart-aloitussivun kautta Amazon SageMaker Studio. Voit myös käyttää JumpStart-malleja käyttämällä SageMaker Python SDK:ta.
Tässä postauksessa näytämme, kuinka käytät huippuluokan esikoulutettua text2text FLAN T5 mallit Hugging Facesta erämuunnos ja reaaliaikainen eräpäätelmä.
Ratkaisun yleiskatsaus
Muistikirja, joka näyttää erämuunnos esikoulutetuista Text2Text FLAN T5 -malleista Halaaminen kasvot saatavilla seuraavassa GitHub-arkisto. Tämä muistikirja käyttää Hugging Facen tietoja cnn_dailymail tietojoukko tekstin yhteenvetotehtävää varten SageMaker SDK:lla.
Seuraavat ovat tärkeimmät vaiheet erämuunnoksen ja reaaliaikaisen eräpäätelmän toteuttamiseksi:
- Aseta edellytykset.
- Valitse valmiiksi koulutettu malli.
- Hae artefaktit mallille.
- Määritä erämuunnostyön hyperparametrit.
- Valmistele tiedot erämuunnokselle.
- Suorita erämuunnostyö.
- Arvioi yhteenveto käyttämällä a RED (Recall-Oriented Understudy for Gisting Evaluation) pisteet.
- Suorita reaaliaikainen eräpäättely.
Aseta edellytykset
Ennen kuin käytät muistikirjaa, sinun on suoritettava joitakin alkuasennusvaiheita. Määritetään SageMaker-suoritusrooli, jotta sillä on oikeudet suorittaa AWS-palveluita puolestasi:
Valitse valmiiksi koulutettu malli
Käytämme oletusmallina huggingface-text2text-flan-t5-large mallia. Valinnaisesti voit hakea luettelon käytettävissä olevista Text2Text-malleista JumpStartista ja valita haluamasi mallin. Tämä menetelmä tarjoaa yksinkertaisen tavan valita eri mallitunnukset käyttämällä samaa kannettavaa tietokonetta. Esittelytarkoituksiin käytämme huggingface-text2text-flan-t5-large mallia:
Hae artefaktit mallille
SageMakerin avulla voimme tehdä päätelmiä esiopetetusta mallista, jopa ilman hienosäätämistä ensin uudessa tietojoukossa. Aloitamme hakemalla deploy_image_uri
, deploy_source_uri
ja model_uri
esikoulutetulle mallille:
Määritä erämuunnostyön hyperparametrit
Voit välittää minkä tahansa hyperparametrien osajoukon ympäristömuuttujina erämuunnostyöhön. Voit myös välittää nämä hyperparametrit JSON-hyötykuormassa. Jos kuitenkin asetat ympäristömuuttujia hyperparametreille seuraavan koodin osoittamalla tavalla, JSON-rivien hyötykuorman yksittäisistä esimerkeistä saatuja edistyneitä hyperparametreja ei käytetä. Jos haluat käyttää hyötykuorman hyperparametreja, sinun kannattaa asettaa hyper_params_dict
parametrin sijaan nolla.
Valmistele tiedot erämuunnoksia varten
Nyt olemme valmiita lataamaan cnn_dailymail Hugging Facen tietojoukko:
Käymme läpi jokaisen tiedonsyötön ja luomme syöttötiedot vaaditussa muodossa. Luomme an articles.jsonl
tiedosto testidatatiedostona, joka sisältää artikkeleita, jotka on tiivistettävä syöttöhyötykuormana. Kun luomme tätä tiedostoa, lisäämme kehotteen "Briefly summarize this text:"
jokaiselle testisyöttöriville. Jos haluat eri hyperparametrit jokaiselle testisyötteelle, voit liittää kyseiset hyperparametrit osana tietojoukon luomista.
Luomme highlights.jsonl
totuustiedostona, joka sisältää kunkin testitiedostoon tallennetun artikkelin kohokohdat articles.jsonl
. Tallennamme molemmat testitiedostot an Amazonin yksinkertainen tallennuspalvelu (Amazon S3) ämpäri. Katso seuraava koodi:
Suorita erämuunnostyö
Kun aloitat erämuunnostyön, SageMaker käynnistää tarvittavat laskentaresurssit tietojen käsittelemiseksi, mukaan lukien CPU- tai GPU-instanssit valitun ilmentymän tyypin mukaan. Erämuunnostyön aikana SageMaker määrittää ja hallinnoi automaattisesti tietojen käsittelyyn tarvittavia laskentaresursseja, mukaan lukien ilmentymät, tallennus- ja verkkoresurssit. Kun erämuunnostyö on valmis, SageMaker puhdistaa laskentaresurssit automaattisesti. Tämä tarkoittaa, että työn aikana käytetyt esiintymät ja tallennustila pysäytetään ja poistetaan, mikä vapauttaa resursseja ja minimoi kustannukset. Katso seuraava koodi:
Seuraava on yksi esimerkkitietue kohteesta articles.jsonl
testitiedosto. Huomaa, että tämän tiedoston tietueella on tunnus, joka vastaa predict.jsonl
tiedostotietueet, jotka näyttävät yhteenvedon Hugging Face Text2Text -mallin tulosteena. Samoin pohjatotuustiedostolla on myös vastaava tunnus tietueelle. Testitiedoston, perustotuustiedoston ja tulostiedoston välinen täsmäytystunnus mahdollistaa syöttötietueiden linkittämisen tulostietueisiin tulosten helpon tulkinnan vuoksi.
Seuraavassa on esimerkki syöttötietueesta yhteenvetoa varten:
Seuraava on ennustettu tulos yhteenvedolla:
Seuraava on pohjatotuuksien yhteenveto mallin arviointia varten:
Seuraavaksi käytämme pohjatotuutta ja ennustettuja lähtöjä mallin arvioinnissa.
Arvioi malli käyttämällä ROUGE-pisteitä¶
RED, eli Recall-Oriented Understudy for Gisting Evaluation, on joukko mittareita ja ohjelmistopaketti, jota käytetään automaattisen yhteenvedon ja konekäännösten arviointiin luonnollisen kielen käsittelyssä. Mittarit vertaavat automaattisesti tuotettua yhteenvetoa tai käännöstä viitteeksi (ihmisen tuottamaan) yhteenvetoon tai käännökseen tai viitejoukkoon.
Seuraavassa koodissa yhdistämme ennustetun ja alkuperäisen yhteenvedon yhdistämällä ne yhteisellä avaimella id
ja käytä tätä laskeaksesi ROUGE-pisteet:
Suorita reaaliaikainen eräpäättely
Seuraavaksi näytämme, kuinka suoritat reaaliaikaisen eräpäätelmän päätepisteessä antamalla syötteet luettelona. Käytämme samaa mallitunnusta ja tietojoukkoa kuin aiemmin, paitsi että otamme testitietojoukosta muutaman tietueen ja käytämme niitä reaaliaikaisen päätepisteen kutsumiseen.
Seuraava koodi näyttää kuinka luodaan ja otetaan käyttöön reaaliaikainen päätepiste reaaliaikaista eräpäätelmää varten:
Seuraavaksi valmistelemme syöttöhyötykuorman. Tätä varten käytämme aiemmin laatimiamme tietoja ja poimimme ensimmäiset 10 testisyöttöä ja lisäämme tekstisyötteisiin hyperparametreja, joita haluamme käyttää. Tarjoamme tämän hyötykuorman reaaliajassa invoke_endpoint
. Vastauksen hyötykuorma palautetaan sitten vastausluettelona. Katso seuraava koodi:
Puhdistaa
Kun olet testannut päätepisteen, varmista, että poistat SageMaker-päätepäätepisteen ja poistat mallin kulujen välttämiseksi.
Yhteenveto
Tässä muistikirjassa suoritimme erämuunnoksen esitelläksemme Hugging Face Text2Text Generator -mallia yhteenvetotehtäviä varten. Erämuunnos on edullinen päätelmien saamiseksi suurista tietojoukoista ilman jatkuvaa päätepistettä. Linkitimme syöttötietueet päätelmiin tulosten tulkinnan auttamiseksi. Käytimme ROUGE-pisteitä vertaillaksemme testitietojen yhteenvetoa mallin luomaan yhteenvetoon.
Lisäksi esitimme reaaliaikaisen eräpäätelmän, jossa voit lähettää pienen erän tietoja reaaliaikaiseen päätepisteeseen saavuttaaksesi tasapainon viiveen ja suorituskyvyn välillä skenaarioissa, kuten syöttötietojen suoratoistossa. Reaaliaikainen eräpäätelmä auttaa lisäämään reaaliaikaisten pyyntöjen suorituskykyä.
Kokeile erämuunnosta SageMakerin Text2Text Generation -malleilla tänään ja kerro meille palautteesi!
Tietoja kirjoittajista
Hemant Singh on koneoppimisinsinööri, jolla on kokemusta Amazon SageMaker JumpStart- ja Amazon SageMaker -algoritmeista. Hän sai maisterinsa Courant Institute of Mathematical Sciences -instituutista ja B.Techin IIT Delhistä. Hänellä on kokemusta erilaisista koneoppimisongelmista luonnollisen kielen käsittelyn, tietokonenäön ja aikasarjaanalyysin alalla.
Rachna Chadha on AWS:n strategisten tilien pääratkaisuarkkitehti AI/ML. Rachna on optimisti, joka uskoo, että tekoälyn eettinen ja vastuullinen käyttö voi parantaa yhteiskuntaa tulevaisuudessa ja tuoda taloudellista ja sosiaalista vaurautta. Vapaa-ajallaan Rachna viettää mielellään aikaa perheensä kanssa, vaeltaa ja kuuntelee musiikkia.
Tohtori Ashish Khetan on vanhempi soveltuva tutkija, jolla on sisäänrakennetut Amazon SageMaker -algoritmit ja auttaa kehittämään koneoppimisalgoritmeja. Hän sai tohtorin tutkinnon Illinois Urbana-Champaignin yliopistosta. Hän on aktiivinen koneoppimisen ja tilastollisen päättelyn tutkija, ja hän on julkaissut monia artikkeleita NeurIPS-, ICML-, ICLR-, JMLR-, ACL- ja EMNLP-konferensseissa.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoAiStream. Web3 Data Intelligence. Tietoa laajennettu. Pääsy tästä.
- Tulevaisuuden lyöminen Adryenn Ashley. Pääsy tästä.
- Osta ja myy osakkeita PRE-IPO-yhtiöissä PREIPO®:lla. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/perform-batch-transforms-with-amazon-sagemaker-jumpstart-text2text-generation-large-language-models/
- :on
- :On
- :ei
- :missä
- $ YLÖS
- 000
- 1
- 10
- 100
- 11
- 13
- 14
- 20
- 2014
- 50
- 7
- 8
- 9
- a
- pystyy
- Meistä
- edellä
- hyväksyminen
- hyväksytty
- pääsy
- Mukaan
- Tilit
- Saavuttaa
- Ostaa
- poikki
- toimet
- aktiivinen
- kehittynyt
- edullinen
- vastaan
- AI
- AI / ML
- Tuki
- algoritmit
- Kaikki
- väitetty
- mahdollistaa
- Myös
- Amazon
- Amazon Sage Maker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- analyysi
- ja
- Ilmoittaa
- Kaikki
- api
- sovellettu
- lähestymistapa
- OVAT
- noin
- artikkeli
- artikkelit
- AS
- At
- yrityksiä
- viranomaisen
- automaattisesti
- automaattisesti
- saatavissa
- välttää
- AWS
- Balance
- pohja
- perustua
- BE
- tuli
- koska
- tulee
- ennen
- ovat
- Uskoa
- uskoo
- Benjamin
- Paremmin
- välillä
- elin
- sekä
- Molemmin puolin
- rajat
- lyhyesti
- tuoda
- Tuo
- sisäänrakennettu
- liiketoiminta
- mutta
- by
- soittaa
- CAN
- ei voi
- tapauksissa
- Aiheuttaa
- maksut
- Valita
- luokka
- asiakas
- lähempänä
- CNN
- koodi
- yhdistää
- yhdistää
- yhdistely
- Tulla
- sitoumukset
- sitoutunut
- Yhteinen
- verrata
- täydellinen
- Laskea
- tietokone
- Tietokoneen visio
- käsite
- Suorittaa
- konferenssit
- Kontti
- jatkaa
- jatkuva
- osaltaan
- Hinta
- kustannustehokas
- voisi
- neuvo
- kielteisesti vaikuttava
- maahan
- Tuomioistuin
- luoda
- Luominen
- rikokset
- Rikollinen
- tiedot
- tietojen syöttö
- aineistot
- kuollut
- päätös
- oletusarvo
- Delhi
- osoittaa
- osoittivat
- osasto
- Riippuen
- sijoittaa
- käyttöönotto
- on kuvattu
- Määrittää
- kehittää
- Kehitys
- erota
- erot
- eri
- ohjata
- useat
- do
- Satamatyöläinen
- verkkotunnuksen
- tehty
- Dont
- Mukaan
- alas
- kesto
- aikana
- kukin
- Aikaisemmin
- Itään
- helppo
- Taloudellinen
- tehokas
- ponnisteluja
- oikeutettu
- mahdollistaa
- loppu
- päätepiste
- insinööri
- varmistaa
- syöttää
- merkintä
- ympäristö
- Aikakausi
- eettinen
- arvioida
- arviointiin
- arviointi
- Jopa
- näyttö
- esimerkki
- Esimerkit
- Paitsi
- innoissaan
- teloitus
- experience
- uute
- Kasvot
- usko
- perhe
- harvat
- filee
- Asiakirjat
- Etunimi
- jälkeen
- varten
- voima
- ulkomainen
- muodollinen
- muodollisesti
- muoto
- Eteenpäin
- perustamisen
- alkaen
- koko
- edelleen
- tulevaisuutta
- sukupolvi
- generaattori
- saada
- antaa
- Go
- Tavoitteet
- hallitukset
- GPU
- suurempi
- Maa
- Ryhmä
- Palvelimet
- Olla
- he
- auttaa
- auttaa
- hänen
- tätä
- Korkea
- raidat
- hänen
- isännöi
- Miten
- Miten
- Kuitenkin
- HTML
- http
- HTTPS
- HalaaKasvot
- ihmisen
- ihmisoikeudet
- Ihmiskunta
- ID
- ids
- if
- Illinois
- kuva
- heti
- täytäntöönpanosta
- tuoda
- parantaa
- in
- sisältää
- Mukaan lukien
- Kasvaa
- itsenäisyys
- henkilökohtainen
- Erikseen
- tiedot
- Infrastruktuuri
- ensimmäinen
- vääryys
- panos
- tuloa
- tutkimus
- esimerkki
- sen sijaan
- Instituutti
- kansainvälisesti
- tulkinta
- tulee
- tutkia
- tutkimus
- Tutkimukset
- Israel
- IT
- SEN
- tammikuu
- Job
- yhdistää
- tuloaan
- jpg
- json
- tuomari
- kesäkuu
- toimivalta
- vain
- Oikeudenmukaisuus
- avain
- Tietää
- lasku
- Kieli
- suuri
- Sukunimi
- Viive
- myöhemmin
- käynnistää
- oppiminen
- vasemmalle
- antaa
- kevyesti
- pitää
- tykkää
- linja
- linjat
- liittyvät
- yhdistää
- Lista
- Kuunteleminen
- kuormitus
- Pitkät
- kauemmin
- Matala
- kone
- koneoppiminen
- tehdä
- Tekeminen
- hallinnoi
- tapa
- monet
- merkitty
- Hyväksytty
- matching
- matemaattinen
- Saattaa..
- välineet
- jäsen
- Jäsenet
- jäsenyys
- Muisti
- menetelmä
- Metrics
- minimointia
- ML
- tila
- malli
- mallit
- Kuukausi
- lisää
- liikkua
- Musiikki
- täytyy
- nimi
- Luonnollinen
- Luonnollinen kielen käsittely
- välttämätön
- Tarve
- neuvottelut
- Eikä
- Alankomaat
- verkostoituminen
- Uusi
- uutiset
- lehdistötiedote
- muistikirja
- nyt
- objekti
- saada
- of
- Office
- Virallisesti
- on
- ONE
- vain
- avata
- avoimen lähdekoodin
- avattu
- vastustaa
- vastakkainen
- or
- alkuperäinen
- OS
- meidän
- ulos
- ulostulo
- yli
- paketti
- sivulla
- Palestiina
- paperit
- parametri
- parametrit
- osa
- puolue
- kulkea
- polku
- päällystys
- rauha
- Ihmiset
- Suorittaa
- Oikeudet
- Platon
- Platonin tietotieto
- PlatonData
- Ole hyvä
- Kohta
- mahdollinen
- Kirje
- ennustaa
- ennusti
- ennustus
- Ennusteet
- Predictor
- Suositut
- Valmistella
- valmis
- edellytyksiä
- puheenjohtaja
- paine
- tärkein
- pääministeri
- Pääasiallinen
- Ongelma
- ongelmia
- prosessi
- Prosessit
- käsittely
- valmistettu
- hyvinvointi
- toimittaa
- mikäli
- tarjoaa
- tarjoamalla
- julkaistu
- tarkoituksiin
- Python
- alue
- valmis
- todellinen
- reaaliaikainen
- ennätys
- asiakirjat
- viittaukset
- viittaa
- vapauta
- poistettu
- TOISTUVASTI
- raportti
- pyyntö
- pyynnöt
- edellyttää
- tarvitaan
- vaatimukset
- tutkija
- Esittelymateriaalit
- vastaus
- vasteet
- vastuut
- vastuullinen
- johtua
- tulokset
- palata
- Tuotto
- arviot
- oikeudet
- Rooli
- Rooma
- RIVI
- ajaa
- s
- sagemaker
- SageMaker-johtopäätös
- Said
- sama
- sanonta
- skenaariot
- tieteet
- Tiedemies
- pisteet
- sdk
- nähdä
- etsiä
- valittu
- lähettää
- vanhempi
- Sarjat
- Palvelut
- setti
- asetus
- setup
- yhteinen
- hän
- shouldnt
- näyttää
- näyteikkuna
- Näytä
- Sides
- allekirjoitettu
- samalla lailla
- Yksinkertainen
- koska
- tilanne
- tilanteita
- Koko
- pieni
- So
- sosiaalinen
- yhteiskunta
- Tuotteemme
- ratkaisu
- Ratkaisumme
- jonkin verran
- puhua
- puhuminen
- menot
- Alkaa
- alkoi
- Osavaltio
- ulkoministeriö
- huippu-
- Lausunto
- Valtiot
- tilastollinen
- Vaihe
- Askeleet
- Yhä
- pysähtynyt
- Levytila
- verkkokaupasta
- tallennettu
- suora
- Strateginen
- virta
- streaming
- voimakkaasti
- aihe
- yhteenveto
- YHTEENVETO
- kesä
- tuki
- ottaa
- otettava
- vie
- Tehtävä
- tehtävät
- teknologia
- malleja
- alueiden
- alue
- testi
- kuin
- että
- -
- tiedot
- Alankomaat
- Valtion
- maailma
- heidän
- Niitä
- sitten
- siksi
- Nämä
- ne
- tätä
- ne
- Kautta
- suoritusteho
- aika
- Aikasarja
- että
- tänään
- yhdessä
- revitty
- kohti
- Juna
- Muuttaa
- muuntaja
- muunnoksia
- Kääntäminen
- totta
- Totuus
- tyyppi
- tyypit
- heikentää
- Yhtenäinen
- Yhdysvallat
- Yleismaailmallinen
- yliopisto
- toisin kuin
- Ladataan
- päälle
- us
- käyttää
- käytetty
- käyttämällä
- Varapresidentti
- visio
- volyymit
- W
- haluta
- sota
- oli
- Katso
- Tapa..
- we
- verkko
- verkkopalvelut
- Keskiviikko
- tervetuloa
- tyytyväinen
- HYVIN
- Mitä
- kun
- onko
- joka
- vaikka
- KUKA
- leveä
- Laaja valikoima
- tulee
- with
- sisällä
- ilman
- työskentely
- maailman-
- olisi
- Voit
- Sinun
- zephyrnet