Täna teatame rõõmuga, et saate nüüd teha pakettteisendusi Amazon SageMaker JumpStart suured keelemudelid (LLM-id) Text2Text Generation jaoks. Pakettteisendused on kasulikud olukordades, kus vastused ei pea olema reaalajas ja seetõttu saate teha järeldusi suurte andmehulkade puhul hulgi. Partii teisenduse jaoks käivitatakse paketttöö, mis võtab pakettsisendi andmestiku ja eelkoolitatud mudelina ning väljastab prognoosid andmestiku iga andmepunkti kohta. Pakettteisendus on kulutõhus, sest erinevalt reaalajas hostitud lõpp-punktidest, millel on püsiv riistvara, lammutatakse pakkteisenduse klastrid töö lõppedes maha ja seetõttu kasutatakse riistvara ainult paketttöö ajal.
Mõningatel kasutusjuhtudel saab reaalajas järelduspäringuid rühmitada väikesteks partiideks, et luua reaalajas või peaaegu reaalajas vastuseid. Näiteks kui teil on vaja töödelda pidevat andmevoogu väikese latentsuse ja suure läbilaskevõimega, nõuab iga päringu jaoks eraldi reaalajas lõpp-punkti kutsumine rohkem ressursse ja võib võtta rohkem aega kõigi päringute töötlemiseks, kuna töötlemine toimub järjestikku. . Parem lähenemine oleks rühmitada mõned päringud ja kutsuda reaalajas lõpp-punkt partii järeldamisrežiimis, mis töötleb teie päringuid mudeli ühe edasikäiguga ja tagastab päringu hulgivastuse reaalajas või peaaegu reaalajas. . Vastuse latentsusaeg sõltub sellest, kui palju taotlusi kokku rühmitate, ja eksemplari mälu suurusest, seega saate partii suurust häälestada vastavalt oma ärinõuetele latentsusaja ja läbilaskevõime osas. Me kutsume seda reaalajas partii järeldus sest see ühendab pakkimise kontseptsiooni, pakkudes samas reaalajas vastuseid. Reaalajas pakettjäreldamise abil saate saavutada tasakaalu madala latentsusaja ja suure läbilaskevõime vahel, võimaldades teil töödelda suuri andmemahtusid õigeaegselt ja tõhusalt.
Kiirkäivituse partii teisendus teksti2teksti genereerimise mudelite jaoks võimaldab teil edastada paketi hüperparameetrid keskkonnamuutujate kaudu, mis suurendavad veelgi läbilaskevõimet ja minimeerivad latentsust.
JumpStart pakub eelkoolitatud avatud lähtekoodiga mudeleid paljudele probleemitüüpidele, mis aitavad teil masinõppega (ML) alustada. Saate neid mudeleid enne juurutamist järk-järgult koolitada ja häälestada. KiirStart pakub ka lahendusmalle, mis seadistavad infrastruktuuri tavaliste kasutusjuhtude jaoks, ja käivitatavaid märkmikke ML-i jaoks Amazon SageMaker. Eelkoolitatud mudelitele, lahendusmallidele ja näidetele pääsete juurde JumpStarti sihtlehe kaudu Amazon SageMaker Studio. JumpStarti mudelitele pääsete juurde ka SageMaker Python SDK abil.
Selles postituses demonstreerime, kuidas kasutada eelkoolitatud tipptasemel tehnikat text2text FLAN T5 mudelid Hugging Face'ist partii teisendamiseks ja reaalajas partii järelduste tegemiseks.
Lahenduse ülevaade
Märkmik, mis näitab eelkoolitatud Text2Text FLAN T5 mudelite partii teisendust Kallistav nägu saadaval järgnevalt GitHubi hoidla. See märkmik kasutab Hugging Face'i andmeid cnn_dailymail SageMakeri SDK-d kasutava teksti kokkuvõtte ülesande andmestik.
Järgmised on peamised sammud partii teisenduse ja reaalajas partii järelduse rakendamiseks.
- Seadke eeltingimused.
- Valige eelkoolitatud mudel.
- Tooge mudeli artefaktid.
- Määrake partii teisenduse töö hüperparameetrid.
- Valmistage ette andmed partii teisendamiseks.
- Käivitage partii teisendustöö.
- Hinnake kokkuvõtet, kasutades a RED (Recall-Oriented Understudy for Gisting Evaluation) skoor.
- Tehke reaalajas partii järeldused.
Seadke eeltingimused
Enne sülearvuti käivitamist peate läbima mõned esialgsed seadistustoimingud. Seadistagem SageMakeri täitmisroll, et sellel oleks õigused teie nimel AWS-i teenuseid käitada:
Valige eelkoolitatud mudel
Vaikemudelina kasutame mudelit huggingface-text2text-flan-t5-large. Valikuliselt saate KiirStartis hankida saadaolevate Text2Text mudelite loendi ja valida oma eelistatud mudeli. See meetod pakub lihtsat viisi erinevate mudeli ID-de valimiseks sama sülearvuti abil. Demonstreerimiseks kasutame mudelit huggingface-text2text-flan-t5-large:
Tooge mudeli artefaktid
SageMakeriga saame teha järeldusi eelkoolitatud mudeli kohta, isegi ilma seda uues andmestikus esmalt viimistlemata. Alustame otsimisega deploy_image_uri
, deploy_source_uri
ja model_uri
eelkoolitatud mudeli jaoks:
Määrake partii teisenduse töö hüperparameetrid
Pakettmuundustööle võite keskkonnamuutujatena edastada mis tahes hüperparameetrite alamhulka. Neid hüperparameetreid saate edastada ka JSON-i kasulikus koormuses. Kui aga määrate hüperparameetrite jaoks keskkonnamuutujaid, nagu näitab järgmine kood, siis JSON-i ridade kasuliku koormuse üksikute näidete täpsemaid hüperparameetreid ei kasutata. Kui soovite kasutada kasuliku koormuse hüperparameetreid, võiksite määrata hyper_params_dict
parameetri asemel null.
Valmistage andmed ette partii teisendamiseks
Nüüd oleme valmis laadima cnn_dailymail Hugging Face'i andmestik:
Käime iga andmesisestuse üle ja loome sisendandmed vajalikus vormingus. Loome an articles.jsonl
fail testandmefailina, mis sisaldab artikleid, mis tuleb sisendkoormusena kokku võtta. Selle faili loomisel lisame viipa "Briefly summarize this text:"
igale testisisestuse reale. Kui soovite iga testsisendi jaoks kasutada erinevaid hüperparameetreid, saate need hüperparameetrid andmestiku loomise osana lisada.
Me loome highlights.jsonl
põhitõefailina, mis sisaldab iga testfaili salvestatud artikli esiletõstmisi articles.jsonl
. Salvestame mõlemad testfailid an Amazoni lihtne salvestusteenus (Amazon S3) kopp. Vaadake järgmist koodi:
Käivitage partii teisendustöö
Kui käivitate pakettteisendustöö, käivitab SageMaker andmete töötlemiseks vajalikud arvutusressursid, sealhulgas protsessori või GPU eksemplarid, olenevalt valitud eksemplari tüübist. Pakettmuunduse töö ajal varustab ja haldab SageMaker automaatselt andmete töötlemiseks vajalikke arvutusressursse, sealhulgas eksemplare, salvestus- ja võrguressursse. Kui partii teisendustöö on lõpetatud, puhastab SageMaker arvutusressursid automaatselt. See tähendab, et töö käigus kasutatud eksemplarid ja salvestusruumid peatatakse ja eemaldatakse, vabastades ressursse ja minimeerides kulusid. Vaadake järgmist koodi:
Järgmine on üks näide kirjest articles.jsonl
testfail. Pange tähele, et selle faili kirjel on ID, mis ühtis predict.jsonl
failikirjed, mis näitavad kokkuvõtlikku kirjet Hugging Face Text2Text mudeli väljundina. Samamoodi on alustõe failil ka andmekirje jaoks sobiv ID. Testfaili, põhitõefaili ja väljundfaili sobiv ID võimaldab tulemuste hõlpsaks tõlgendamiseks linkida sisendkirjeid väljundkirjetega.
Järgmine on kokkuvõtte tegemiseks mõeldud sisendkirje näide:
Järgmine on prognoositav väljund koos kokkuvõttega:
Mudeli hindamise eesmärgil on põhitõe kokkuvõte järgmine:
Järgmisena kasutame mudeli hindamiseks põhitõde ja ennustatud väljundeid.
Hinnake mudelit ROUGE skooriga¶
REDe. meeldetuletustele orienteeritud põhiteabe hindamise alusuuring on mõõdikute kogum ja tarkvarapakett, mida kasutatakse automaatse kokkuvõtte ja masintõlke hindamiseks loomuliku keele töötlemisel. Mõõdikud võrdlevad automaatselt koostatud kokkuvõtet või tõlget viite (inimtoodetud) kokkuvõtte või tõlke või viidete komplektiga.
Järgmises koodis ühendame ennustatud ja algsed kokkuvõtted, ühendades need ühisel võtmel id
ja kasutage seda ROUGE skoori arvutamiseks:
Tehke reaalajas partii järeldused
Järgmisena näitame teile, kuidas käivitada lõpp-punktis reaalajas partii järeldust, esitades sisendid loendina. Kasutame sama mudeli ID-d ja andmestikku nagu varem, välja arvatud juhul, kui võtame testandmestikust mõned kirjed ja kasutame neid reaalajas lõpp-punkti kutsumiseks.
Järgmine kood näitab, kuidas luua ja juurutada reaalajas lõpp-punkti reaalajas partii järeldamiseks:
Järgmisena valmistame ette oma sisendkoorma. Selleks kasutame varem koostatud andmeid ja eraldame esimesed 10 testsisendit ning lisame tekstisisestele hüperparameetrid, mida soovime kasutada. Pakume seda kasulikku koormust reaalajas invoke_endpoint
. Seejärel tagastatakse vastuse kasulik koormus vastuste loendina. Vaadake järgmist koodi:
Koristage
Pärast lõpp-punkti testimist kustutage tasude vältimiseks kindlasti SageMakeri järelduse lõpp-punkt ja mudel.
Järeldus
Selles märkmikus viisime läbi pakkteisenduse, et tutvustada kokkuvõtlike ülesannete jaoks mudelit Hugging Face Text2Text Generator. Partii teisendus on kasulik järelduste tegemiseks suurtest andmekogumitest ilma püsivat lõpp-punkti nõudmata. Sidusime sisendkirjed järeldustega, et aidata tulemuste tõlgendamisel. Kasutasime ROUGE skoori, et võrrelda testiandmete kokkuvõtet mudeli loodud kokkuvõttega.
Lisaks demonstreerisime reaalajas pakettjäreldust, kus saate saata väikese andmepartii reaalajas lõpp-punkti, et saavutada tasakaal latentsusaja ja läbilaskevõime vahel selliste stsenaariumide puhul nagu sisendandmete voogesitamine. Reaalajas partii järeldus aitab suurendada reaalajas päringute läbilaskevõimet.
Proovige SageMakeris juba täna pakkteisendust Text2Text Generation mudelitega ja andke meile oma tagasisidest teada!
Autoritest
Hemant Singh on masinõppeinsener, kellel on kogemusi Amazon SageMaker JumpStart ja Amazon SageMaker sisseehitatud algoritmidega. Ta sai oma magistrikraadi Courant Institute of Mathematical Sciences ja B.Tech IIT Delhis. Tal on kogemusi mitmesuguste masinõppeprobleemidega loomuliku keele töötlemise, arvutinägemise ja aegridade analüüsi valdkonnas.
Rachna Chadha on AWS-i peamiste lahenduste arhitekti AI/ML strateegiliste kontode alal. Rachna on optimist, kes usub, et tehisintellekti eetiline ja vastutustundlik kasutamine võib tulevikus ühiskonda parandada ning tuua majanduslikku ja sotsiaalset õitsengut. Vabal ajal meeldib Rachnale perega aega veeta, matkata ja muusikat kuulata.
Dr Ashish Khetan on vanemrakendusteadlane, kellel on Amazon SageMaker sisseehitatud algoritmid ja aitab välja töötada masinõppe algoritme. Ta sai doktorikraadi Illinoisi Urbana-Champaigni ülikoolist. Ta on aktiivne masinõppe ja statistiliste järelduste uurija ning avaldanud palju artikleid NeurIPS, ICML, ICLR, JMLR, ACL ja EMNLP konverentsidel.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoAiStream. Web3 andmete luure. Täiustatud teadmised. Juurdepääs siia.
- Tuleviku rahapaja Adryenn Ashley. Juurdepääs siia.
- Ostke ja müüge IPO-eelsete ettevõtete aktsiaid koos PREIPO®-ga. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/perform-batch-transforms-with-amazon-sagemaker-jumpstart-text2text-generation-large-language-models/
- :on
- :on
- :mitte
- : kus
- $ UP
- 000
- 1
- 10
- 100
- 11
- 13
- 14
- 20
- 2014
- 50
- 7
- 8
- 9
- a
- Võimalik
- MEIST
- üle
- vastuvõtmine
- aktsepteeritud
- juurdepääs
- Vastavalt
- Kontod
- Saavutada
- Omandab
- üle
- meetmete
- aktiivne
- edasijõudnud
- kasulik
- vastu
- AI
- AI / ML
- Abi
- algoritme
- Materjal: BPA ja flataatide vaba plastik
- väidetavalt
- võimaldab
- Ka
- Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- analüüs
- ja
- Teatama
- mistahes
- API
- rakendatud
- lähenemine
- OLEME
- ümber
- artikkel
- kaubad
- AS
- At
- Katsed
- asutus
- Automaatne
- automaatselt
- saadaval
- vältima
- AWS
- Saldo
- baas
- põhineb
- BE
- sai
- sest
- muutub
- enne
- on
- Uskuma
- usub,
- Benjamin
- Parem
- vahel
- keha
- mõlemad
- Mõlemad pooled
- piirid
- lühidalt
- tooma
- Toob
- sisseehitatud
- äri
- kuid
- by
- helistama
- CAN
- ei saa
- juhtudel
- Põhjus
- koormuste
- Vali
- klass
- klient
- lähemale
- CNN
- kood
- ühendama
- ühendab
- kombineerimine
- Tulema
- kohustuste
- toime pandud
- ühine
- võrdlema
- täitma
- Arvutama
- arvuti
- Arvuti visioon
- mõiste
- Läbi viima
- konverentsid
- Konteiner
- jätkama
- pidev
- Aitas
- Maksma
- kuluefektiivne
- võiks
- nõu
- vastupidine
- riikides
- kohus
- looma
- loomine
- Kuriteod
- Criminal
- andmed
- andmesisestus
- andmekogumid
- surnud
- otsus
- vaikimisi
- Delhi
- näitama
- Näidatud
- osakond
- Olenevalt
- juurutada
- kasutuselevõtu
- kirjeldatud
- Määrama
- arendama
- & Tarkvaraarendus
- erinevad
- erinevused
- erinev
- otsene
- mitu
- do
- laevalaadija
- domeen
- tehtud
- Ära
- Uks
- alla
- kestus
- ajal
- iga
- Ajalugu
- Ida
- lihtne
- Majanduslik
- tõhus
- jõupingutusi
- abikõlblik
- võimaldades
- lõpp
- Lõpp-punkt
- insener
- tagama
- Siseneb
- kanne
- keskkond
- Ajastu
- eetiline
- hindama
- hindamine
- hindamine
- Isegi
- tõend
- näide
- näited
- Välja arvatud
- erutatud
- täitmine
- kogemus
- väljavõte
- nägu
- usk
- pere
- vähe
- fail
- Faile
- esimene
- Järel
- eest
- Sundida
- välis-
- formaalne
- Vormiliselt
- formaat
- edasi
- asutamine
- Alates
- täis
- edasi
- tulevik
- põlvkond
- generaator
- saama
- annab
- Go
- Eesmärgid
- Valitsused
- GPU
- suurem
- Maa
- Grupp
- riistvara
- Olema
- he
- aitama
- aitab
- siin
- siin
- Suur
- rõhutab
- tema
- võõrustas
- Kuidas
- Kuidas
- aga
- HTML
- http
- HTTPS
- Kallistav Nägu
- inim-
- inimõiguste
- Inimkond
- ID
- IDd
- if
- Illinois
- pilt
- kohe
- rakendamisel
- import
- parandama
- in
- sisaldama
- Kaasa arvatud
- Suurendama
- sõltumatus
- eraldi
- Üksikult
- info
- Infrastruktuur
- esialgne
- ülekohus
- sisend
- sisendite
- küsitlus
- Näiteks
- selle asemel
- Instituut
- rahvusvaheliselt
- tõlgendus
- sisse
- uurima
- uurimine
- Uuringud
- Iisrael
- IT
- ITS
- Jaanuar
- töö
- liituma
- liitumine
- jpg
- Json
- kohtunik
- juuni
- kohtualluvus
- lihtsalt
- Õiglus
- Võti
- Teadma
- maandumine
- keel
- suur
- viimane
- Hilinemine
- pärast
- käivitab
- õppimine
- lahkus
- laskma
- kergelt
- nagu
- meeldib
- joon
- liinid
- seotud
- sidumine
- nimekiri
- Kuulamine
- koormus
- Pikk
- enam
- Madal
- masin
- masinõpe
- tegema
- Tegemine
- haldab
- viis
- palju
- märgitud
- sobitatud
- sobitamine
- matemaatiline
- mai..
- vahendid
- liige
- liikmed
- liikmelisus
- Mälu
- meetod
- Meetrika
- minimeerimine
- ML
- viis
- mudel
- mudelid
- kuu
- rohkem
- liikuma
- muusika
- peab
- nimi
- Natural
- Natural Language Processing
- vajalik
- Vajadus
- läbirääkimised
- kumbki
- Holland
- võrgustike loomine
- Uus
- uudised
- Pressiteade
- märkmik
- nüüd
- objekt
- saamine
- of
- Office
- Ametlikult
- on
- ONE
- ainult
- avatud
- avatud lähtekoodiga
- avatud
- vastupidi
- vastupidine
- or
- originaal
- OS
- meie
- välja
- väljund
- üle
- pakend
- lehekülg
- Palestiinas
- dokumendid
- parameeter
- parameetrid
- osa
- partei
- sooritama
- tee
- Sillutis
- rahu
- Inimesed
- täitma
- Õigused
- Platon
- Platoni andmete intelligentsus
- PlatoData
- palun
- Punkt
- võimalik
- post
- ennustada
- ennustada
- ennustus
- Ennustused
- Predictor
- eelistatud
- Valmistama
- valmis
- eeldused
- president
- surve
- Peamine
- peaminister
- Peamine
- Probleem
- probleeme
- protsess
- Protsessid
- töötlemine
- Toodetud
- heaolu
- anda
- tingimusel
- annab
- pakkudes
- avaldatud
- eesmärkidel
- Python
- valik
- valmis
- reaalne
- reaalajas
- rekord
- andmed
- viited
- viitab
- vabastama
- Eemaldatud
- KORDUVALT
- aru
- taotleda
- Taotlusi
- nõudma
- nõutav
- Nõuded
- uurija
- Vahendid
- vastus
- vastuste
- kohustused
- vastutav
- kaasa
- Tulemused
- tagasipöördumine
- Tulu
- läbi
- õigusi
- Roll
- Rooma
- ROW
- jooks
- s
- salveitegija
- SageMakeri järeldus
- Ütlesin
- sama
- ütlus
- stsenaariumid
- TEADUSED
- teadlane
- skoor
- SDK
- vaata
- otsib
- väljavalitud
- saatma
- vanem
- Seeria
- Teenused
- komplekt
- kehtestamine
- seade
- jagatud
- ta
- peaks
- näitama
- presentatsioon
- Näitused
- Küljed
- allkirjastatud
- Samamoodi
- lihtne
- alates
- olukord
- olukordades
- SUURUS
- väike
- So
- sotsiaalmeedia
- Ühiskond
- tarkvara
- lahendus
- Lahendused
- mõned
- rääkima
- rääkimine
- Kulutused
- algus
- alustatud
- riik
- Riigidepartemang
- modernne
- väljavõte
- Ühendriigid
- statistiline
- Samm
- Sammud
- Veel
- peatatud
- ladustamine
- salvestada
- ladustatud
- lihtne
- Strateegiline
- oja
- streaming
- tugevalt
- teema
- Kokku võtta
- KOKKUVÕTE
- suvi
- toetama
- Võtma
- võtnud
- võtab
- Ülesanne
- ülesanded
- tech
- malle
- territooriumide
- territoorium
- test
- kui
- et
- .
- teave
- Holland
- Riik
- maailm
- oma
- Neile
- SIIS
- seetõttu
- Need
- nad
- see
- need
- Läbi
- läbilaskevõime
- aeg
- Ajaseeria
- et
- täna
- kokku
- rebenenud
- suunas
- Rong
- Muutma
- trafo
- muudab
- Tõlge
- tõsi
- Tõde
- tüüp
- liigid
- kahjustama
- Ühendatud
- Ühendriigid
- Universaalne
- Ülikool
- erinevalt
- Üleslaadimine
- peale
- us
- kasutama
- Kasutatud
- kasutamine
- Asepresident
- nägemus
- mahud
- W
- tahan
- sõda
- oli
- Watch
- Tee..
- we
- web
- veebiteenused
- Kolmapäev
- teretulnud
- tervitas
- Hästi
- M
- millal
- kas
- mis
- kuigi
- WHO
- lai
- Lai valik
- will
- koos
- jooksul
- ilma
- töö
- maailm
- oleks
- sa
- Sinu
- sephyrnet