Ma örömmel jelentjük be, hogy mostantól csoportos átalakításokat hajthat végre a következővel Amazon SageMaker JumpStart nagy nyelvi modellek (LLM) a Text2Text Generation számára. A kötegelt átalakítások olyan helyzetekben hasznosak, amikor a válaszoknak nem kell valós idejűnek lenniük, és ezért tömegesen köthet következtetéseket nagy adatkészletekre. A kötegelt átalakításhoz egy kötegelt feladat fut, amely a kötegelt bemenetet adatkészletként és előre betanított modellként veszi, és előrejelzéseket ad ki az adatkészlet minden adatpontjához. A kötegelt átalakítás költséghatékony, mivel ellentétben a valós idejű hosztolt végpontokkal, amelyek állandó hardverrel rendelkeznek, a kötegelt átalakítási fürtök a feladat befejezésekor lebontódnak, és ezért a hardvert csak a kötegelt feladat időtartamára használják.
Egyes felhasználási esetekben a valós idejű következtetési kérelmek kis kötegekbe csoportosíthatók kötegelt feldolgozás céljából, hogy valós idejű vagy közel valós idejű válaszokat hozzanak létre. Például, ha folyamatos adatfolyamot kell feldolgoznia alacsony késleltetéssel és nagy áteresztőképességgel, egy valós idejű végpont külön-külön történő meghívása minden kéréshez több erőforrást igényel, és tovább tarthat az összes kérés feldolgozása, mivel a feldolgozás sorozatosan történik. . Egy jobb megközelítés az lenne, ha csoportosítaná a kérések egy részét, és kötegelt következtetési módban hívná meg a valós idejű végpontot, amely a kéréseket a modell egy előrehaladási lépésében dolgozza fel, és valós időben vagy közel valós időben adja vissza a kérés tömeges választ. . A válasz várakozási ideje a csoportosított kérések számától és a példánymemória méretétől függ, ezért a kötegméretet a várakozási idő és az átviteli sebesség üzleti követelményei szerint hangolhatja. Ezt hívjuk valós idejű kötegelt következtetés mert egyesíti a kötegelés fogalmát, miközben valós idejű válaszokat ad. A valós idejű kötegelt következtetéssel egyensúlyt érhet el az alacsony késleltetés és a nagy átviteli sebesség között, lehetővé téve a nagy mennyiségű adat időbeni és hatékony feldolgozását.
A Jumpstart kötegelt átalakítás a szöveg2szöveggenerációs modellekhez lehetővé teszi a kötegelt hiperparaméterek átadását olyan környezeti változókon keresztül, amelyek tovább növelik az átviteli sebességet és minimalizálják a késleltetést.
A JumpStart előképzett, nyílt forráskódú modelleket kínál számos problématípushoz, hogy segítsen a gépi tanulás (ML) elkezdésében. Ezeket a modelleket a telepítés előtt fokozatosan betaníthatja és hangolhatja. A JumpStart megoldássablonokat is kínál, amelyek infrastruktúrát állítanak be a gyakori felhasználási esetekhez, valamint futtatható példajegyzetfüzeteket az ML-hez Amazon SageMaker. Az előre betanított modelleket, megoldássablonokat és példákat a JumpStart nyitóoldalán érheti el Amazon SageMaker Studio. A JumpStart modelleket a SageMaker Python SDK használatával is elérheti.
Ebben a bejegyzésben bemutatjuk, hogyan kell használni a legkorszerűbb előképzettséget text2text FLAN T5 modellek a Hugging Face-ből a kötegelt átalakításhoz és a valós idejű kötegelt következtetésekhez.
Megoldás áttekintése
A notebook, amely az előre betanított Text2Text FLAN T5 modellek kötegelt átalakítását mutatja Átölelő arc a következőkben érhető el GitHub tárház. Ez a notebook a Hugging Face adatait használja cnn_dailymail adatkészlet egy szöveges összegzési feladathoz a SageMaker SDK használatával.
A következő lépések a kötegelt átalakítás és a valós idejű kötegkövetkeztetés megvalósításának legfontosabb lépései:
- Állítsa be az előfeltételeket.
- Válasszon egy előre betanított modellt.
- A modell műtermékeinek lekérése.
- Adja meg a kötegelt átalakítási feladat hiperparamétereit.
- Készítse elő az adatokat a kötegelt átalakításhoz.
- Futtassa a kötegelt átalakítási feladatot.
- Értékelje az összegzést a segítségével PIROS (Recall-Oriented Understudy for Gisting Evaluation) pontszáma.
- Végezzen valós idejű kötegelt következtetést.
Állítsa be az előfeltételeket
A notebook futtatása előtt el kell végeznie néhány kezdeti beállítási lépést. Állítsuk be a SageMaker végrehajtási szerepkört, hogy jogosult legyen AWS-szolgáltatások futtatására az Ön nevében:
Válasszon egy előre betanított modellt
Alapértelmezett modellként a huggingface-text2text-flan-t5-large modellt használjuk. Opcionálisan lekérheti az elérhető Text2Text modellek listáját a JumpStartban, és kiválaszthatja a kívánt modellt. Ez a módszer egyszerű módot kínál különböző modellazonosítók kiválasztására ugyanazon notebook használatával. Bemutató céljára a huggingface-text2text-flan-t5-large modellt használjuk:
A modell műtermékeinek lekérése
A SageMaker segítségével az előre betanított modellen következtetést tudunk levonni anélkül, hogy először finomhangolnánk egy új adatkészleten. Kezdjük azzal, hogy lekérjük a deploy_image_uri
, deploy_source_uri
és model_uri
az előre betanított modell számára:
Adja meg a kötegelt átalakítási feladat hiperparamétereit
A hiperparaméterek bármely részhalmazát átadhatja környezeti változóként a kötegelt átalakítási feladatnak. Ezeket a hiperparamétereket JSON-adatállományban is átadhatja. Ha azonban a következő kódban bemutatott módon állít be környezeti változókat a hiperparaméterekhez, akkor a JSON-sorok hasznos adattartalmában szereplő egyedi példák speciális hiperparaméterei nem kerülnek felhasználásra. Ha hiperparamétereket szeretne használni a hasznos terhelésből, érdemes beállítani a hyper_params_dict
paraméter helyett nulla.
Adatok előkészítése kötegelt átalakításhoz
Most készen állunk a betöltésre cnn_dailymail Hugging Face adatkészlete:
Minden adatbevitelt átnézünk, és elkészítjük a bemeneti adatokat a kívánt formátumban. Létrehozunk egy articles.jsonl
fájl tesztadatfájlként, amely olyan cikkeket tartalmaz, amelyeket bemeneti hasznos adatként kell összefoglalni. A fájl létrehozásakor hozzáfűzzük a promptot "Briefly summarize this text:"
minden tesztbeviteli sorhoz. Ha különböző hiperparamétereket szeretne minden egyes tesztbemenethez, akkor az adatkészlet létrehozásának részeként hozzáfűzheti ezeket a hiperparamétereket.
Létrehozunk highlights.jsonl
mint az alapigazság-fájl, amely a tesztfájlban tárolt egyes cikkek kiemeléseit tartalmazza articles.jsonl
. Mindkét tesztfájlt egy Amazon egyszerű tárolási szolgáltatás (Amazon S3) vödör. Lásd a következő kódot:
Futtassa a kötegelt átalakítási feladatot
Amikor elindít egy kötegelt átalakítási feladatot, a SageMaker elindítja a szükséges számítási erőforrásokat az adatok feldolgozásához, beleértve a CPU- vagy GPU-példányokat is, a kiválasztott példánytípustól függően. A kötegelt átalakítási feladat során a SageMaker automatikusan létrehozza és kezeli az adatok feldolgozásához szükséges számítási erőforrásokat, beleértve a példányokat, a tárolást és a hálózati erőforrásokat. Amikor a kötegelt átalakítási feladat befejeződött, a SageMaker automatikusan megtisztítja a számítási erőforrásokat. Ez azt jelenti, hogy a feladat során használt példányokat és tárhelyeket leállítják és eltávolítják, így erőforrások szabadulnak fel és a költségek minimalizálódnak. Lásd a következő kódot:
A következő egy példa rekord a articles.jsonl
tesztfájl. Vegye figyelembe, hogy a fájl rekordjának azonosítója megegyezik a predict.jsonl
fájlrekordok, amelyek egy összefoglaló rekordot jelenítenek meg a Hugging Face Text2Text modell kimeneteként. Hasonlóképpen, az alapigazság-fájlnak is van egy megfelelő azonosítója az adatrekordhoz. A tesztfájlban, a földi igazságfájlban és a kimeneti fájlban található egyező azonosító lehetővé teszi a bemeneti rekordok összekapcsolását a kimeneti rekordokkal az eredmények egyszerű értelmezéséhez.
A következő példa az összefoglaláshoz biztosított bemeneti rekord:
A következő a várható kimenet összegzéssel:
A következő az alapigazság összegzése modellértékelési célokra:
Ezután az alapigazságot és a megjósolt kimeneteket használjuk a modellértékeléshez.
Értékelje a modellt a ROUGE pontszám segítségével¶
PIROS, vagy Recall-Oriented Understudy for Gisting Evaluation, metrikák és szoftvercsomag, amelyet az automatikus összegzés és a gépi fordítás kiértékelésére használnak a természetes nyelvi feldolgozásban. A mérőszámok összehasonlítják az automatikusan készített összefoglalót vagy fordítást egy referencia (ember által készített) összefoglalóval vagy fordítással vagy hivatkozások halmazával.
A következő kódban az előrejelzett és az eredeti összefoglalókat a közös kulcson egyesítjük id
és ezt használja a ROUGE pontszám kiszámításához:
Végezzen valós idejű kötegelt következtetést
Ezután bemutatjuk, hogyan futtathat valós idejű kötegelt következtetést a végponton a bemenetek listaként történő megadásával. Ugyanazt a modellazonosítót és adatkészletet használjuk, mint korábban, kivéve, hogy néhány rekordot veszünk a tesztadatkészletből, és valós idejű végpont meghívására használjuk őket.
A következő kód bemutatja, hogyan hozhat létre és telepíthet valós idejű végpontot a valós idejű kötegelt következtetéshez:
Ezután elkészítjük a bemeneti hasznos terhet. Ehhez a korábban elkészített adatokat használjuk fel, és kivonjuk az első 10 tesztbevitelt, és a szövegbevitelhez hozzáfűzzük a használni kívánt hiperparamétereket. Ezt a rakományt valós időben biztosítjuk invoke_endpoint
. A válasz hasznos adata ezután válaszlistaként kerül visszaadásra. Lásd a következő kódot:
Tisztítsuk meg
A végpont tesztelése után feltétlenül törölje a SageMaker következtetési végpontot, és törölje a modellt, hogy elkerülje a költségeket.
Következtetés
Ebben a jegyzetfüzetben kötegelt átalakítást végeztünk, hogy bemutassuk a Hugging Face Text2Text Generator modellt az összegzési feladatokhoz. A kötegelt átalakítás előnyös nagy adatkészletekből következtetések levonásában, anélkül, hogy állandó végpontra lenne szükség. A bemeneti rekordokat következtetésekkel kapcsoltuk össze, hogy segítsük az eredmények értelmezését. A tesztadatok összegzésének összehasonlítására a ROUGE pontszámot használtuk a modell által generált összegzéssel.
Ezenkívül bemutattuk a valós idejű kötegelt következtetést, ahol kis mennyiségű adatot küldhet egy valós idejű végpontra, hogy egyensúlyt érjen el a várakozási idő és az átviteli sebesség között olyan forgatókönyveknél, mint a bemeneti adatok streamelése. A valós idejű kötegelt következtetés segít növelni a valós idejű kérések átviteli sebességét.
Próbálja ki a kötegelt átalakítást a Text2Text Generation modellekkel a SageMakerben még ma, és ossza meg velünk visszajelzését!
A szerzőkről
Hemant Singh gépi tanulási mérnök, aki tapasztalattal rendelkezik az Amazon SageMaker JumpStart és az Amazon SageMaker beépített algoritmusaiban. Mesterképzését a Courant Institute of Mathematical Sciences-ben, a B.Tech-et pedig az IIT Delhiben szerezte. Tapasztalattal rendelkezik a természetes nyelvi feldolgozás, a számítógépes látás és az idősorelemzés területén a gépi tanulási problémák legkülönbözőbb skáláján.
Rachna Chadha az AWS stratégiai számláinak fő megoldási építésze AI/ML. Rachna optimista, aki hisz abban, hogy a mesterséges intelligencia etikus és felelős használata javíthatja a társadalmat a jövőben, és gazdasági és társadalmi jólétet hozhat. Szabadidejében Rachna szereti a családjával tölteni az idejét, kirándulni és zenét hallgatni.
Dr. Ashish Khetan vezető alkalmazott tudós az Amazon SageMaker beépített algoritmusaival, és segít gépi tanulási algoritmusok fejlesztésében. PhD fokozatát az Illinois Urbana-Champaign Egyetemen szerezte. A gépi tanulás és a statisztikai következtetések aktív kutatója, és számos közleményt publikált NeurIPS, ICML, ICLR, JMLR, ACL és EMNLP konferenciákon.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoAiStream. Web3 adatintelligencia. Felerősített tudás. Hozzáférés itt.
- A jövő pénzverése – Adryenn Ashley. Hozzáférés itt.
- Részvények vásárlása és eladása PRE-IPO társaságokban a PREIPO® segítségével. Hozzáférés itt.
- Forrás: https://aws.amazon.com/blogs/machine-learning/perform-batch-transforms-with-amazon-sagemaker-jumpstart-text2text-generation-large-language-models/
- :van
- :is
- :nem
- :ahol
- $ UP
- 000
- 1
- 10
- 100
- 11
- 13
- 14
- 20
- 2014
- 50
- 7
- 8
- 9
- a
- Képes
- Rólunk
- felett
- elfogadás
- elfogadott
- hozzáférés
- Szerint
- Fiókok
- Elérése
- Felvásárolja
- át
- cselekvések
- aktív
- fejlett
- előnyös
- ellen
- AI
- AI / ML
- Támogatás
- algoritmusok
- Minden termék
- állítólagos
- lehetővé teszi, hogy
- Is
- amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Az Amazon Web Services
- an
- elemzés
- és a
- bejelent
- bármilyen
- api
- alkalmazott
- megközelítés
- VANNAK
- körül
- cikkben
- cikkek
- AS
- At
- Kísérletek
- hatóság
- Automatikus
- automatikusan
- elérhető
- elkerülése érdekében
- AWS
- Egyenleg
- bázis
- alapján
- BE
- lett
- mert
- válik
- előtt
- hogy
- Hisz
- úgy gondolja,
- Benjámin
- Jobb
- között
- test
- mindkét
- Mindkét oldal
- határait
- tömören
- hoz
- Bring
- beépített
- üzleti
- de
- by
- hívás
- TUD
- nem tud
- esetek
- Okoz
- díjak
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- osztály
- vásárló
- közelebb
- CNN
- kód
- össze
- kombájnok
- kombinálása
- hogyan
- kötelezettségvállalások
- elkötelezett
- Közös
- összehasonlítani
- teljes
- Kiszámít
- számítógép
- Számítógépes látás
- koncepció
- Magatartás
- konferenciák
- Konténer
- folytatódik
- folyamatos
- hozzájárultak
- Költség
- költséghatékony
- tudott
- tanács
- kontraproduktív
- országok
- Bíróság
- teremt
- létrehozása
- Crimes
- Bűnügyi
- dátum
- adatbevitel
- adatkészletek
- halott
- döntés
- alapértelmezett
- Delhi
- bizonyítani
- igazolták
- osztály
- attól
- telepíteni
- bevetés
- leírt
- Határozzuk meg
- Fejleszt
- Fejlesztés
- különbözik
- különbségek
- különböző
- közvetlen
- számos
- do
- Dokkmunkás
- domain
- csinált
- ne
- Által
- le-
- időtartama
- alatt
- minden
- Korábban
- Keleti
- könnyű
- Gazdasági
- hatékony
- erőfeszítések
- választható
- lehetővé téve
- végén
- Endpoint
- mérnök
- biztosítására
- belép
- belépés
- Környezet
- Ez volt
- etikai
- értékelni
- értékelő
- értékelés
- Még
- bizonyíték
- példa
- példák
- Kivéve
- izgatott
- végrehajtás
- tapasztalat
- kivonat
- Arc
- hit
- család
- kevés
- filé
- Fájlok
- vezetéknév
- következő
- A
- Kényszer
- külföldi
- hivatalos
- Formálisan
- formátum
- Előre
- alapító
- ból ből
- Tele
- további
- jövő
- generáció
- generátor
- kap
- ad
- Go
- Célok
- A kormányok
- GPU
- nagyobb
- Földi
- Csoport
- hardver
- Legyen
- he
- segít
- segít
- neki
- itt
- Magas
- kiemeli
- övé
- házigazdája
- Hogyan
- How To
- azonban
- HTML
- http
- HTTPS
- HuggingFace
- emberi
- emberi jogok
- Emberiség
- ID
- ids
- if
- Illinois
- kép
- azonnal
- végrehajtási
- importál
- javul
- in
- tartalmaz
- Beleértve
- Növelje
- függetlenség
- egyéni
- Egyénileg
- információ
- Infrastruktúra
- kezdetben
- igazságtalanság
- bemenet
- bemenet
- vizsgálat
- példa
- helyette
- Intézet
- Nemzetközi
- értelmezés
- bele
- vizsgálja
- vizsgálat
- Laboratóriumi vizsgálatok eredményei
- Izrael
- IT
- ITS
- január
- Munka
- csatlakozik
- csatlakozott
- jpg
- json
- bíró
- június
- igazságszolgáltatás
- éppen
- Igazság
- Kulcs
- Ismer
- leszállási
- nyelv
- nagy
- keresztnév
- Késleltetés
- a későbbiekben
- elindítja
- tanulás
- balra
- hadd
- könnyen
- mint
- Kedvencek
- vonal
- vonalak
- összekapcsolt
- Összekapcsolása
- Lista
- Kihallgatás
- kiszámításának
- Hosszú
- hosszabb
- Elő/Utó
- gép
- gépi tanulás
- csinál
- Gyártás
- kezeli
- mód
- sok
- megjelölt
- párosított
- egyező
- matematikai
- Lehet..
- eszközök
- tag
- Partnerek
- tagság
- Memory design
- módszer
- Metrics
- minimalizálása
- ML
- Mód
- modell
- modellek
- Hónap
- több
- mozog
- zene
- kell
- név
- Természetes
- Természetes nyelvi feldolgozás
- elengedhetetlen
- Szükség
- tárgyalások
- Se
- Hollandia
- hálózatba
- Új
- hír
- sajtóközlemény
- jegyzetfüzet
- Most
- tárgy
- megszerzése
- of
- Office
- Hivatalosan
- on
- ONE
- csak
- nyitva
- nyílt forráskódú
- nyitott
- engedélyezi
- ellentétes
- or
- eredeti
- OS
- mi
- ki
- teljesítmény
- felett
- csomag
- oldal
- Palesztina
- papírok
- paraméter
- paraméterek
- rész
- párt
- elhalad
- ösvény
- útburkoló
- béke
- Emberek (People)
- Teljesít
- engedélyek
- Plató
- Platón adatintelligencia
- PlatoData
- kérem
- pont
- lehetséges
- állás
- előre
- jósolt
- előrejelzés
- Tippek
- Predictor
- előnyben részesített
- Készít
- előkészített
- előfeltételek
- elnök
- nyomás
- Első
- miniszterelnök
- Fő
- Probléma
- problémák
- folyamat
- Folyamatok
- feldolgozás
- Készült
- jólét
- ad
- feltéve,
- biztosít
- amely
- közzétett
- célokra
- Piton
- hatótávolság
- kész
- igazi
- real-time
- rekord
- nyilvántartások
- referenciák
- kifejezés
- engedje
- eltávolított
- TÖBBSZÖR
- jelentést
- kérni
- kéri
- szükség
- kötelező
- követelmények
- kutató
- Tudástár
- válasz
- válaszok
- felelősség
- felelős
- eredményez
- Eredmények
- visszatérés
- Visszatér
- Kritika
- jogok
- Szerep
- Róma
- SOR
- futás
- s
- sagemaker
- SageMaker következtetés
- Mondott
- azonos
- mondás
- forgatókönyvek
- TUDOMÁNYOK
- Tudós
- pontszám
- sdk
- lát
- keres
- kiválasztott
- küld
- idősebb
- Series of
- Szolgáltatások
- készlet
- beállítás
- felépítés
- megosztott
- ő
- kellene
- előadás
- kirakat
- Műsorok
- Sides
- aláírt
- Hasonlóképpen
- Egyszerű
- óta
- helyzet
- helyzetek
- Méret
- kicsi
- So
- Közösség
- Társadalom
- szoftver
- megoldások
- Megoldások
- néhány
- beszél
- beszélő
- Költési
- kezdet
- kezdődött
- Állami
- Állami Minisztérium
- csúcs-
- nyilatkozat
- Államok
- statisztikai
- Lépés
- Lépései
- Még mindig
- megállt
- tárolás
- tárolni
- memorizált
- egyértelmű
- Stratégiai
- folyam
- folyó
- erősen
- tárgy
- összegez
- ÖSSZEFOGLALÓ
- nyár
- támogatás
- Vesz
- meghozott
- tart
- Feladat
- feladatok
- tech
- sablonok
- területek
- terület
- teszt
- mint
- hogy
- A
- az információ
- Hollandia
- Az állam
- a világ
- azok
- Őket
- akkor
- ebből adódóan
- Ezek
- ők
- ezt
- azok
- Keresztül
- áteresztőképesség
- idő
- Idősorok
- nak nek
- Ma
- együtt
- szakadt
- felé
- Vonat
- Átalakítás
- transzformátor
- transzformáció
- Fordítás
- igaz
- igazság
- típus
- típusok
- Undermine
- Egyesült
- Egyesült Államok
- Egyetemes
- egyetemi
- nem úgy mint
- Feltöltés
- upon
- us
- használ
- használt
- segítségével
- Alelnök
- látomás
- kötetek
- W
- akar
- háború
- volt
- Nézz
- Út..
- we
- háló
- webes szolgáltatások
- Szerda
- fogadtatás
- üdvözölte
- JÓL
- Mit
- amikor
- vajon
- ami
- míg
- WHO
- széles
- Széleskörű
- lesz
- val vel
- belül
- nélkül
- dolgozó
- világ
- lenne
- te
- A te
- zephyrnet