Vandaag zijn we verheugd aan te kondigen dat u nu batchtransformaties kunt uitvoeren met Amazon SageMaker JumpStart grote taalmodellen (LLM's) voor Text2Text Generation. Batchtransformaties zijn handig in situaties waarin de antwoorden niet in realtime hoeven te zijn en daarom kunt u in grote hoeveelheden inferentie in batch uitvoeren voor grote datasets. Voor batchtransformatie wordt een batchtaak uitgevoerd die batchinvoer als gegevensset en een vooraf getraind model gebruikt en voorspellingen uitvoert voor elk gegevenspunt in de gegevensset. Batchtransformatie is kosteneffectief omdat, in tegenstelling tot real-time gehoste eindpunten met permanente hardware, batchtransformatieclusters worden afgebroken wanneer de taak is voltooid en daarom wordt de hardware alleen gebruikt voor de duur van de batchtaak.
In sommige gebruikssituaties kunnen real-time inferentieverzoeken worden gegroepeerd in kleine batches voor batchverwerking om real-time of bijna real-time antwoorden te creëren. Als u bijvoorbeeld een continue gegevensstroom moet verwerken met een lage latentie en een hoge doorvoer, zou het aanroepen van een real-time eindpunt voor elk afzonderlijk verzoek meer middelen vereisen en kan het langer duren om alle verzoeken te verwerken omdat de verwerking serieel wordt uitgevoerd . Een betere benadering zou zijn om enkele verzoeken te groeperen en het real-time eindpunt aan te roepen in batch-inferentiemodus, die uw verzoeken verwerkt in één voorwaartse doorgang van het model en het bulkantwoord voor het verzoek in realtime of bijna realtime retourneert . De latentie van het antwoord is afhankelijk van het aantal verzoeken dat u groepeert en de geheugengrootte van de instantie. Daarom kunt u de batchgrootte afstemmen op uw zakelijke vereisten voor latentie en doorvoer. Wij noemen dit real-time batch-inferentie omdat het het concept van batching combineert en toch real-time reacties levert. Met real-time batch-inferentie kunt u een balans bereiken tussen lage latentie en hoge doorvoer, waardoor u grote hoeveelheden gegevens tijdig en efficiënt kunt verwerken.
Met Jumpstart-batchtransformatie voor Text2Text Generation-modellen kunt u de batch-hyperparameters doorgeven via omgevingsvariabelen die de doorvoer verder verhogen en latentie minimaliseren.
JumpStart biedt vooraf getrainde, open-source modellen voor een breed scala aan probleemtypes om u te helpen aan de slag te gaan met machine learning (ML). U kunt deze modellen stapsgewijs trainen en afstemmen voordat u ze implementeert. JumpStart biedt ook oplossingssjablonen voor het opzetten van een infrastructuur voor veelvoorkomende gebruiksscenario's, en uitvoerbare voorbeeldnotebooks voor ML met Amazon Sage Maker. U hebt toegang tot de vooraf getrainde modellen, oplossingssjablonen en voorbeelden via de JumpStart-landingspagina in Amazon SageMaker Studio. U kunt ook toegang krijgen tot JumpStart-modellen met behulp van de SageMaker Python SDK.
In dit bericht laten we zien hoe u de state-of-the-art pre-train gebruikt text2text FLAN T5-modellen van Hugging Face voor batchtransformatie en real-time batchinferentie.
Overzicht oplossingen
De notebook met batchtransformatie van vooraf getrainde Text2Text FLAN T5-modellen van Gezicht knuffelen beschikbaar in het volgende GitHub-repository. Dit notitieboek gebruikt gegevens van het knuffelende gezicht cnn_dagelijksemail dataset voor een tekstsamenvattingstaak met behulp van de SageMaker SDK.
Hieronder volgen de belangrijkste stappen voor het implementeren van batchtransformatie en real-time batchinferentie:
- Stel voorwaarden in.
- Selecteer een vooraf getraind model.
- Artefacten voor het model ophalen.
- Geef de hyperparameters van de batchtransformatietaak op.
- Bereid gegevens voor op de batchtransformatie.
- Voer de batchtransformatietaak uit.
- Evalueer de samenvatting met a ROOD (Recall-Oriented Understudy for Gisting Evaluation) score.
- Voer real-time batch-inferentie uit.
Vereisten instellen
Voordat u de notebook uitvoert, moet u enkele eerste installatiestappen uitvoeren. Laten we de uitvoeringsrol van SageMaker zo instellen dat deze machtigingen heeft om namens u AWS-services uit te voeren:
Selecteer een vooraf getraind model
We gebruiken het knuffelgezicht-tekst2tekst-vlaai-t5-groot model als standaardmodel. Optioneel kunt u de lijst met beschikbare Text2Text-modellen ophalen op JumpStart en uw voorkeursmodel kiezen. Deze methode biedt een eenvoudige manier om verschillende model-ID's te selecteren met dezelfde notebook. Voor demonstratiedoeleinden gebruiken we het knuffelgezicht-tekst2tekst-vlaai-t5-groot model:
Artefacten voor het model ophalen
Met SageMaker kunnen we gevolgtrekkingen maken op het vooraf getrainde model, zelfs zonder het eerst te verfijnen op een nieuwe dataset. We beginnen met het ophalen van de deploy_image_uri
, deploy_source_uri
en model_uri
voor het vooraf getrainde model:
Geef de hyperparameters van de batchtransformatietaak op
U kunt elke subset van hyperparameters als omgevingsvariabelen doorgeven aan de batchtransformatietaak. U kunt deze hyperparameters ook doorgeven in een JSON-payload. Als u echter omgevingsvariabelen instelt voor hyperparameters, zoals de volgende code laat zien, worden de geavanceerde hyperparameters van de afzonderlijke voorbeelden in de payload van JSON-regels niet gebruikt. Als u hyperparameters van de payload wilt gebruiken, kunt u het hyper_params_dict
parameter als null in plaats daarvan.
Gegevens voorbereiden voor batchtransformatie
Nu zijn we klaar om de cnn_dagelijksemail dataset van Hugging Face:
We nemen elke gegevensinvoer door en creëren de invoergegevens in het vereiste formaat. Wij creëren een articles.jsonl
bestand als een testgegevensbestand met artikelen die moeten worden samengevat als invoerpayload. Terwijl we dit bestand maken, voegen we de prompt toe "Briefly summarize this text:"
aan elke testinvoerrij. Als u voor elke testinvoer verschillende hyperparameters wilt hebben, kunt u die hyperparameters toevoegen als onderdeel van het maken van de dataset.
We creëren highlights.jsonl
als het Ground Truth-bestand met hoogtepunten van elk artikel dat in het testbestand is opgeslagen articles.jsonl
. We slaan beide testbestanden op in een Amazon eenvoudige opslagservice (Amazon S3) emmer. Zie de volgende code:
Voer de batchtransformatietaak uit
Wanneer u een batchtransformatietaak start, start SageMaker de benodigde rekenbronnen om de gegevens te verwerken, inclusief CPU- of GPU-instanties, afhankelijk van het geselecteerde instantietype. Tijdens de batchtransformatie levert en beheert SageMaker automatisch de rekenbronnen die nodig zijn om de gegevens te verwerken, inclusief instanties, opslag en netwerkbronnen. Wanneer de batchtransformatietaak is voltooid, worden de rekenbronnen automatisch opgeschoond door SageMaker. Dit betekent dat de instanties en opslag die tijdens de taak worden gebruikt, worden gestopt en verwijderd, waardoor resources worden vrijgemaakt en de kosten worden geminimaliseerd. Zie de volgende code:
Het volgende is een voorbeeldrecord uit de articles.jsonl
test bestand. Merk op dat het record in dit bestand een ID heeft die overeenkomt met predict.jsonl
bestandsrecords die een samengevat record tonen als uitvoer van het Hugging Face Text2Text-model. Evenzo heeft het Ground Truth-bestand ook een overeenkomende ID voor het gegevensrecord. De overeenkomende ID in het testbestand, het Ground Truth-bestand en het uitvoerbestand maakt het mogelijk invoerrecords te koppelen aan uitvoerrecords voor eenvoudige interpretatie van de resultaten.
Het volgende is het voorbeeld van een invoerrecord voor samenvatting:
Het volgende is de voorspelde uitvoer met samenvatting:
Het volgende is de samenvatting van de grondwaarheid voor modelevaluatiedoeleinden:
Vervolgens gebruiken we de grondwaarheid en voorspelde outputs voor modelevaluatie.
Evalueer het model met behulp van een ROUGE-score¶
ROOD, of Recall-Oriented Understudy for Gisting Evaluation, is een set metrieken en een softwarepakket dat wordt gebruikt voor het evalueren van automatische samenvatting en automatische vertaling bij natuurlijke taalverwerking. De statistieken vergelijken een automatisch geproduceerde samenvatting of vertaling met een referentie (door mensen geproduceerde) samenvatting of vertaling of een reeks referenties.
In de volgende code combineren we de voorspelde en originele samenvattingen door ze samen te voegen op de gemeenschappelijke sleutel id
en gebruik dit om de ROUGE-score te berekenen:
Voer real-time batch-inferentie uit
Vervolgens laten we u zien hoe u real-time batchgevolgtrekking op het eindpunt kunt uitvoeren door de invoer als een lijst op te geven. We gebruiken dezelfde model-ID en dataset als eerder, behalve dat we een paar records uit de testdataset nemen en deze gebruiken om een real-time eindpunt aan te roepen.
De volgende code laat zien hoe u een real-time eindpunt maakt en implementeert voor real-time batch-inferentie:
Vervolgens bereiden we onze input-payload voor. Hiervoor gebruiken we de gegevens die we eerder hebben voorbereid en extraheren we de eerste 10 testinvoer en voegen we de tekstinvoer toe met hyperparameters die we willen gebruiken. We leveren deze payload aan de real-time invoke_endpoint
. De payload van het antwoord wordt vervolgens geretourneerd als een lijst met antwoorden. Zie de volgende code:
Opruimen
Nadat u het eindpunt hebt getest, moet u ervoor zorgen dat u het SageMaker-inferentie-eindpunt en het model verwijdert om te voorkomen dat er kosten in rekening worden gebracht.
Conclusie
In dit notitieboek hebben we een batchtransformatie uitgevoerd om het Hugging Face Text2Text Generator-model voor samenvattingstaken te demonstreren. Batchtransformatie is voordelig bij het verkrijgen van gevolgtrekkingen uit grote datasets zonder dat een persistent eindpunt vereist is. We hebben invoerrecords gekoppeld aan gevolgtrekkingen om te helpen bij de interpretatie van resultaten. We hebben de ROUGE-score gebruikt om de samenvatting van de testgegevens te vergelijken met de door het model gegenereerde samenvatting.
Daarnaast hebben we realtime batch-inferentie gedemonstreerd, waarbij u een kleine batch gegevens naar een real-time eindpunt kunt sturen om een evenwicht te bereiken tussen latentie en doorvoer voor scenario's zoals het streamen van invoergegevens. Realtime batch-inferentie helpt de verwerkingscapaciteit van realtime verzoeken te verhogen.
Probeer vandaag nog de batchtransformatie uit met Text2Text Generation-modellen in SageMaker en laat ons uw feedback weten!
Over de auteurs
Heman Singh is een Machine Learning Engineer met ervaring in Amazon SageMaker JumpStart en Amazon SageMaker ingebouwde algoritmen. Hij behaalde zijn masters aan het Courant Institute of Mathematical Sciences en B.Tech aan IIT Delhi. Hij heeft ervaring met het werken aan uiteenlopende machine learning-problemen binnen het domein van natuurlijke taalverwerking, computervisie en tijdreeksanalyse.
Rachna Chadha is een Principal Solutions Architect AI/ML in Strategic Accounts bij AWS. Rachna is een optimist die gelooft dat het ethische en verantwoorde gebruik van AI de samenleving in de toekomst kan verbeteren en economische en sociale welvaart kan brengen. In haar vrije tijd brengt Rachna graag tijd door met haar gezin, wandelen en naar muziek luisteren.
Dr Ashish Khetan is een Senior Applied Scientist met ingebouwde algoritmen van Amazon SageMaker en helpt bij het ontwikkelen van algoritmen voor machine learning. Hij promoveerde aan de Universiteit van Illinois in Urbana-Champaign. Hij is een actief onderzoeker op het gebied van machine learning en statistische inferentie, en heeft veel artikelen gepubliceerd op NeurIPS-, ICML-, ICLR-, JMLR-, ACL- en EMNLP-conferenties.
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoAiStream. Web3 gegevensintelligentie. Kennis versterkt. Toegang hier.
- De toekomst slaan met Adryenn Ashley. Toegang hier.
- Koop en verkoop aandelen in PRE-IPO-bedrijven met PREIPO®. Toegang hier.
- Bron: https://aws.amazon.com/blogs/machine-learning/perform-batch-transforms-with-amazon-sagemaker-jumpstart-text2text-generation-large-language-models/
- : heeft
- :is
- :niet
- :waar
- $UP
- 000
- 1
- 10
- 100
- 11
- 13
- 14
- 20
- 2014
- 50
- 7
- 8
- 9
- a
- in staat
- Over
- boven
- acceptatie
- aanvaard
- toegang
- Volgens
- accounts
- Bereiken
- Koopt
- over
- acties
- actieve
- vergevorderd
- voordelig
- tegen
- AI
- AI / ML
- Steun
- algoritmen
- Alles
- vermeende
- toestaat
- ook
- Amazone
- Amazon Sage Maker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- analyse
- en
- aankondigen
- elke
- api
- toegepast
- nadering
- ZIJN
- rond
- dit artikel
- artikelen
- AS
- At
- pogingen
- autoriteit
- Automatisch
- webmaster.
- Beschikbaar
- vermijd
- AWS
- Balance
- baseren
- gebaseerde
- BE
- werd
- omdat
- wordt
- vaardigheden
- wezen
- geloofd wie en wat je bent
- gelooft
- Benjamin
- Betere
- tussen
- lichaam
- zowel
- Beide kanten
- grenzen
- kort
- brengen
- Brengt
- ingebouwd
- bedrijfsdeskundigen
- maar
- by
- Bellen
- CAN
- kan niet
- gevallen
- Veroorzaken
- lasten
- Kies
- klasse
- klant
- dichterbij
- CNN
- code
- combineren
- combines
- combineren
- hoe
- verplichtingen
- toegewijd
- Gemeen
- vergelijken
- compleet
- Berekenen
- computer
- Computer visie
- concept
- Gedrag
- conferenties
- Containers
- voortzetten
- doorlopend
- bijgedragen
- Kosten
- kostenefficient
- kon
- raad
- averechts
- landen
- Rechtbank
- en je merk te creëren
- Wij creëren
- misdaden
- Crimineel
- gegevens
- gegevensinvoer
- datasets
- dood
- beslissing
- Standaard
- Delhi
- tonen
- gedemonstreerd
- afdeling
- Afhankelijk
- implementeren
- inzet
- beschreven
- Bepalen
- ontwikkelen
- Ontwikkeling
- verschillen
- verschillen
- anders
- directe
- diversen
- do
- havenarbeider
- domein
- gedaan
- Dont
- Deur
- beneden
- duur
- gedurende
- elk
- Vroeger
- oosten
- En het is heel gemakkelijk
- Economisch
- doeltreffend
- inspanningen
- geschikt
- waardoor
- einde
- Endpoint
- ingenieur
- verzekeren
- Komt binnen
- toegang
- Milieu
- Tijdperk
- ethisch
- schatten
- evalueren
- evaluatie
- Zelfs
- bewijzen
- voorbeeld
- voorbeelden
- Behalve
- opgewonden
- uitvoering
- ervaring
- extract
- Gezicht
- geloof
- familie
- weinig
- Dien in
- Bestanden
- Voornaam*
- volgend
- Voor
- Dwingen
- vreemd
- formeel
- Formeel
- formaat
- Naar voren
- oprichten
- oppompen van
- vol
- verder
- toekomst
- generatie
- generator
- krijgen
- geeft
- Go
- Doelen
- overheden
- GPU
- meer
- Ground
- Groep
- Hardware
- Hebben
- he
- hulp
- helpt
- haar
- hier
- Hoge
- highlights
- zijn
- gehost
- Hoe
- How To
- Echter
- HTML
- http
- HTTPS
- KnuffelenGezicht
- menselijk
- rechten van de mens
- Mensheid
- ID
- ids
- if
- Illinois
- beeld
- per direct
- uitvoering
- importeren
- verbeteren
- in
- omvatten
- Inclusief
- Laat uw omzet
- onafhankelijkheid
- individueel
- individueel
- informatie
- Infrastructuur
- eerste
- onrecht
- invoer
- ingangen
- onderzoek
- instantie
- verkrijgen in plaats daarvan
- Instituut
- Internationale
- interpretatie
- in
- onderzoeken
- onderzoek
- onderzoeken
- Israël
- IT
- HAAR
- Januari
- Jobomschrijving:
- mee
- aansluiting
- jpg
- json
- rechter
- juni
- jurisdictie
- voor slechts
- gerechtigheid
- sleutel
- blijven
- landing
- taal
- Groot
- Achternaam*
- Wachttijd
- later
- lanceert
- leren
- links
- laten
- licht
- als
- sympathieën
- Lijn
- lijnen
- gekoppeld
- Koppeling
- Lijst
- Het luisteren
- laden
- lang
- langer
- Laag
- machine
- machine learning
- maken
- maken
- beheert
- manier
- veel
- gemarkeerd
- op elkaar afgestemd
- matching
- wiskundig
- Mei..
- middel
- lid
- Leden
- lidmaatschap
- Geheugen
- methode
- Metriek
- minimaliseren
- ML
- Mode
- model
- modellen
- Maand
- meer
- beweging
- Muziek
- Dan moet je
- naam
- Naturel
- Natural Language Processing
- noodzakelijk
- Noodzaak
- onderhandelingen
- Noch
- Nederland
- netwerken
- New
- nieuws
- persbericht
- notitieboekje
- nu
- object
- het verkrijgen van
- of
- Kantoor
- Officieel
- on
- EEN
- Slechts
- open
- open source
- geopend
- zich verzetten tegen
- gekant tegen
- or
- origineel
- OS
- onze
- uit
- uitgang
- over
- pakket
- pagina
- Palestina
- papieren
- parameter
- parameters
- deel
- feest
- passeren
- pad
- Bestrating
- vrede te brengen.
- Mensen
- Uitvoeren
- permissies
- Plato
- Plato gegevensintelligentie
- PlatoData
- dan
- punt
- mogelijk
- Post
- voorspellen
- voorspeld
- voorspelling
- Voorspellingen
- predictor
- bij voorkeur
- Voorbereiden
- bereid
- vereisten
- president
- druk
- Prime
- premier
- Principal
- probleem
- problemen
- processen
- verwerking
- geproduceerd
- welvaart
- zorgen voor
- mits
- biedt
- het verstrekken van
- gepubliceerde
- doeleinden
- Python
- reeks
- klaar
- vast
- real-time
- record
- archief
- referenties
- verwijst
- los
- verwijderd
- HERHAALDELIJK
- verslag
- te vragen
- verzoeken
- vereisen
- nodig
- Voorwaarden
- onderzoeker
- Resources
- antwoord
- reacties
- verantwoordelijkheden
- verantwoordelijk
- resultaat
- Resultaten
- terugkeer
- Retourneren
- beoordelen
- rechten
- Rol
- Rome
- RIJ
- lopen
- s
- sagemaker
- SageMaker Inferentie
- Zei
- dezelfde
- gezegde
- scenario's
- WETENSCHAPPEN
- Wetenschapper
- partituur
- sdk
- zien
- op zoek naar
- gekozen
- sturen
- senior
- -Series
- Diensten
- reeks
- het instellen van
- setup
- gedeeld
- ze
- moet
- tonen
- showcase
- Shows
- Sides
- Gesigneerd
- evenzo
- Eenvoudig
- sinds
- situatie
- situaties
- Maat
- Klein
- So
- Social
- Maatschappij
- Software
- oplossing
- Oplossingen
- sommige
- spreken
- spreken
- Uitgaven
- begin
- gestart
- Land
- Ministerie van Buitenlandse Zaken
- state-of-the-art
- Statement
- Staten
- statistisch
- Stap voor
- Stappen
- Still
- gestopt
- mediaopslag
- shop
- opgeslagen
- eenvoudig
- strategisch
- stream
- streaming
- sterk
- onderwerpen
- samenvatten
- OVERZICHT
- zomer
- ondersteuning
- Nemen
- ingenomen
- neemt
- Taak
- taken
- tech
- templates
- territoria
- grondgebied
- proef
- neem contact
- dat
- De
- de informatie
- de Nederland
- De Staat
- de wereld
- hun
- Ze
- harte
- daarom
- Deze
- ze
- dit
- die
- Door
- doorvoer
- niet de tijd of
- Tijdreeksen
- naar
- vandaag
- samen
- gescheurd
- in de richting van
- Trainen
- Transformeren
- transformator
- transformaties
- Vertaling
- waar
- waarheid
- type dan:
- types
- Ondermijnen
- United
- Verenigde Staten
- Universeel
- universiteit-
- anders
- Uploaden
- op
- us
- .
- gebruikt
- gebruik
- Vice President
- visie
- volumes
- W
- willen
- oorlog
- was
- Bekijk de introductievideo
- Manier..
- we
- web
- webservices
- woensdag
- welkom
- verwelkomd
- GOED
- Wat
- wanneer
- of
- welke
- en
- WIE
- breed
- Grote range
- wil
- Met
- binnen
- zonder
- werkzaam
- wereld
- zou
- You
- Your
- zephyrnet