Automatiser utplasseringen av en Amazon-prognosemodell for tidsserier

Publisert av Platon

Følgere: 0

Tidsserieprognoser refererer til prosessen med å forutsi fremtidige verdier av tidsseriedata (data som samles inn med jevne mellomrom over tid). Enkle metoder for tidsserieprognoser bruker historiske verdier for samme variabel hvis fremtidige verdier må forutsies, mens mer komplekse, maskinlæringsbaserte (ML)-baserte metoder bruker tilleggsinformasjon, for eksempel tidsseriedata for relaterte variabler.

Amazon Prognose er en ML-basert tidsserieprognosetjeneste som inkluderer algoritmer som er basert på over 20 års prognoseerfaring brukt av Amazon.com, som bringer den samme teknologien som brukes hos Amazon til utviklere som en fullstendig administrert tjeneste, noe som fjerner behovet for å administrere ressurser. Forecast bruker ML for å lære ikke bare den beste algoritmen for hvert element, men også det beste ensemblet av algoritmer for hvert element, og skaper automatisk den beste modellen for dataene dine.

Dette innlegget beskriver hvordan du distribuerer tilbakevendende prognosearbeidsbelastninger (tidsserieberegningsarbeidsbelastninger) uten kode ved å bruke AWS skyformasjon, AWS trinnfunksjonerog AWS systemansvarlig. Metoden som presenteres her hjelper deg med å bygge en pipeline som lar deg bruke den samme arbeidsflyten fra den første dagen av tidsseriens prognoseeksperimentering og utrulling av modellen i produksjon.

Tidsserieprognoser ved hjelp av Forecast

Arbeidsflyten for Forecast involverer følgende vanlige konsepter:

Importerer datasett – I Forecast, en datasettgruppe er en samling av datasett, skjemaer og prognoseresultater som går sammen. Hver datasettgruppe kan ha opptil tre datasett, ett av hvert datasett type: måltidsserier (TTS), relaterte tidsserier (RTS) og varemetadata. Et datasett er en samling filer som inneholder data som er relevante for en prognoseoppgave. Et datasett må samsvare med skjemaet som er definert i Forecast. For flere detaljer, se Importerer datasett.
Treningsprediktorer - A prediktor er en prognosetrent modell som brukes til å lage prognoser basert på tidsseriedata. Under trening beregner Forecast nøyaktighetsmålinger som du bruker til å evaluere prediktoren og bestemme om du vil bruke prediktoren til å generere en prognose. For mer informasjon, se Treningsprediktorer.
Generer prognoser – Du kan deretter bruke den trente modellen for å generere prognoser for en fremtidig tidshorisont, kjent som prognosehorisont. Forecast gir prognoser for ulike spesifiserte kvantiler. For eksempel vil en prognose ved 0.90-kvantilen estimere en verdi som er lavere enn den observerte verdien 90 % av tiden. Som standard bruker Forecast følgende verdier for prediktorprognosetypene: 0.1 (P10), 0.5 (P50) og 0.9 (P90). Prognoser ved forskjellige kvantiler brukes vanligvis for å gi et prediksjonsintervall (en øvre og nedre grense for prognoser) for å ta høyde for prognoseusikkerhet.

Du kan implementere denne arbeidsflyten i Forecast enten fra AWS-administrasjonskonsollden AWS kommandolinjegrensesnitt (AWS CLI), via API-kall ved hjelp av Python-notatbøker, eller via automatiseringsløsninger. De trøste og AWS CLI metodene er best egnet for rask eksperimentering for å sjekke gjennomførbarheten av tidsserieprognoser ved å bruke dataene dine. Python-notebook-metoden er flott for dataforskere som allerede er kjent med Jupyter-notatbøker og koding, og gir maksimal kontroll og tuning. Den bærbare metoden er imidlertid vanskelig å operasjonalisere. Vår automatiseringstilnærming letter rask eksperimentering, eliminerer repeterende oppgaver og tillater enklere overgang mellom ulike miljøer (utvikling, iscenesettelse, produksjon).

I dette innlegget beskriver vi en automatiseringstilnærming til bruk av Forecast som lar deg bruke dine egne data og gir en enkelt arbeidsflyt som du kan bruke sømløst gjennom hele livssyklusen til utviklingen av prognoseløsningen din, fra de første dagene med eksperimentering og gjennom distribusjonen av løsningen i ditt produksjonsmiljø.

Løsningsoversikt

I de følgende delene beskriver vi en komplett ende-til-ende arbeidsflyt som fungerer som en mal å følge for automatisert distribusjon av tidsserieprognosemodeller ved hjelp av Forecast. Denne arbeidsflyten oppretter prognostiserte datapunkter fra et åpen kildekodedatasett; Du kan imidlertid bruke samme arbeidsflyt for dine egne data, så lenge du kan formatere dataene dine i henhold til trinnene som er skissert i dette innlegget. Etter at du har lastet opp dataene, leder vi deg gjennom trinnene for å lage prognosedatasettgrupper, importere data, trene ML-modeller og produsere prognosedatapunkter for fremtidige usynlige tidshorisonter fra rådata. Alt dette er mulig uten å måtte skrive eller kompilere kode.

Følgende diagram illustrerer prognosearbeidsflyten.

Arbeidsflyt for syklisk prognose

Løsningen distribueres ved hjelp av to CloudFormation-maler: avhengighetsmalen og arbeidsbelastningsmalen. CloudFormation lar deg utføre AWS-infrastrukturdistribusjoner forutsigbart og gjentatte ganger ved å bruke maler som beskriver ressursene som skal distribueres. En utplassert mal omtales som en stable. Vi har tatt oss av å definere infrastrukturen i løsningen for deg i de to medfølgende malene. Avhengighetsmalen definerer forutsetningsressurser som brukes av arbeidsbelastningsmalen, for eksempel en Amazon enkel lagringstjeneste (Amazon S3) bøtte for gjenstandslagring og AWS identitets- og tilgangsadministrasjon (IAM) tillatelser for AWS API-handlinger. Ressursene definert i avhengighetsmalen kan deles av flere arbeidsbelastningsmaler. Arbeidsbelastningsmalen definerer ressursene som brukes til å innta data, trene en prediktor og generere en prognose.

Arbeidsflyt for distribusjon

Distribuer avhengighetsmalen CloudFormation

Først, la oss distribuere avhengighetsmalen for å lage våre forutsetningsressurser. Avhengighetsmalen distribuerer en valgfri S3-bøtte, AWS Lambda funksjoner og IAM-roller. Amazon S3 er en rimelig, svært tilgjengelig, spenstig objektlagringstjeneste. Vi bruker en S3-bøtte i denne løsningen for å lagre kildedata og utløse arbeidsflyten, noe som resulterer i en prognose. Lambda er en serverløs, hendelsesdrevet databehandlingstjeneste som lar deg kjøre kode uten å klargjøre eller administrere servere. Avhengighetsmalen inkluderer funksjoner for å gjøre ting som å lage en datasettgruppe i Forecast og tømme objekter i en S3-bøtte før du sletter bøtten. IAM-roller definerer tillatelser innenfor AWS for brukere og tjenester. Avhengighetsmalen distribuerer en rolle som skal brukes av Lambda og en annen for Step Functions, en arbeidsflytadministrasjonstjeneste som vil koordinere oppgavene med datainntak og prosessering, samt prediktortrening og inferens ved bruk av Forecast.

Fullfør følgende trinn for å distribuere avhengighetsmalen:

På konsollen velger du ønsket Region støttet av Forecast for løsningsdistribusjon.
Velg på AWS CloudFormation-konsollen Stabler i navigasjonsruten.
Velg Lag stabel Og velg Med nye ressurser (standard).
Til Malkilde, plukke ut Amazon S3 URL.
Skriv inn malens URL: https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-dependency.yaml.
Velg neste.
Til Stabelnavn, Tast inn forecast-mlops-dependency.
Under parametere, velg å bruke en eksisterende S3-bøtte eller opprett en ny, og oppgi deretter navnet på bøtten.
Velg neste.
Velg neste for å godta standard stabelalternativer.
Merk av i avmerkingsboksen for å bekrefte at stabelen oppretter IAM-ressurser, og velg deretter Lag stabel for å distribuere malen.

Du bør se malen distribuere som forecast-mlops-dependency stable. Når status endres til CREATE_COMPLETE, kan du gå til neste trinn.

Distribuer arbeidsbelastningen CloudFormation-malen

La oss deretter distribuere arbeidsbelastningsmalen for å lage våre forutsetningsressurser. Arbeidsbelastningsmalen distribuerer Step Functions-tilstandsmaskiner for arbeidsflytadministrasjon, AWS Systems Manager Parameter Store parametere for å lagre parameterverdier fra AWS CloudFormation og informere arbeidsflyten, en Amazon enkel varslingstjeneste (Amazon SNS) emne for arbeidsflytvarsler, og en IAM-rolle for arbeidsflyttjenestetillatelser.

Løsningen skaper fem tilstandsmaskiner:

CreateDatasetGroupStateMachine – Oppretter en prognose-datasettgruppe for data som skal importeres til.
CreateImportDatasetStateMachine – Importerer kildedata fra Amazon S3 til en datasettgruppe for opplæring.
CreateForecastStateMachine – Håndterer oppgavene som kreves for å trene en prediktor og generere en prognose.
AthenaConnectorStateMachine – Gjør det mulig å skrive SQL-spørringer med Amazonas Athena kobling til landdata i Amazon S3. Dette er en valgfri prosess for å skaffe historiske data i det nødvendige formatet for Forecast ved å bruke Athena i stedet for å plassere filer manuelt i Amazon S3.
StepFunctionWorkflowStateMachine – Koordinater ringer ut til de fire andre statsmaskinene og styrer den overordnede arbeidsflyten.

Parameter Store, en funksjon av Systems Manager, gir sikker, hierarkisk lagring og programmatisk henting av konfigurasjonsdataadministrasjon og hemmelighetsbehandling. Parameterlager brukes til å lagre parametere satt i arbeidsbelastningsstabelen samt andre parametere som brukes av arbeidsflyten.

Fullfør følgende trinn for å distribuere malen for arbeidsbelastning:

Velg på AWS CloudFormation-konsollen Stabler i navigasjonsruten.
Velg Lag stabel Og velg Med nye ressurser (standard).
Til Malkilde, plukke ut Amazon S3 URL.
Skriv inn malens URL: https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-solution-guidance.yaml.
Velg neste.
Til Stabelnavn, skriv inn et navn.
Godta standardverdiene eller endre parameterne.

Sørg for å angi S3-bøttenavnet fra avhengighetsstakken for S3 bøtte og en gyldig e-postadresse for SNEndepunkt selv om du godtar standard parameterverdier.

Tabellen nedenfor beskriver hver parameter.

Parameter	Beskrivelse	Mer informasjon
`DatasetGroupFrequencyRTS`	Frekvensen av datainnsamling for RTS-datasettet.	.
`DatasetGroupFrequencyTTS`	Frekvensen av datainnsamling for TTS-datasettet.	.
`DatasetGroupName`	Et kort navn for datasettgruppen, en selvstendig arbeidsbelastning.	CreateDatasetGroup
`DatasetIncludeItem`	Spesifiser om du vil oppgi varemetadata for denne brukssaken.	.
`DatasetIncludeRTS`	Spesifiser om du vil oppgi en relatert tidsserie for denne brukssaken.	.
`ForecastForecastTypes`	Når en CreateForecast-jobb kjører, deklarerer denne hvilke kvantiler som skal produsere prediksjoner for. Du kan velge opptil fem verdier i denne matrisen. Rediger denne verdien for å inkludere verdier etter behov.	Opprett prognose
`PredictorAttributeConfigs`	For målvariabelen i TTS og hvert numerisk felt i RTS-datasettene må det opprettes en post for hvert tidsintervall for hvert element. Denne konfigurasjonen hjelper deg med å bestemme hvordan manglende poster fylles ut: med 0, NaN eller annet. Vi anbefaler å fylle hullene i TTS med NaN i stedet for 0. Med 0 kan modellen lære feil å fordreie prognoser mot 0. NaN er hvordan veiledningen leveres. Rådfør deg med AWS Solutions Architect hvis du har spørsmål om dette.	Lag AutoPredictor
`PredictorExplainPredictor`	Gyldige verdier er TRUE eller FALSE. Disse bestemmer om forklaring er aktivert for prediktoren din. Dette kan hjelpe deg å forstå hvordan verdier i RTS og varemetadata påvirker modellen.	Forklarbarhet
`PredictorForecastDimensions`	Det kan være lurt å spå med et finere korn enn element. Her kan du spesifisere dimensjoner som plassering, kostnadssted eller hva du måtte ønske. Dette må stemme overens med dimensjonene i RTS og TTS. Merk at hvis du ikke har noen dimensjon, er den riktige parameteren null, alene og med små bokstaver. null er et reservert ord som lar systemet vite at det ikke er noen parameter for dimensjonen.	Lag AutoPredictor
`PredictorForecastFrequency`	Definerer tidsskalaen din modell og spådommer skal genereres på, for eksempel daglig, ukentlig eller månedlig. Rullegardinmenyen hjelper deg med å velge tillatte verdier. Dette må stemme overens med RTS-tidsskalaen din hvis du bruker RTS.	Lag AutoPredictor
`PredictorForecastHorizon`	Antall tidstrinn som modellen forutsier. Prognosehorisonten kalles også prediksjonslengde.	Lag AutoPredictor
`PredictorForecastOptimizationMetric`	Definerer nøyaktighetsmålingen som brukes for å optimalisere prediktoren. Rullegardinmenyen hjelper deg med å velge vektede kvantiltapsaldoer for over- eller underprognoser. RMSE er opptatt av enheter, og WAPE/MAPE er opptatt av prosentfeil.	Lag AutoPredictor
`PredictorForecastTypes`	Når en `CreateAutoPredictor` jobbkjøringer, erklærer dette hvilke kvantiler som brukes til å trene prediksjonspunkter. Du kan velge opptil fem verdier i denne matrisen, slik at du kan balansere over- og underprognoser. Rediger denne verdien for å inkludere verdier etter behov.	Lag AutoPredictor
`S3Bucket`	Navnet på S3-bøtten der inngangsdata og utdata er skrevet for denne arbeidsbelastningen.	.
`SNSEndpoint`	En gyldig e-postadresse for å motta varsler når prediktor- og prognosejobbene er fullført.	.
`SchemaITEM`	Dette definerer den fysiske rekkefølgen, kolonnenavnene og datatypene for varemetadatasettet ditt. Dette er en valgfri fil i løsningseksemplet.	Lag Datasett
`SchemaRTS`	Dette definerer den fysiske rekkefølgen, kolonnenavnene og datatypene for RTS-datasettet ditt. Dimensjonene må stemme overens med din TTS. Tidspunktet til denne filen styrer tidskornet som spådommer kan gjøres ved. Dette er en valgfri fil i løsningseksemplet.	Lag Datasett
`SchemaTTS`	Dette definerer den fysiske rekkefølgen, kolonnenavnene og datatypene for TTS-datasettet ditt, det eneste nødvendige datasettet. Filen må minimum inneholde en målverdi, tidsstempel og element.	Lag Datasett
`TimestampFormatRTS`	Definerer tidsstempelformatet gitt i RTS-filen.	CreateDatasetImportJob
`TimestampFormatTTS`	Definerer tidsstempelformatet i TTS-filen.	CreateDatasetImportJob

Velg neste for å godta standard stabelalternativer.
Merk av i avmerkingsboksen for å bekrefte at stabelen oppretter IAM-ressurser, og velg deretter Lag stabel for å distribuere malen.

Du bør se malen distribuere som stabelnavnet du valgte tidligere. Når status endres til CREATE_COMPLETE, kan du gå til trinnet for opplasting av data.

Last opp dataene

I den forrige delen ga du et stabelnavn og en S3-bøtte. Denne delen beskriver hvordan du deponerer det offentlig tilgjengelige datasettet Matetterspørsel i denne bøtta. Hvis du bruker ditt eget datasett, se datasett å klargjøre datasettet i et format som distribusjonen forventer. Datasettet må inneholde minst måltidsserien, og eventuelt den relaterte tidsserien og elementmetadataene:

TTS er tidsseriedataene som inkluderer feltet du vil generere en prognose for; dette feltet kalles målfelt
RTS er tidsseriedata som ikke inkluderer målfeltet, men inkluderer et relatert felt
Varedatafilen er ikke tidsseriedata, men inkluderer metadatainformasjon om elementene i TTS- eller RTS-datasettene

Fullfør følgende trinn:

Hvis du bruker det medfølgende eksempeldatasettet, last ned datasettet Matetterspørsel til datamaskinen din og pakk ut filen, som lager tre filer i tre kataloger (rts, tts, item).
På Amazon S3-konsollen, naviger til bøtta du opprettet tidligere.
Velg Opprett mappe.
Bruk samme streng som navnet på arbeidsbelastningen for mappenavnet.
Velg Last opp.
Velg de tre datasettmappene, og velg deretter Last opp.

Når opplastingen er fullført, bør du se noe sånt som følgende skjermbilde. For dette eksemplet er mappen vår aiml42. S3 mappestruktur

Opprett en prognose-datasettgruppe

Fullfør trinnene i denne delen for å opprette en datasettgruppe som en engangshendelse for hver arbeidsbelastning. Fremover bør du planlegge å kjøre importdataene, lage prediktorer og lage prognosetrinn etter behov, som en serie, i henhold til timeplanen din, som kan være daglig, ukentlig eller på annen måte.

På Step Functions-konsollen finner du tilstandsmaskinen som inneholder Create-Dataset-Group.
På detaljsiden for statens maskin velger du Start utførelse.
Velg Start utførelse igjen for å bekrefte.

Statsmaskinen tar ca. 1 minutt å kjøre. Når den er fullført, vises verdien under Utførelsesstatus bør endre fra kjører til Etterfølger

Importer data til Forecast

Følg trinnene i denne delen for å importere datasettet du lastet opp til S3-bøtten din til datasettgruppen din:

På Step Functions-konsollen finner du tilstandsmaskinen som inneholder Import-Dataset.
På detaljsiden for statens maskin velger du Start utførelse.
Velg Start utførelse igjen for å bekrefte.

Hvor lang tid det tar å kjøre tilstandsmaskinen avhenger av datasettet som behandles.

Grafinspektør

Mens dette kjører, åpne en annen fane i nettleseren din og naviger til Forecast-konsollen.
På prognosekonsollen velger du Se datasettgrupper og naviger til datasettgruppen med navnet spesifisert for DataGroupName fra arbeidsmengden din.
Velg Se datasett.

Du bør se at dataimporten pågår.

Dataimport pågår

Når statsmaskinen for Import-Dataset er fullført, kan du fortsette til neste trinn for å bygge din tidsseriedatamodell.

Lag AutoPredictor (tren en tidsseriemodell)

Denne delen beskriver hvordan du trener en innledende prediktor med Forecast. Du kan velge å opprette en ny prediktor (din første grunnlinjeprediktor) eller omskolere en prediktor i løpet av hver produksjonssyklus, som kan være daglig, ukentlig eller på annen måte. Du kan også velge å ikke opprette en prediktor hver syklus og stole på prediktorovervåking for å veilede deg når du skal opprette en. Følgende figur visualiserer prosessen med å lage en produksjonsklar prognoseprediktor.

Produksjonsklar arbeidsflyt for prediktor

For å opprette en ny prediktor, fullfør følgende trinn:

På Step Functions-konsollen finner du tilstandsmaskinen som inneholder Create-Predictor.
På detaljsiden for statens maskin velger du Start utførelse.
Velg Start utførelse igjen for å bekrefte.
Mengden kjøretid kan avhenge av datasettet som behandles. Dette kan ta opptil en time eller mer å fullføre.
Mens dette kjører, åpne en annen fane i nettleseren din og naviger til Forecast-konsollen.
På prognosekonsollen velger du Se datasettgrupper og naviger til datasettgruppen med navnet spesifisert for DataGroupName fra arbeidsmengden din.
Velg Se prediktorer.

Du bør se prediktortreningen pågår (treningsstatus viser "Opprett pågår...").

Dataimport pågår

Når statsmaskinen for Create-Predictor er fullført, kan du evaluere ytelsen.

Som en del av statsmaskinen lager systemet en prediktor og kjører også en BacktestExport jobb som skriver ut tidsserie-nivå prediktorberegninger til Amazon S3. Dette er filer som ligger i to S3-mapper under backtest-export mappe:

nøyaktighet-metrikk-verdier – Gir nøyaktige metriske beregninger på varenivå slik at du kan forstå ytelsen til en enkelt tidsserie. Dette lar deg undersøke spredningen i stedet for å fokusere på de globale beregningene alene.
prognoseverdier – Gir spådommer på trinnnivå for hver tidsserie i backtest-vinduet. Dette lar deg sammenligne den faktiske målverdien fra et holdout-testsett med de forutsagte kvantilverdiene. Gjennomgang av dette hjelper til med å formulere ideer om hvordan du kan tilby ytterligere datafunksjoner i RTS eller elementmetadata for å hjelpe til med å bedre estimere fremtidige verdier, og redusere tap ytterligere. Du kan laste ned backtest-export filer fra Amazon S3 eller spør dem på plass med Athena.

S3 bøtteinnhold

Med dine egne data må du inspisere prediktorresultatene nøye og sikre at beregningene oppfyller dine forventede resultater ved å bruke backtest-eksportdataene. Når du er fornøyd, kan du begynne å generere fremtidsdaterte spådommer som beskrevet i neste avsnitt.

Generer en prognose (slutning om fremtidige tidshorisonter)

Denne delen beskriver hvordan du genererer prognosedatapunkter med Forecast. Fremover bør du hente inn nye data fra kildesystemet, importere dataene til Forecast og deretter generere prognosedatapunkter. Eventuelt kan du også sette inn en ny prediktoroppretting etter import og før prognose. Følgende figur visualiserer prosessen med å lage produksjonstidsserieprognoser ved hjelp av Forecast.

Produksjonstidsserie prognose arbeidsflyt

Fullfør følgende trinn:

På Step Functions-konsollen finner du tilstandsmaskinen som inneholder Create-Forecast.
På detaljsiden for statens maskin velger du Start utførelse.
Velg Start utførelse igjen for å bekrefte.
Denne tilstandsmaskinen fullfører veldig raskt fordi systemet ikke er konfigurert til å generere en prognose. Den vet ikke hvilken prediktormodell du har godkjent for slutning.
La oss konfigurere systemet til å bruke din trente prediktor.
På Forecast-konsollen finner du ARN for prediktoren din.
Kopier ARN for å bruke i et senere trinn.
I nettleseren din, åpne en annen fane og naviger til Systems Manager-konsollen.
På Systems Manager-konsollen velger du Parameterlager i navigasjonsruten.
Finn parameteren relatert til stabelen din (/forecast/<StackName>/Forecast/PredictorArn).
Skriv inn ARN du kopierte for prediktoren din.
Dette er hvordan du forbinder en trent prediktor med slutningsfunksjonen til Forecast.
Finn parameteren /forecast/<StackName>/Forecast/Generate og rediger verdien, erstatt FALSE med TRUE.
Nå er du klar til å kjøre en prognosejobb for denne datasettgruppen.
På Step Functions-konsollen kjører du Create-Forecast statsmaskin.

Denne gangen går jobben som forventet. Som en del av statsmaskinen lager systemet en prognose og en ForecastExport jobb, som skriver ut tidsseriespådommer til Amazon S3. Disse filene er plassert i forecast mappe

Prognose mappeinnhold

Inne i forecast mappen, vil du finne spådommer for elementene dine, plassert i mange CSV- eller Parkett-filer, avhengig av ditt valg. Prediksjonene for hvert tidstrinn og valgte tidsserier eksisterer med alle dine valgte kvantilverdier per post. Du kan laste ned disse filene fra Amazon S3, spørre dem på plass med Athena, eller velge en annen strategi for å bruke dataene.

Dette avslutter hele arbeidsflyten. Du kan nå visualisere utdataene dine ved å bruke et hvilket som helst visualiseringsverktøy du ønsker, for eksempel Amazon QuickSight. Alternativt kan dataforskere bruke pandaer til å generere sine egne plott. Hvis du velger å bruke QuickSight, kan du koble prognoseresultatene dine til QuickSight å utføre datatransformasjoner, lage en eller flere dataanalyser, og lage visualiseringer.

Denne prosessen gir en mal å følge. Du må tilpasse prøven til skjemaet ditt, stille inn prognosehorisonten, tidsoppløsningen og så videre i henhold til din brukssituasjon. Du må også angi en gjentakende tidsplan der data hentes fra kildesystemet, importere dataene og produsere prognoser. Hvis ønskelig, kan du sette inn en prediktoroppgave mellom import- og prognosetrinnene.

Tren prediktoren på nytt

Vi har gått gjennom prosessen med å trene en ny prediktor, men hva med å omskolere en prediktor? Omskolering av en prediktor er én måte å redusere kostnadene og tiden det tar å trene en prediktor på de siste tilgjengelige dataene. I stedet for å lage en ny prediktor og trene den på hele datasettet, kan vi omskolere den eksisterende prediktoren ved å gi bare de nye inkrementelle dataene som er gjort tilgjengelig siden prediktoren sist ble trent. La oss gå gjennom hvordan du omskoler en prediktor ved hjelp av automatiseringsløsningen:

På prognosekonsollen velger du Se datasettgrupper.
Velg datasettgruppen som er knyttet til prediktoren du vil omskolere.
Velg Se prediktorer, og velg deretter prediktoren du vil omskolere.
På innstillinger fanen, kopier prediktoren ARN.
Vi må oppdatere en parameter som brukes av arbeidsflyten for å identifisere prediktoren som skal omskoleres.
På Systems Manager-konsollen velger du Parameterlager i navigasjonsruten.
Finn parameteren /forecast/<STACKNAME>/Forecast/Predictor/ReferenceArn.
På parameterdetaljsiden velger du Rediger.
Til Verdi, skriv inn prediktoren ARN.
Dette identifiserer den riktige prediktoren for at arbeidsflyten skal omskoleres. Deretter må vi oppdatere en parameter som brukes av arbeidsflyten for å endre treningsstrategien.
Finn parameteren /forecast/<STACKNAME>/Forecast/Predictor/Strategy.
Velg Rediger på parameterdetaljsiden.
For Verdi, skriv inn RETRAIN.
Arbeidsflyten trener som standard en ny prediktor; vi kan imidlertid modifisere atferden for å omskolere en eksisterende prediktor eller ganske enkelt gjenbruke en eksisterende prediktor uten omskolering ved å sette denne verdien til NONE. Det kan være lurt å gi avkall på trening hvis dataene dine er relativt stabile eller du bruker automatisert prediktorovervåking å bestemme når omskolering er nødvendig.
Last opp de inkrementelle treningsdataene til S3-bøtta.
På Step Functions-konsollen finner du tilstandsmaskinen <STACKNAME>-Create-Predictor.
På detaljsiden for statens maskin velger du Start utførelse for å starte omskoleringen.

Når omopplæringen er fullført, vil arbeidsflyten avsluttes, og du vil motta et SNS-e-postvarsel til e-postadressen som er oppgitt i arbeidsbelastningsmalparameterne.

Rydd opp

Når du er ferdig med denne løsningen, følg trinnene i denne delen for å slette relaterte ressurser.

Slett S3-bøtten

Velg på Amazon S3-konsollen Bøtter i navigasjonsruten.
Velg bøtten der data ble lastet opp og velg Tom å slette alle data knyttet til løsningen, inkludert kildedata.
Enter permanently delete for å slette bøtteinnholdet permanent.
På Bøtter side, velg bøtte og velg Delete.
Skriv inn navnet på bøtten for å bekrefte slettingen og velg Slett bøtte.

Slett prognoseressurser

På prognosekonsollen velger du Se datasettgrupper.
Velg datasettgruppenavnet knyttet til løsningen, og velg deretter Delete.
Enter delete for å slette datasettgruppen og tilknyttede prediktorer, prediktor tilbaketest eksportjobber, prognoser og prognoseeksportjobber.
Velg Delete å bekrefte.

Slett CloudFormation-stablene

Velg på AWS CloudFormation-konsollen Stabler i navigasjonsruten.
Velg arbeidsmengdestabelen og velg Delete.
Velg Slett stabel for å bekrefte sletting av stabelen og alle tilknyttede ressurser.
Når slettingen er fullført, velg avhengighetsstakken og velg Delete.
Velg Delete å bekrefte.

konklusjonen

I dette innlegget diskuterte vi noen forskjellige måter å komme i gang med å bruke Forecast. Vi gikk gjennom en automatisert prognoseløsning basert på AWS CloudFormation for en rask, repeterbar løsningsdistribusjon av en Forecast-pipeline fra datainntak til slutning, med lite infrastrukturkunnskap som kreves. Til slutt så vi hvordan vi kan bruke Lambda til å automatisere modellomskolering, redusere kostnader og opplæringstid.

Det er ingen bedre tid enn nå for å begynne å varsle med Forecast. For å begynne å bygge og distribuere en automatisert arbeidsflyt, besøk Amazon Forecast-ressurser. God prognose!

Om forfatterne

Automatiser utrullingen av en Amazon Forecast-tidsserieprognosemodell PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Aaron Fagan er en Principal Specialist Solutions Architect ved AWS med base i New York. Han spesialiserer seg på å hjelpe kunder med å bygge løsninger innen maskinlæring og skysikkerhet.

Automatiser utrullingen av en Amazon Forecast-tidsserieprognosemodell PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Raju Patil er en dataforsker i AWS Professional Services. Han bygger og distribuerer AI/ML-løsninger for å hjelpe AWS-kunder med å overvinne deres forretningsutfordringer. Hans AWS-engasjementer har dekket et bredt spekter av AI/ML-brukstilfeller som datasyn, tidsserieprognoser og prediktiv analyse, etc., på tvers av en rekke bransjer, inkludert finansielle tjenester, telekom, helsevesen og mer. Før dette har han ledet Data Science-team innen reklameteknologi, og gitt betydelige bidrag til en rekke forsknings- og utviklingstiltak innen datasyn og robotikk. Utenom jobben liker han fotografering, fotturer, reiser og kulinariske utforskninger.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoAiStream. Web3 Data Intelligence. Kunnskap forsterket. Tilgang her.
Minting the Future med Adryenn Ashley. Tilgang her.
Kjøp og selg aksjer i PRE-IPO-selskaper med PREIPO®. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/automate-the-deployment-of-an-amazon-forecast-time-series-forecasting-model/

Tidstempel: Kan 4, 2023

Tidstempel: Jan 17, 2023

Publisert av Platon

Bygg en Amazon SageMaker Model Registry-godkjennings- og markedsføringsarbeidsflyt med menneskelig inngripen | Amazon Web Services

Kjør inferens i skala for OpenFold, en PyTorch-basert proteinfolding ML-modell, ved å bruke Amazon EKS

AWS Inferentia og AWS Trainium gir lavest kostnad for å distribuere Llama 3-modeller i Amazon SageMaker JumpStart | Amazon Web Services

Sett opp Amazon SageMaker Studio med Jupyter Lab 3 ved å bruke AWS CDK

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn