Automatiser implementeringen af en Amazon Forecast-tidsserie-prognosemodel

Genudgivet af Platon

Abonnenter: 0

Tidsserieprognoser refererer til processen med at forudsige fremtidige værdier af tidsseriedata (data, der indsamles med regelmæssige intervaller over tid). Simple metoder til tidsserieprognoser bruger historiske værdier af den samme variabel, hvis fremtidige værdier skal forudsiges, hvorimod mere komplekse, maskinlæringsbaserede (ML)-baserede metoder bruger yderligere information, såsom tidsseriedata for relaterede variable.

Amazon prognose er en ML-baseret tidsserieprognosetjeneste, der inkluderer algoritmer, der er baseret på over 20 års prognoseerfaring brugt af Amazon.com, der bringer den samme teknologi, der bruges hos Amazon, til udviklere som en fuldt administreret tjeneste, hvilket fjerner behovet for at administrere ressourcer. Forecast bruger ML til at lære ikke kun den bedste algoritme for hvert element, men også det bedste ensemble af algoritmer for hvert element, hvilket automatisk skaber den bedste model for dine data.

Dette indlæg beskriver, hvordan man implementerer tilbagevendende prognose-arbejdsbelastninger (tidsserie-prognose-arbejdsbelastninger) uden kode ved hjælp af AWS CloudFormation, AWS-trinfunktionerog AWS System Manager. Metoden, der præsenteres her, hjælper dig med at opbygge en pipeline, der giver dig mulighed for at bruge den samme arbejdsgang fra den første dag af din tidsserieforudsigelseseksperimentering gennem implementeringen af modellen i produktionen.

Tidsserieprognoser ved hjælp af Forecast

Arbejdsgangen for Forecast involverer følgende almindelige begreber:

Import af datasæt – I Forecast, en datasæt gruppe er en samling af datasæt, skemaer og prognoseresultater, der går sammen. Hver datasætgruppe kan have op til tre datasæt, et af hver datasæt type: måltidsserier (TTS), relaterede tidsserier (RTS) og varemetadata. Et datasæt er en samling af filer, der indeholder data, der er relevante for en prognoseopgave. Et datasæt skal være i overensstemmelse med det skema, der er defineret i Forecast. For flere detaljer, se Import af datasæt.
Træningsprædiktorer - A forudsigelse er en prognosetrænet model, der bruges til at lave prognoser baseret på tidsseriedata. Under træning beregner Forecast nøjagtighedsmetrikker, som du bruger til at evaluere forudsigelsen og beslutte, om du vil bruge forudsigeren til at generere en forecast. For mere information, se Træningsforudsigere.
Generering af prognoser – Du kan derefter bruge den trænede model til at generere prognoser for en fremtidig tidshorisont, kendt som prognosehorisont. Forecast giver prognoser for forskellige specificerede kvantiler. For eksempel vil en prognose ved 0.90-kvantilen estimere en værdi, der er lavere end den observerede værdi 90 % af tiden. Som standard bruger Forecast følgende værdier for de forudsigelige prognosetyper: 0.1 (P10), 0.5 (P50) og 0.9 (P90). Prognoser ved forskellige kvantiler bruges typisk til at give et forudsigelsesinterval (en øvre og nedre grænse for prognoser) for at tage højde for prognoseusikkerhed.

Du kan implementere denne arbejdsgang i Forecast enten fra AWS Management Console, AWS kommandolinjegrænseflade (AWS CLI), via API-kald ved hjælp af Python-notebooks, eller via automatiseringsløsninger. Det konsol , AWS CLI metoder er bedst egnede til hurtige eksperimenter for at kontrollere gennemførligheden af tidsserieprognoser ved hjælp af dine data. Python-notebook-metoden er fantastisk til dataforskere, der allerede er fortrolige med Jupyter-notebooks og kodning, og giver maksimal kontrol og tuning. Den notebook-baserede metode er dog svær at operationalisere. Vores automatiseringstilgang letter hurtige eksperimenter, eliminerer gentagne opgaver og muliggør lettere overgang mellem forskellige miljøer (udvikling, iscenesættelse, produktion).

I dette indlæg beskriver vi en automatiseringstilgang til brug af Forecast, der giver dig mulighed for at bruge dine egne data og giver en enkelt arbejdsgang, som du kan bruge problemfrit gennem hele livscyklussen af udviklingen af din prognoseløsning, fra de første dages eksperimenter og frem til implementeringen af løsningen i dit produktionsmiljø.

Løsningsoversigt

I de følgende afsnit beskriver vi en komplet end-to-end workflow, der fungerer som en skabelon, der skal følges for automatiseret implementering af tidsserieprognosemodeller ved hjælp af Forecast. Denne arbejdsgang opretter forudsagte datapunkter fra et open source-inputdatasæt; du kan dog bruge den samme arbejdsgang til dine egne data, så længe du kan formatere dine data i henhold til de trin, der er skitseret i dette indlæg. Når du har uploadet dataene, leder vi dig gennem trinene for at oprette prognosedatasætgrupper, importere data, træne ML-modeller og producere prognosedatapunkter på fremtidige usete tidshorisonter fra rådata. Alt dette er muligt uden at skulle skrive eller kompilere kode.

Følgende diagram illustrerer prognosearbejdsgangen.

Arbejdsgang for cyklisk prognose

Løsningen implementeres ved hjælp af to CloudFormation-skabeloner: afhængighedsskabelonen og workload-skabelonen. CloudFormation giver dig mulighed for at udføre AWS-infrastrukturimplementeringer forudsigeligt og gentagne gange ved at bruge skabeloner, der beskriver de ressourcer, der skal implementeres. En implementeret skabelon kaldes en stable. Vi har sørget for at definere infrastrukturen i løsningen for dig i de to medfølgende skabeloner. Afhængighedsskabelonen definerer de nødvendige ressourcer, der bruges af arbejdsbelastningsskabelonen, såsom en Amazon Simple Storage Service (Amazon S3) spand til objektopbevaring og AWS identitets- og adgangsstyring (IAM) tilladelser til AWS API-handlinger. De ressourcer, der er defineret i afhængighedsskabelonen, kan deles af flere arbejdsbelastningsskabeloner. Arbejdsbelastningsskabelonen definerer de ressourcer, der bruges til at indtage data, træne en forudsigelse og generere en prognose.

Implementeringsarbejdsgang

Implementer afhængighedsskabelonen CloudFormation

Lad os først implementere afhængighedsskabelonen for at skabe vores nødvendige ressourcer. Afhængighedsskabelonen implementerer en valgfri S3-spand, AWS Lambda funktioner og IAM-roller. Amazon S3 er en billig, meget tilgængelig, robust objektlagringstjeneste. Vi bruger en S3 bucket i denne løsning til at gemme kildedata og udløse workflowet, hvilket resulterer i en prognose. Lambda er en serverløs, hændelsesdrevet computertjeneste, der lader dig køre kode uden at klargøre eller administrere servere. Afhængighedsskabelonen indeholder funktioner til at gøre ting som at oprette en datasætgruppe i Forecast og tømme objekter inden for en S3-indsamling, før du sletter spanden. IAM-roller definerer tilladelser inden for AWS for brugere og tjenester. Afhængighedsskabelonen implementerer en rolle, der skal bruges af Lambda og en anden til Step Functions, en workflow-administrationstjeneste, der vil koordinere opgaverne med dataindtagelse og -behandling, samt forudsigelsestræning og inferens ved hjælp af Forecast.

Fuldfør følgende trin for at implementere afhængighedsskabelonen:

På konsollen skal du vælge den ønskede Region støttet af Forecast til løsningsimplementering.
På AWS CloudFormation-konsollen skal du vælge Stakke i navigationsruden.
Vælg Opret stak Og vælg Med nye ressourcer (standard).
Til Skabelonkilde, Vælg Amazon S3 URL.
Indtast skabelonens URL: https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-dependency.yaml.
Vælg Næste.
Til Staknavn, gå ind forecast-mlops-dependency.
Under parametre, vælg at bruge en eksisterende S3-spand eller oprette en ny, og angiv derefter navnet på spanden.
Vælg Næste.
Vælg Næste for at acceptere standardstakindstillingerne.
Marker afkrydsningsfeltet for at bekræfte, at stakken opretter IAM-ressourcer, og vælg derefter Opret stak at implementere skabelonen.

Du bør se skabelonen implementere som forecast-mlops-dependency stak. Når status ændres til CREATE_COMPLETE, kan du gå til næste trin.

Implementer arbejdsbelastningen CloudFormation-skabelonen

Lad os derefter implementere arbejdsbelastningsskabelonen for at skabe vores nødvendige ressourcer. Arbejdsbelastningsskabelonen implementerer Step Functions-tilstandsmaskiner til workflowstyring, AWS Systems Manager Parameter Store parametre til at gemme parameterværdier fra AWS CloudFormation og informere arbejdsgangen, en Amazon Simple Notification Service (Amazon SNS) emne for workflow-meddelelser og en IAM-rolle for workflow-tjenestetilladelser.

Løsningen skaber fem tilstandsmaskiner:

CreateDatasetGroupStateMachine – Opretter en prognosedatasætgruppe, som data skal importeres til.
CreateImportDatasetStateMachine – Importerer kildedata fra Amazon S3 til en datasætgruppe til træning.
CreateForecastStateMachine – Styrer de opgaver, der kræves for at træne en forudsiger og generere en prognose.
AthenaConnectorStateMachine – Gør det muligt at skrive SQL-forespørgsler med Amazonas Athena stik til landdata i Amazon S3. Dette er en valgfri proces til at indhente historiske data i det krævede format til Forecast ved at bruge Athena i stedet for at placere filer manuelt i Amazon S3.
TrinFunctionWorkflowStateMachine – Koordinater kalder ud til de andre fire statsmaskiner og styrer den overordnede arbejdsgang.

Parameter Store, en funktion i Systems Manager, giver sikker, hierarkisk lagring og programmatisk hentning af konfigurationsdatastyring og hemmelighedsstyring. Parameter Store bruges til at gemme parametre indstillet i arbejdsbelastningsstakken såvel som andre parametre, der bruges af arbejdsgangen.

Fuldfør følgende trin for at implementere arbejdsbelastningsskabelonen:

På AWS CloudFormation-konsollen skal du vælge Stakke i navigationsruden.
Vælg Opret stak Og vælg Med nye ressourcer (standard).
Til Skabelonkilde, Vælg Amazon S3 URL.
Indtast skabelonens URL: https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-solution-guidance.yaml.
Vælg Næste.
Til Staknavn, indtast et navn.
Accepter standardværdierne eller modificer parametrene.

Sørg for at indtaste S3-bøttenavnet fra afhængighedsstakken for S3 spand og en gyldig e-mailadresse til SNSendepunkt selvom du accepterer standardparameterværdierne.

Følgende tabel beskriver hver parameter.

Parameter	Beskrivelse	Mere information
`DatasetGroupFrequencyRTS`	Hyppigheden af dataindsamling for RTS-datasættet.	.
`DatasetGroupFrequencyTTS`	Hyppigheden af dataindsamling for TTS-datasættet.	.
`DatasetGroupName`	Et kort navn for datasætgruppen, en selvstændig arbejdsbyrde.	OpretDatasetGroup
`DatasetIncludeItem`	Angiv, om du vil angive varemetadata til denne brugssag.	.
`DatasetIncludeRTS`	Angiv, om du vil angive en relateret tidsserie for denne brugssituation.	.
`ForecastForecastTypes`	Når et CreateForecast-job kører, erklærer dette, hvilke kvantiler, der skal produceres forudsigelser for. Du kan vælge op til fem værdier i dette array. Rediger denne værdi for at inkludere værdier efter behov.	Opret prognose
`PredictorAttributeConfigs`	For målvariablen i TTS og hvert numerisk felt i RTS-datasættene skal der oprettes en post for hvert tidsinterval for hvert element. Denne konfiguration hjælper med at bestemme, hvordan manglende poster udfyldes: med 0, NaN eller andet. Vi anbefaler at indsætte hullerne i TTS'en med NaN i stedet for 0. Med 0 lærer modellen måske forkert at fordreje prognoser mod 0. NaN er, hvordan vejledningen leveres. Rådfør dig med din AWS Solutions Architect med spørgsmål om dette.	Opret AutoPredictor
`PredictorExplainPredictor`	Gyldige værdier er TRUE eller FALSE. Disse bestemmer, om forklaring er aktiveret for din prædiktor. Dette kan hjælpe dig med at forstå, hvordan værdier i RTS og varemetadata påvirker modellen.	Forklarlighed
`PredictorForecastDimensions`	Du ønsker måske at forudsige en finere korn end vare. Her kan du angive dimensioner som placering, omkostningssted eller hvad du nu har behov for. Dette skal stemme overens med dimensionerne i din RTS og TTS. Bemærk, at hvis du ikke har nogen dimension, er den korrekte parameter nul, alene og med små bogstaver. null er et reserveret ord, der lader systemet vide, at der ikke er nogen parameter for dimensionen.	Opret AutoPredictor
`PredictorForecastFrequency`	Definerer tidsskalaen, hvor din model og dine forudsigelser vil blive genereret, såsom dagligt, ugentligt eller månedligt. Rullemenuen hjælper dig med at vælge tilladte værdier. Dette skal stemme overens med din RTS-tidsskala, hvis du bruger RTS.	Opret AutoPredictor
`PredictorForecastHorizon`	Antallet af tidstrin, som modellen forudsiger. Prognosehorisonten kaldes også forudsigelse længde.	Opret AutoPredictor
`PredictorForecastOptimizationMetric`	Definerer den nøjagtighedsmetrik, der bruges til at optimere forudsigeren. Rullemenuen hjælper dig med at vælge vægtede kvantiltabssaldi til over- eller underprognoser. RMSE beskæftiger sig med enheder, og WAPE/MAPE beskæftiger sig med procentfejl.	Opret AutoPredictor
`PredictorForecastTypes`	Når en `CreateAutoPredictor` jobkørsler, erklærer dette, hvilke kvantiler der bruges til at træne forudsigelsespunkter. Du kan vælge op til fem værdier i dette array, så du kan balancere over- og underprognoser. Rediger denne værdi for at inkludere værdier efter behov.	Opret AutoPredictor
`S3Bucket`	Navnet på S3-bøtten, hvor inputdata og outputdata er skrevet for denne arbejdsbelastning.	.
`SNSEndpoint`	En gyldig e-mailadresse til at modtage meddelelser, når forudsigelses- og prognosejobbene er fuldført.	.
`SchemaITEM`	Dette definerer den fysiske rækkefølge, kolonnenavne og datatyper for dit elements metadatadatasæt. Dette er en valgfri fil i løsningseksemplet.	Opret datasæt
`SchemaRTS`	Dette definerer den fysiske rækkefølge, kolonnenavne og datatyper for dit RTS-datasæt. Målene skal stemme overens med din TTS. Tidskornet i denne fil styrer det tidskorn, hvor forudsigelser kan foretages. Dette er en valgfri fil i løsningseksemplet.	Opret datasæt
`SchemaTTS`	Dette definerer den fysiske rækkefølge, kolonnenavne og datatyper for dit TTS-datasæt, det eneste nødvendige datasæt. Filen skal som minimum indeholde en målværdi, et tidsstempel og et element.	Opret datasæt
`TimestampFormatRTS`	Definerer tidsstempelformatet i RTS-filen.	OpretDatasetImportJob
`TimestampFormatTTS`	Definerer tidsstempelformatet i TTS-filen.	OpretDatasetImportJob

Vælg Næste for at acceptere standardstakindstillingerne.
Marker afkrydsningsfeltet for at bekræfte, at stakken opretter IAM-ressourcer, og vælg derefter Opret stak at implementere skabelonen.

Du bør se skabelonen implementere som det staknavn, du valgte tidligere. Når status ændres til CREATE_COMPLETE, kan du gå til dataoverførselstrinnet.

Upload dataene

I det forrige afsnit angav du et staknavn og en S3-spand. Dette afsnit beskriver, hvordan du deponerer det offentligt tilgængelige datasæt Efterspørgsel efter mad i denne spand. Hvis du bruger dit eget datasæt, se datasæt at forberede dit datasæt i et format, som implementeringen forventer. Datasættet skal mindst indeholde måltidsserien og eventuelt den relaterede tidsserie og elementmetadata:

TTS er tidsseriedata, der inkluderer det felt, som du vil generere en prognose for; dette felt kaldes målfelt
RTS er tidsseriedata, der ikke inkluderer målfeltet, men inkluderer et relateret felt
Varedatafilen er ikke tidsseriedata, men inkluderer metadataoplysninger om elementerne i TTS- eller RTS-datasættene

Udfør følgende trin:

Hvis du bruger det medfølgende eksempeldatasæt, skal du downloade datasættet Efterspørgsel efter mad til din computer og udpak filen, hvilket skaber tre filer i tre mapper (rts, tts, item).
På Amazon S3-konsollen skal du navigere til den bøtte, du oprettede tidligere.
Vælg oprette mappe.
Brug den samme streng som dit arbejdsbelastningsstabelnavn til mappenavnet.
Vælg Upload.
Vælg de tre datasætmapper, og vælg derefter Upload.

Når uploaden er færdig, bør du se noget i stil med følgende skærmbillede. For dette eksempel er vores mappe aiml42. S3 mappestruktur

Opret en prognosedatasætgruppe

Fuldfør trinene i dette afsnit for at oprette en datasætgruppe som en engangshændelse for hver arbejdsbelastning. Fremover bør du planlægge at køre importdataene, oprette en forudsigelse og oprette prognosetrin efter behov, som en serie i henhold til din tidsplan, som kan være dagligt, ugentligt eller på anden måde.

På Step Functions-konsollen skal du finde den tilstandsmaskine, der indeholder Create-Dataset-Group.
På tilstandsmaskinens detaljeside skal du vælge Start udførelse.
Vælg Start udførelse igen for at bekræfte.

Statsmaskinen tager cirka 1 minut at køre. Når den er færdig, vises værdien under Udførelsesstatus skal skifte fra Løb til lykkedes

Importer data til Forecast

Følg trinene i dette afsnit for at importere det datasæt, du har uploadet til din S3-indsamling, til din datasætgruppe:

På Step Functions-konsollen skal du finde den tilstandsmaskine, der indeholder Import-Dataset.
På tilstandsmaskinens detaljeside skal du vælge Start udførelse.
Vælg Start udførelse igen for at bekræfte.

Hvor lang tid det tager at køre tilstandsmaskinen afhænger af det datasæt, der behandles.

Grafinspektør

Mens dette kører, skal du i din browser åbne en anden fane og navigere til Forecast-konsollen.
På prognosekonsollen skal du vælge Se datasætgrupper og naviger til datasætgruppen med det navn, der er angivet for DataGroupName fra din arbejdsbyrdestak.
Vælg Se datasæt.

Du bør se, at dataimporten er i gang.

Dataimport i gang

Når statsmaskinen for Import-Dataset er færdig, kan du fortsætte til næste trin for at bygge din tidsseriedatamodel.

Opret AutoPredictor (træn en tidsseriemodel)

Dette afsnit beskriver, hvordan man træner en indledende forudsigelse med Forecast. Du kan vælge at oprette en ny forudsigelse (din første baseline forudsigelse) eller genoptræne en forudsigelse under hver produktionscyklus, som kan være daglig, ugentlig eller på anden måde. Du kan også vælge ikke at oprette en prædiktor hver cyklus og stole på prædiktorovervågning til at guide dig, hvornår du skal oprette en. Følgende figur visualiserer processen med at skabe en produktionsklar prognose forudsigelse.

Produktionsklar forudsigelsesarbejdsgang

For at oprette en ny forudsigelse skal du udføre følgende trin:

På Step Functions-konsollen skal du finde den tilstandsmaskine, der indeholder Create-Predictor.
På tilstandsmaskinens detaljeside skal du vælge Start udførelse.
Vælg Start udførelse igen for at bekræfte.
Mængden af kørselstid kan afhænge af det datasæt, der behandles. Dette kan tage op til en time eller mere at fuldføre.
Mens dette kører, skal du i din browser åbne en anden fane og navigere til Forecast-konsollen.
På prognosekonsollen skal du vælge Se datasætgrupper og naviger til datasætgruppen med det navn, der er angivet for DataGroupName fra din arbejdsbyrdestak.
Vælg Se forudsigelser.

Du bør se forudsigelsestræningen i gang (træningsstatus viser "Opret i gang...").

Dataimport i gang

Når statsmaskinen for Create-Predictor er færdig, kan du evaluere dens ydeevne.

Som en del af tilstandsmaskinen opretter systemet en prædiktor og kører også en BacktestExport job, der udskriver tidsserie-niveau forudsigelsesmålinger til Amazon S3. Disse er filer placeret i to S3-mapper under backtest-export folder:

nøjagtighed-metrics-værdier – Giver metriske beregninger med nøjagtighed på vareniveau, så du kan forstå ydeevnen af en enkelt tidsserie. Dette giver dig mulighed for at undersøge spredningen i stedet for alene at fokusere på de globale målinger.
prognoseværdier – Giver forudsigelser på trinniveau for hver tidsserie i backtest-vinduet. Dette giver dig mulighed for at sammenligne den faktiske målværdi fra et holdout-testsæt med de forudsagte kvantilværdier. Gennemgang af dette hjælper med at formulere ideer til, hvordan man kan levere yderligere datafunktioner i RTS eller elementmetadata for at hjælpe med bedre at estimere fremtidige værdier, hvilket yderligere reducerer tab. Du kan downloade backtest-export filer fra Amazon S3 eller forespørg dem på plads med Athena.

S3 spand indhold

Med dine egne data skal du nøje inspicere prædiktorens resultater og sikre, at metrikkerne opfylder dine forventede resultater ved at bruge backtest-eksportdataene. Når du er tilfreds, kan du begynde at generere fremtidsdaterede forudsigelser som beskrevet i næste afsnit.

Generer en prognose (slutning om fremtidige tidshorisonter)

Dette afsnit beskriver, hvordan du genererer prognosedatapunkter med Forecast. Fremover bør du høste nye data fra kildesystemet, importere dataene til Forecast og derefter generere prognosedatapunkter. Du kan eventuelt også indsætte en ny forudsigelsesoprettelse efter import og før prognose. Følgende figur visualiserer processen med at oprette produktionstidsserieprognoser ved hjælp af Forecast.

Prognose arbejdsgang for produktionstidsserier

Udfør følgende trin:

På Step Functions-konsollen skal du finde den tilstandsmaskine, der indeholder Create-Forecast.
På tilstandsmaskinens detaljeside skal du vælge Start udførelse.
Vælg Start udførelse igen for at bekræfte.
Denne tilstandsmaskine afsluttes meget hurtigt, fordi systemet ikke er konfigureret til at generere en prognose. Den ved ikke, hvilken prædiktormodel du har godkendt til slutning.
Lad os konfigurere systemet til at bruge din trænede forudsigelse.
På Forecast-konsollen skal du finde ARN for din forudsigelse.
Kopiér ARN til brug i et senere trin.
I din browser skal du åbne en anden fane og navigere til Systems Manager-konsollen.
På Systems Manager-konsollen skal du vælge Parameterlager i navigationsruden.
Find parameteren relateret til din stak (/forecast/<StackName>/Forecast/PredictorArn).
Indtast det ARN, du kopierede til din prædiktor.
Sådan forbinder du en trænet prædiktor med inferensfunktionen i Forecast.
Find parameteren /forecast/<StackName>/Forecast/Generate og rediger værdien, udskift FALSE med TRUE.
Nu er du klar til at køre et prognosejob for denne datasætgruppe.
På Step Functions-konsollen skal du køre Create-Forecast statsmaskine.

Denne gang kører jobbet som forventet. Som en del af statsmaskinen opretter systemet en prognose og en ForecastExport job, som udskriver tidsserieforudsigelser til Amazon S3. Disse filer er placeret i forecast mappe

Prognose mappeindhold

Inde forecast mappe, vil du finde forudsigelser for dine varer, placeret i mange CSV- eller Parket-filer, afhængigt af dit valg. Forudsigelserne for hvert tidstrin og udvalgte tidsserier eksisterer med alle dine valgte kvantilværdier pr. post. Du kan downloade disse filer fra Amazon S3, forespørge dem på plads med Athena eller vælge en anden strategi for at bruge dataene.

Dette afslutter hele arbejdsgangen. Du kan nu visualisere dit output ved hjælp af et hvilket som helst visualiseringsværktøj efter eget valg, som f.eks Amazon QuickSight. Alternativt kan dataforskere bruge pandaer til at generere deres egne plots. Hvis du vælger at bruge QuickSight, kan du tilslut dine prognoseresultater til QuickSight at udføre datatransformationer, oprette en eller flere dataanalyser og skabe visualiseringer.

Denne proces giver en skabelon at følge. Du bliver nødt til at tilpasse prøven til dit skema, indstille prognosehorisonten, tidsopløsningen og så videre i henhold til din brugssituation. Du skal også indstille en tilbagevendende tidsplan, hvor data høstes fra kildesystemet, importere dataene og producere prognoser. Hvis det ønskes, kan du indsætte en forudsigelsesopgave mellem import- og prognosetrinene.

Genoplær prædiktoren

Vi har gennemgået processen med at træne en ny prædiktor, men hvad med genoptræning af en prædiktor? Genoplæring af en prædiktor er en måde at reducere omkostningerne og tiden involveret i at træne en prædiktor på de seneste tilgængelige data. I stedet for at oprette en ny prædiktor og træne den på hele datasættet, kan vi genoptræne den eksisterende prædiktor ved kun at levere de nye inkrementelle data, der er gjort tilgængelige, siden prædiktoren sidst blev trænet. Lad os gennemgå, hvordan man genoplærer en forudsigelse ved hjælp af automatiseringsløsningen:

På prognosekonsollen skal du vælge Se datasætgrupper.
Vælg den datasætgruppe, der er knyttet til den forudsigelse, du vil genoptræne.
Vælg Se forudsigelser, og vælg derefter den forudsigelse, du vil genoptræne.
På Indstillinger fanen, skal du kopiere forudsigeren ARN.
Vi skal opdatere en parameter, der bruges af arbejdsgangen for at identificere forudsigeren, der skal genoptrænes.
På Systems Manager-konsollen skal du vælge Parameterlager i navigationsruden.
Find parameteren /forecast/<STACKNAME>/Forecast/Predictor/ReferenceArn.
På parameterdetaljesiden skal du vælge Redigere.
Til Værdi, indtast prædiktoren ARN.
Dette identificerer den korrekte forudsigelse for, at workflowet skal genoptrænes. Dernæst skal vi opdatere en parameter, der bruges af arbejdsgangen for at ændre træningsstrategien.
Find parameteren /forecast/<STACKNAME>/Forecast/Predictor/Strategy.
Vælg Rediger på parameterdetaljesiden.
Indtast for Værdi RETRAIN.
Workflowet træner som standard en ny forudsigelse; vi kan dog ændre denne adfærd for at genoptræne en eksisterende forudsigelse eller blot genbruge en eksisterende forudsigelse uden genoptræning ved at indstille denne værdi til NONE. Du vil måske give afkald på træning, hvis dine data er relativt stabile, eller du bruger automatiseret prædiktorovervågning at beslutte, hvornår omskoling er nødvendig.
Upload de trinvise træningsdata til S3-spanden.
På Step Functions-konsollen skal du finde tilstandsmaskinen <STACKNAME>-Create-Predictor.
På tilstandsmaskinens detaljeside skal du vælge Start udførelse at påbegynde omskolingen.

Når genoptræningen er afsluttet, afsluttes arbejdsgangen, og du vil modtage en SNS-e-mail-meddelelse til den e-mailadresse, der er angivet i parametrene for arbejdsbelastningsskabelonen.

Ryd op

Når du er færdig med denne løsning, skal du følge trinene i dette afsnit for at slette relaterede ressourcer.

Slet S3-bøtten

På Amazon S3-konsollen skal du vælge spande i navigationsruden.
Vælg den bucket, hvor dataene blev uploadet, og vælg Tom at slette alle data tilknyttet løsningen, herunder kildedata.
Indtast permanently delete for at slette spandens indhold permanent.
På spande side, vælg spanden og vælg Slette.
Indtast navnet på bøtten for at bekræfte sletningen, og vælg Slet bøtte.

Slet prognoseressourcer

På prognosekonsollen skal du vælge Se datasætgrupper.
Vælg det datasætgruppenavn, der er knyttet til løsningen, og vælg derefter Slette.
Indtast delete for at slette datasætgruppen og tilknyttede forudsigelser, forudsigelses-backtest-eksportjob, prognoser og prognoseeksportjob.
Vælg Slette at bekræfte.

Slet CloudFormation-stakkene

På AWS CloudFormation-konsollen skal du vælge Stakke i navigationsruden.
Vælg arbejdsbelastningsstakken og vælg Slette.
Vælg Slet stakken for at bekræfte sletning af stakken og alle tilknyttede ressourcer.
Når sletningen er fuldført, skal du vælge afhængighedsstakken og vælge Slette.
Vælg Slette at bekræfte.

Konklusion

I dette indlæg diskuterede vi nogle forskellige måder at komme i gang med at bruge Forecast. Vi gik gennem en automatiseret prognoseløsning baseret på AWS CloudFormation til en hurtig, gentagelig løsningsimplementering af en prognosepipeline fra dataindtagelse til konklusioner, med lidt infrastrukturviden påkrævet. Til sidst så vi, hvordan vi kan bruge Lambda til at automatisere modelomskoling, hvilket reducerer omkostninger og træningstid.

Der er ikke noget bedre tidspunkt end nuet til at begynde at forudsige med Forecast. For at begynde at opbygge og implementere en automatiseret arbejdsgang, besøg Amazon Forecast-ressourcer. God prognose!

Om forfatterne

Automate the deployment of an Amazon Forecast time-series forecasting model PlatoBlockchain Data Intelligence. Vertical Search. Ai. Aaron Fagan er en Principal Specialist Solutions Architect hos AWS med base i New York. Han har specialiseret sig i at hjælpe kunder med at arkitekte løsninger inden for maskinlæring og cloud-sikkerhed.

Automate the deployment of an Amazon Forecast time-series forecasting model PlatoBlockchain Data Intelligence. Vertical Search. Ai. Raju Patil er dataforsker i AWS Professional Services. Han bygger og implementerer AI/ML-løsninger for at hjælpe AWS-kunder med at overvinde deres forretningsmæssige udfordringer. Hans AWS-engagementer har dækket en bred vifte af AI/ML-brugssager såsom computervision, tidsserieprognoser og prædiktive analyser osv. på tværs af adskillige brancher, herunder finansielle tjenester, telekommunikation, sundhedspleje og mere. Før dette har han ledet Data Science-teams inden for reklameteknologi og ydet væsentlige bidrag til adskillige forsknings- og udviklingsinitiativer inden for computersyn og robotteknologi. Uden for arbejdet nyder han fotografering, vandreture, rejser og kulinariske udforskninger.

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
PlatoAiStream. Web3 Data Intelligence. Viden forstærket. Adgang her.
Udmøntning af fremtiden med Adryenn Ashley. Adgang her.
Køb og sælg aktier i PRE-IPO-virksomheder med PREIPO®. Adgang her.
Kilde: https://aws.amazon.com/blogs/machine-learning/automate-the-deployment-of-an-amazon-forecast-time-series-forecasting-model/

Tidsstempel: Maj 4, 2023

Tidsstempel: Jan 17, 2023

Genudgivet af Platon

Byg en Amazon SageMaker Model Registry-godkendelse og promoveringsworkflow med menneskelig indgriben | Amazon Web Services

Kør inferens i skala for OpenFold, en PyTorch-baseret proteinfoldning ML-model, ved hjælp af Amazon EKS

AWS Inferentia og AWS Trainium leverer de laveste omkostninger til implementering af Llama 3-modeller i Amazon SageMaker JumpStart | Amazon Web Services

Konfigurer Amazon SageMaker Studio med Jupyter Lab 3 ved hjælp af AWS CDK

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto