Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Amazon SageMaker Autopilot støtter nå tidsseriedata

Amazon SageMaker Autopilot bygger, trener og justerer automatisk de beste maskinlæringsmodellene (ML) basert på dataene dine, samtidig som du kan opprettholde full kontroll og synlighet. Vi har nylig annonsert støtte for tidsseriedata i autopilot. Du kan bruke autopilot til å takle regresjons- og klassifiseringsoppgaver på tidsseriedata, eller sekvensdata generelt. Tidsseriedata er en spesiell type sekvensdata der datapunkter samles inn med jevne tidsintervaller.

Manuell klargjøring av dataene, valg av riktig ML-modell og optimalisering av parameterne er en kompleks oppgave, selv for en ekspert. Selv om det finnes automatiserte tilnærminger som kan finne de beste modellene og deres parametere, kan disse vanligvis ikke håndtere data som kommer som sekvenser, for eksempel nettverkstrafikk, strømforbruk eller husholdningsutgifter registrert over tid. Fordi disse dataene har form av observasjoner innhentet på forskjellige tidspunkt, kan påfølgende observasjoner ikke behandles som uavhengige av hverandre og må behandles som en helhet. Du kan bruke autopilot for et bredt spekter av problemer med å håndtere sekvensielle data. Du kan for eksempel klassifisere nettverkstrafikk registrert over tid for å identifisere ondsinnede aktiviteter, eller avgjøre om enkeltpersoner kvalifiserer for et boliglån basert på kreditthistorikken deres. Du gir et datasett som inneholder tidsseriedata, og Autopilot håndterer resten, behandler sekvensielle data gjennom spesialiserte funksjonstransformasjoner og finner den beste modellen på dine vegne.

Autopilot eliminerer de tunge løftene ved å bygge ML-modeller, og hjelper deg automatisk å bygge, trene og justere den beste ML-modellen basert på dataene dine. Autopiloten kjører flere algoritmer på dataene dine og justerer hyperparametrene deres på en fullstendig administrert datainfrastruktur. I dette innlegget viser vi hvordan du kan bruke Autopilot å løse klassifikasjons- og regresjonsproblemer på tidsseriedata. For instruksjoner om hvordan du oppretter og trener en autopilotmodell, se Kunde Churn-prediksjon med Amazon SageMaker Autopilot.

Klassifisering av tidsseriedata ved hjelp av autopilot

Som et løpende eksempel tar vi for oss et flerklasseproblem på tidsserien datasett UWaveGestureLibraryX, som inneholder ekvidistante avlesninger av akselerometersensorer mens du utfører en av åtte forhåndsdefinerte håndbevegelser. For enkelhets skyld tar vi kun i betraktning X-dimensjonen til akselerometeret. Oppgaven er å bygge en klassifiseringsmodell for å kartlegge tidsseriedataene fra sensoravlesningene til de forhåndsdefinerte bevegelsene. Følgende figur viser de første radene i datasettet i CSV-format. Hele tabellen består av 896 rader og to kolonner: den første kolonnen er en bevegelsesetikett og den andre kolonnen er en tidsserie med sensoravlesninger.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Konverter data til riktig format med Amazon SageMaker Data Wrangler

I tillegg til å godta numeriske, kategoriske og standard tekstkolonner, godtar autopilot nå også en sekvensinndatakolonne. Hvis tidsseriedataene dine ikke følger dette formatet, kan du enkelt konvertere dem Amazon SageMaker Data Wrangler. Data Wrangler reduserer tiden det tar å samle og forberede data for ML fra uker til minutter. Med Data Wrangler kan du forenkle prosessen med dataforberedelse og funksjonsutvikling, og fullføre hvert trinn i dataforberedelsesarbeidsflyten, inkludert datavalg, rensing, utforskning og visualisering fra ett enkelt visuelt grensesnitt. Vurder for eksempel det samme datasettet, men i et annet inndataformat: hver gest (spesifisert av ID) er en sekvens av ekvidistante målinger av akselerometeret. Når den lagres vertikalt, inneholder hver rad et tidsstempel og én verdi. Følgende figur sammenligner disse dataene i dets opprinnelige format og et sekvensformat.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

For å konvertere dette datasettet til formatet beskrevet tidligere ved bruk av Data Wrangler, last inn datasettet fra Amazon enkel lagringstjeneste (Amazon S3). Bruk deretter tidsserie Gruppe etter transformasjon, som vist i følgende skjermbilde, og eksporter dataene tilbake til Amazon S3 i CSV-format.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Når datasettet er i det angitte formatet, kan du fortsette med autopilot. For å sjekke ut andre tidsserietransformatorer til Data Wrangler, referer til Forbered tidsseriedata med Amazon SageMaker Data Wrangler.

Start en AutoML-jobb

Som med andre inndatatyper som støttes av autopilot, er hver rad i datasettet en annen observasjon og hver kolonne er en funksjon. I dette eksemplet har vi en enkelt kolonne som inneholder tidsseriedata, men du kan ha flere tidsseriekolonner. Du kan også ha flere kolonner med forskjellige inndatatyper, for eksempel tidsserier, tekst og numerisk.

Til lage et autopiloteksperiment, plasser datasettet i en S3-bøtte og lag et nytt eksperiment innenfor Amazon SageMaker Studio. Som vist i følgende skjermbilde, må du spesifisere navnet på eksperimentet, S3-plasseringen for datasettet, S3-plasseringen for utdataartefaktene og kolonnenavnet for å forutsi.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Autopilot analyserer dataene, genererer ML-rørledninger og kjører standard 250 iterasjoner av hyperparameteroptimalisering på denne klassifiseringsoppgaven. Som vist i følgende modelltavle, når autopiloten 0.821 nøyaktighet, og du kan distribuere den beste modellen med bare ett klikk.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

I tillegg genererer autopilot en datautforskningsrapport, hvor du kan visualisere og utforske dataene dine.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Åpenhet er grunnleggende for autopilot. Du kan inspisere og endre genererte ML-rørledninger i notatboken for kandidatdefinisjon. Følgende skjermbilde viser hvordan Autopilot anbefaler en rekke rørledninger, som kombinerer tidsserietransformatoren TSFeatureExtractor med forskjellige ML-algoritmer, for eksempel gradientforsterkede beslutningstrær og lineære modeller. De TSFeatureExtractor trekker ut hundrevis av tidsseriefunksjoner for deg, som deretter mates til nedstrømsalgoritmene for å lage spådommer. For den fullstendige listen over tidsseriefunksjoner, se Oversikt over utpakkede funksjoner.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

konklusjonen

I dette innlegget demonstrerte vi hvordan du bruker SageMaker Autopilot til å løse tidsserieklassifisering og regresjonsproblemer med bare noen få klikk.

For mer informasjon om autopilot, se Amazon SageMaker Autopilot. For å utforske relaterte funksjoner til SageMaker, se Amazon SageMaker Data Wrangler.


Om forfatterne

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Nikita Ivkin er en Applied Scientist, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Anne Milbert er en programvareutviklingsingeniør som jobber med Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Valerio Perrone er en Applied Science Manager som jobber med Amazon SageMaker Automatic Model Tuning og Autopilot.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Meghana Satish er en programvareutviklingsingeniør som jobber med Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot støtter nå tidsseriedata PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Ali Takbiri er en AI/ML-spesialist Solutions Architect, og hjelper kunder ved å bruke Machine Learning til å løse forretningsutfordringene deres på AWS Cloud.

Tidstempel:

Mer fra AWS maskinlæring