Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Amazon SageMaker Autopilot stöder nu tidsseriedata

Amazon SageMaker autopilot bygger, tränar och justerar automatiskt de bästa maskininlärningsmodellerna (ML) baserat på dina data, samtidigt som du kan behålla full kontroll och synlighet. Vi har nyligen meddelat stöd för tidsseriedata i autopilot. Du kan använda autopilot för att hantera regressions- och klassificeringsuppgifter på tidsseriedata, eller sekvensdata i allmänhet. Tidsseriedata är en speciell typ av sekvensdata där datapunkter samlas in med jämna tidsintervall.

Att manuellt förbereda data, välja rätt ML-modell och optimera dess parametrar är en komplex uppgift, även för en expert. Även om det finns automatiserade tillvägagångssätt som kan hitta de bästa modellerna och deras parametrar, kan dessa vanligtvis inte hantera data som kommer som sekvenser, såsom nätverkstrafik, elförbrukning eller hushållsutgifter registrerade över tid. Eftersom dessa data tar formen av observationer som förvärvats vid olika tidpunkter, kan på varandra följande observationer inte behandlas som oberoende av varandra och måste bearbetas som en helhet. Du kan använda autopilot för ett brett spektrum av problem med sekventiell data. Du kan till exempel klassificera nätverkstrafik som registrerats över tid för att identifiera skadliga aktiviteter, eller avgöra om individer kvalificerar sig för ett bolån baserat på deras kredithistorik. Du tillhandahåller en datauppsättning som innehåller tidsseriedata och Autopilot hanterar resten, bearbetar sekventiell data genom specialiserade funktionsomvandlingar och hittar den bästa modellen för din räkning.

Autopilot eliminerar de tunga lyften av att bygga ML-modeller och hjälper dig att automatiskt bygga, träna och ställa in den bästa ML-modellen baserat på dina data. Autopiloten kör flera algoritmer på dina data och justerar deras hyperparametrar på en helt hanterad beräkningsinfrastruktur. I det här inlägget visar vi hur du kan använda Autopilot att lösa klassificerings- och regressionsproblem på tidsseriedata. För instruktioner om hur du skapar och tränar en autopilotmodell, se Förutsägelse av kunder med Amazon SageMaker Autopilot.

Klassificering av tidsseriedata med autopilot

Som ett löpande exempel betraktar vi ett flerklassproblem på tidsserien dataset UWaveGestureLibraryX, som innehåller ekvidistanta avläsningar av accelerometersensorer samtidigt som en av åtta fördefinierade handgester utförs. För enkelhetens skull betraktar vi endast X-dimensionen av accelerometern. Uppgiften är att bygga en klassificeringsmodell för att kartlägga tidsseriedata från sensoravläsningarna till de fördefinierade gesterna. Följande bild visar de första raderna i datamängden i CSV-format. Hela tabellen består av 896 rader och två kolumner: den första kolumnen är en gestetikett och den andra kolumnen är en tidsserie av sensoravläsningar.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Konvertera data till rätt format med Amazon SageMaker Data Wrangler

Utöver att acceptera numeriska, kategoriska och standardtextkolumner, accepterar Autopilot nu också en sekvensinmatningskolumn. Om dina tidsseriedata inte följer detta format kan du enkelt konvertera dem Amazon SageMaker Data Wrangler. Data Wrangler minskar tiden det tar att aggregera och förbereda data för ML från veckor till minuter. Med Data Wrangler kan du förenkla processen för dataförberedelse och funktionsutveckling och slutföra varje steg i dataförberedelsens arbetsflöde, inklusive dataurval, rensning, utforskning och visualisering från ett enda visuellt gränssnitt. Tänk till exempel på samma datauppsättning men i ett annat inmatningsformat: varje gest (specificerad av ID) är en sekvens av mätningar på samma avstånd av accelerometern. När den lagras vertikalt innehåller varje rad en tidsstämpel och ett värde. Följande figur jämför dessa data i sitt ursprungliga format och ett sekvensformat.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

För att konvertera denna datauppsättning till det format som beskrivits tidigare med Data Wrangler, ladda datauppsättningen från Amazon enkel lagringstjänst (Amazon S3). Använd sedan tidsserie Grupp efter transformation, som visas i följande skärmdump, och exportera data tillbaka till Amazon S3 i CSV-format.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

När datauppsättningen är i dess angivna format kan du fortsätta med autopilot. För att kolla in andra tidsserietransformatorer av Data Wrangler, se Förbered tidsseriedata med Amazon SageMaker Data Wrangler.

Starta ett AutoML-jobb

Som med andra inmatningstyper som stöds av autopilot, är varje rad i datamängden olika observationer och varje kolumn är en funktion. I det här exemplet har vi en enda kolumn som innehåller tidsseriedata, men du kan ha flera tidsseriekolumner. Du kan också ha flera kolumner med olika inmatningstyper, såsom tidsserier, text och numerisk.

Till skapa ett autopilotexperiment, placera datasetet i en S3-hink och skapa ett nytt experiment inom Amazon SageMaker Studio. Som visas i följande skärmdump måste du ange namnet på experimentet, S3-platsen för datamängden, S3-platsen för utdataartefakterna och kolumnnamnet för att förutsäga.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Autopilot analyserar data, genererar ML-pipelines och kör 250 standard iterationer av hyperparameteroptimering på denna klassificeringsuppgift. Som visas i följande modelltavla når autopiloten en noggrannhet på 0.821, och du kan använda den bästa modellen med bara ett klick.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Dessutom genererar autopilot en datautforskningsrapport, där du kan visualisera och utforska din data.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Transparens är grunden för autopilot. Du kan inspektera och modifiera genererade ML-pipelines i anteckningsboken för kandidatdefinition. Följande skärmdump visar hur Autopilot rekommenderar en rad pipelines, som kombinerar tidsserietransformatorn TSFeatureExtractor med olika ML-algoritmer, såsom gradientförstärkta beslutsträd och linjära modeller. De TSFeatureExtractor extraherar hundratals tidsseriefunktioner åt dig, som sedan matas till nedströmsalgoritmerna för att göra förutsägelser. För hela listan över tidsseriefunktioner, se Översikt över extraherade funktioner.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Slutsats

I det här inlägget demonstrerade vi hur man använder SageMaker Autopilot för att lösa tidsserieklassificering och regressionsproblem med bara några klick.

För mer information om autopilot, se Amazon SageMaker autopilot. För att utforska relaterade funktioner i SageMaker, se Amazon SageMaker Data Wrangler.


Om författarna

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.Nikita Ivkin är en tillämpad forskare, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.Anne Milbert är en mjukvaruutvecklingsingenjör som arbetar med Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.Valerio Perrone är en Applied Science Manager som arbetar med Amazon SageMaker Automatic Model Tuning och Autopilot.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.Meghana Satish är en mjukvaruutvecklingsingenjör som arbetar med Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot stöder nu tidsseriedata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai. Ali Takbiri är en AI/ML-specialist Solutions Architect och hjälper kunder genom att använda Machine Learning för att lösa deras affärsutmaningar på AWS-molnet.

Tidsstämpel:

Mer från AWS maskininlärning