Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Amazon SageMaker Autopilot acceptă acum date din seria temporală

Pilot automat cu Amazon SageMaker creează, antrenează și reglează automat cele mai bune modele de învățare automată (ML) pe baza datelor dvs., permițându-vă în același timp să mențineți controlul și vizibilitatea deplină. Am anunțat recent suport pentru datele serii temporale în Autopilot. Puteți folosi Autopilot pentru a aborda sarcinile de regresie și clasificare pe date din seria temporală sau date secvențe în general. Datele din seria temporală sunt un tip special de date secvențe în care punctele de date sunt colectate la intervale de timp egale.

Pregătirea manuală a datelor, selectarea modelului ML potrivit și optimizarea parametrilor acestuia este o sarcină complexă, chiar și pentru un practician expert. Deși există abordări automate care pot găsi cele mai bune modele și parametrii acestora, acestea de obicei nu pot gestiona datele care apar ca secvențe, cum ar fi traficul în rețea, consumul de energie electrică sau cheltuielile casnice înregistrate în timp. Deoarece aceste date iau forma unor observații dobândite în momente diferite, observațiile consecutive nu pot fi tratate ca independente unele de altele și trebuie procesate ca un întreg. Puteți utiliza Autopilot pentru o gamă largă de probleme care se ocupă de date secvențiale. De exemplu, puteți clasifica traficul de rețea înregistrat de-a lungul timpului pentru a identifica activitățile rău intenționate sau puteți determina dacă persoanele se califică pentru un credit ipotecar pe baza istoricului lor de credit. Furnizi un set de date care conține date din seria temporală, iar Autopilot se ocupă de restul, procesând datele secvențiale prin transformări de caracteristici specializate și găsind cel mai bun model în numele tău.

Autopilot elimină greutățile legate de construirea modelelor ML și vă ajută să construiți, antrenați și reglați automat cel mai bun model ML pe baza datelor dvs. Autopilot rulează mai mulți algoritmi pe datele dvs. și își reglează hiperparametrii pe o infrastructură de calcul complet gestionată. În această postare, vă demonstrăm cum puteți utiliza Autopilot pentru a rezolva probleme de clasificare și regresie pe date din seria temporală. Pentru instrucțiuni despre crearea și antrenamentul unui model Autopilot, consultați Prognoză de reducere a clienților cu pilotul automat Amazon SageMaker.

Clasificarea datelor serii temporale folosind Autopilot

Ca exemplu de funcționare, luăm în considerare o problemă cu mai multe clase pe seria de timp date CCD UWaveGestureLibraryX, care conține citiri echidistante ale senzorilor de accelerometru în timp ce efectuează unul dintre cele opt gesturi ale mâinii predefinite. Pentru simplitate, luăm în considerare doar dimensiunea X a accelerometrului. Sarcina este de a construi un model de clasificare pentru a mapa datele din seria temporală de la citirile senzorului la gesturile predefinite. Următoarea figură prezintă primele rânduri ale setului de date în format CSV. Întregul tabel este format din 896 de rânduri și două coloane: prima coloană este o etichetă de gest și a doua coloană este o serie temporală de citiri ale senzorului.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Convertiți datele în formatul potrivit cu Amazon SageMaker Data Wrangler

Pe lângă acceptarea coloanelor de text numerice, categoriale și standard, Autopilot acceptă acum și o coloană de introducere a secvenței. Dacă datele din seria temporală nu urmează acest format, le puteți converti cu ușurință Amazon SageMaker Data Wrangler. Data Wrangler reduce timpul necesar pentru agregarea și pregătirea datelor pentru ML de la săptămâni la minute. Cu Data Wrangler, puteți simplifica procesul de pregătire a datelor și de inginerie a caracteristicilor și puteți finaliza fiecare pas al fluxului de lucru de pregătire a datelor, inclusiv selecția datelor, curățarea, explorarea și vizualizarea dintr-o singură interfață vizuală. De exemplu, luați în considerare același set de date, dar într-un format de intrare diferit: fiecare gest (specificat prin ID) este o secvență de măsurători echidistante ale accelerometrului. Când este stocat pe verticală, fiecare rând conține un marcaj de timp și o valoare. Următoarea figură compară aceste date în formatul inițial și un format secvență.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Pentru a converti acest set de date în formatul descris mai devreme folosind Data Wrangler, încărcați setul de date din Serviciul Amazon de stocare simplă (Amazon S3). Apoi utilizați seria temporală Gruparea după transformare, așa cum se arată în următoarea captură de ecran și exportați datele înapoi în Amazon S3 în format CSV.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Când setul de date este în formatul desemnat, puteți continua cu Autopilot. Pentru a verifica alte transformatoare din serii de timp ale Data Wrangler, consultați Pregătiți datele serii cronologice cu Amazon SageMaker Data Wrangler.

Lansați o lucrare AutoML

Ca și în cazul altor tipuri de intrare acceptate de Autopilot, fiecare rând al setului de date este o observație diferită și fiecare coloană este o caracteristică. În acest exemplu, avem o singură coloană care conține date de serie de timp, dar puteți avea mai multe coloane de serie de timp. De asemenea, puteți avea mai multe coloane cu diferite tipuri de introducere, cum ar fi serii cronologice, text și numere.

La creați un experiment Autopilot, plasați setul de date într-un compartiment S3 și creați un nou experiment în interior Amazon SageMaker Studio. După cum se arată în următoarea captură de ecran, trebuie să specificați numele experimentului, locația S3 a setului de date, locația S3 pentru artefactele de ieșire și numele coloanei de prezis.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Autopilot analizează datele, generează conducte ML și rulează implicit 250 de iterații de optimizare a hiperparametrilor pentru această sarcină de clasificare. După cum se arată în următorul clasament al modelului, Autopilot atinge o precizie de 0.821 și puteți implementa cel mai bun model cu un singur clic.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

În plus, Autopilot generează un raport de explorare a datelor, unde vă puteți vizualiza și explora datele.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Transparența este fundamentală pentru Autopilot. Puteți inspecta și modifica conductele ML generate în caietul de definiții al candidatului. Următoarea captură de ecran demonstrează modul în care Autopilot recomandă o serie de conducte, combinând transformatorul în serie de timp TSFeatureExtractor cu diferiți algoritmi ML, cum ar fi arbori de decizie cu gradient și modele liniare. The TSFeatureExtractor extrage sute de caracteristici din seria temporală pentru dvs., care sunt apoi transmise algoritmilor din aval pentru a face predicții. Pentru lista completă a caracteristicilor seriilor de timp, consultați Prezentare generală asupra caracteristicilor extrase.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Concluzie

În această postare, am demonstrat cum să folosiți SageMaker Autopilot pentru a rezolva problemele de clasificare și regresie a seriilor de timp în doar câteva clicuri.

Pentru mai multe informații despre Autopilot, consultați Pilot automat cu Amazon SageMaker. Pentru a explora funcțiile conexe ale SageMaker, consultați Amazon SageMaker Data Wrangler.


Despre Autori

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Nikita Ivkin este un om de știință aplicat, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Anne Milbert este un inginer de dezvoltare software care lucrează la Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Valerio Perrone este un manager de știință aplicată care lucrează la Amazon SageMaker Automatic Model Tuning și Autopilot.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Meghana Satish este un inginer de dezvoltare software care lucrează la Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot acceptă acum datele din seria temporală PlatoBlockchain Data Intelligence. Căutare verticală. Ai. Ali Takbiri este un arhitect de soluții specializat în AI/ML și ajută clienții folosind Machine Learning pentru a-și rezolva provocările de afaceri pe AWS Cloud.

Timestamp-ul:

Mai mult de la Învățare automată AWS