Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Avtopilot Amazon SageMaker zdaj podpira podatke o časovnih serijah

Amazonski SageMaker avtopilot samodejno gradi, usposablja in prilagaja najboljše modele strojnega učenja (ML) na podlagi vaših podatkov, hkrati pa vam omogoča, da ohranite popoln nadzor in vidljivost. Nedavno smo objavili podpora za podatke časovnih vrst v avtopilotu. Avtopilot lahko uporabite za reševanje nalog regresije in klasifikacije podatkov o časovni vrsti ali podatkov zaporedja na splošno. Podatki o časovni vrsti so posebna vrsta zaporednih podatkov, kjer se podatkovne točke zbirajo v enakih časovnih intervalih.

Ročna priprava podatkov, izbira pravega modela ML in optimizacija njegovih parametrov je zapletena naloga tudi za strokovnjaka. Čeprav obstajajo avtomatizirani pristopi, ki lahko najdejo najboljše modele in njihove parametre, ti običajno ne morejo obravnavati podatkov, ki prihajajo kot zaporedja, kot so omrežni promet, poraba električne energije ali gospodinjski stroški, zabeleženi skozi čas. Ker so ti podatki v obliki opazovanj, pridobljenih v različnih časovnih točkah, zaporednih opazovanj ni mogoče obravnavati kot neodvisnih drug od drugega in jih je treba obdelati kot celoto. Avtopilot lahko uporabite za širok spekter težav z zaporednimi podatki. Na primer, lahko razvrstite omrežni promet, zabeležen skozi čas, da prepoznate zlonamerne dejavnosti ali ugotovite, ali so posamezniki upravičeni do hipoteke na podlagi njihove kreditne zgodovine. Vi zagotovite nabor podatkov, ki vsebuje podatke o časovni vrsti, Autopilot pa poskrbi za ostalo, obdela zaporedne podatke s posebnimi transformacijami funkcij in poišče najboljši model v vašem imenu.

Avtopilot odpravi težko delo pri gradnji modelov ML in vam pomaga samodejno zgraditi, usposobiti in prilagoditi najboljši model ML na podlagi vaših podatkov. Avtopilot izvaja več algoritmov na vaših podatkih in prilagaja njihove hiperparametre na popolnoma upravljani računalniški infrastrukturi. V tej objavi prikazujemo, kako lahko uporabite Avtopilot za reševanje težav s klasifikacijo in regresijo podatkov časovnih vrst. Za navodila o ustvarjanju in usposabljanju modela avtopilota glejte Napovedovanje odliva strank z avtopilotom Amazon SageMaker.

Klasifikacija podatkov časovnih vrst z uporabo avtopilota

Kot tekoči primer obravnavamo večrazredni problem na časovni vrsti nabor podatkov UWaveGestureLibraryX, ki vsebuje ekvidistančne odčitke senzorjev merilnika pospeška med izvajanjem ene od osmih vnaprej določenih potez z roko. Zaradi poenostavitve upoštevamo samo X dimenzijo merilnika pospeška. Naloga je zgraditi klasifikacijski model za preslikavo podatkov časovne serije iz odčitkov senzorja v vnaprej določene poteze. Naslednja slika prikazuje prve vrstice nabora podatkov v formatu CSV. Celotna tabela je sestavljena iz 896 vrstic in dveh stolpcev: prvi stolpec je oznaka geste, drugi stolpec pa časovna serija odčitkov senzorjev.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Pretvorite podatke v pravo obliko z Amazon SageMaker Data Wrangler

Poleg tega, da sprejema številčne, kategorične in standardne besedilne stolpce, Autopilot zdaj sprejema tudi stolpec zaporednega vnosa. Če vaši podatki o časovni vrsti ne sledijo tej obliki, jih lahko preprosto pretvorite Amazon SageMaker Data Wrangler. Data Wrangler zmanjša čas, potreben za združevanje in pripravo podatkov za ML, s tednov na minute. Z Data Wranglerjem lahko poenostavite postopek priprave podatkov in inženiringa funkcij ter dokončate vsak korak delovnega toka priprave podatkov, vključno z izbiro podatkov, čiščenjem, raziskovanjem in vizualizacijo iz enega samega vizualnega vmesnika. Na primer, razmislite o istem naboru podatkov, vendar v drugačni obliki vnosa: vsaka poteza (določena z ID-jem) je zaporedje enako oddaljenih meritev merilnika pospeška. Ko je shranjena navpično, vsaka vrstica vsebuje časovni žig in eno vrednost. Naslednja slika primerja te podatke v izvirni obliki in obliki zaporedja.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Če želite pretvoriti ta nabor podatkov v prej opisano obliko z uporabo Data Wranglerja, naložite nabor podatkov iz Preprosta storitev shranjevanja Amazon (Amazon S3). Nato uporabite časovna vrsta Združi po transformaciji, kot je prikazano na naslednjem posnetku zaslona, ​​in izvozite podatke nazaj v Amazon S3 v formatu CSV.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ko je nabor podatkov v določeni obliki, lahko nadaljujete z avtopilotom. Če želite preveriti druge transformatorje časovnih vrst programa Data Wrangler, glejte Pripravite podatke o časovni vrsti z Amazon SageMaker Data Wrangler.

Zaženite opravilo AutoML

Kot pri drugih vrstah vnosa, ki jih podpira avtopilot, je vsaka vrstica nabora podatkov drugačno opazovanje in vsak stolpec je funkcija. V tem primeru imamo en sam stolpec, ki vsebuje podatke o časovni vrsti, lahko pa imate več stolpcev časovne vrste. Imate lahko tudi več stolpcev z različnimi vrstami vnosa, kot so časovne vrste, besedilo in številke.

Da ustvarite eksperiment z avtopilotom, postavite nabor podatkov v vedro S3 in v njem ustvarite nov poskus Amazon SageMaker Studio. Kot je prikazano na naslednjem posnetku zaslona, ​​morate določiti ime poskusa, lokacijo S3 nabora podatkov, lokacijo S3 za izhodne artefakte in ime stolpca za predvidevanje.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Avtopilot analizira podatke, ustvari cevovode ML in izvede privzetih 250 iteracij optimizacije hiperparametrov za to nalogo klasifikacije. Kot je prikazano na naslednji lestvici najboljših modelov, avtopilot dosega natančnost 0.821 in najboljši model lahko uvedete z enim klikom.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Poleg tega avtopilot ustvari a poročilo o raziskovanju podatkov, kjer lahko vizualizirate in raziskujete svoje podatke.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Preglednost je temelj za avtopilot. Ustvarjene cevovode ML lahko pregledate in spremenite v zvezku z definicijo kandidatov. Naslednji posnetek zaslona prikazuje, kako avtopilot priporoča vrsto cevovodov, ki združujejo transformator časovnih vrst TSFeatureExtractor z različnimi algoritmi ML, kot so odločitvena drevesa z gradientom in linearni modeli. The TSFeatureExtractor za vas izvleče na stotine funkcij časovnih vrst, ki se nato posredujejo algoritmom na nižji stopnji za izdelavo napovedi. Za celoten seznam funkcij časovnih vrst glejte Pregled ekstrahiranih funkcij.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

zaključek

V tej objavi smo pokazali, kako uporabiti SageMaker Autopilot za reševanje težav s klasifikacijo časovnih vrst in regresijo v samo nekaj klikih.

Za več informacij o avtopilotu glejte Amazonski SageMaker avtopilot. Če želite raziskati povezane funkcije SageMaker, glejte Amazon SageMaker Data Wrangler.


O avtorjih

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.Nikita Ivkin je uporabni znanstvenik, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.Anne Milbert je inženir za razvoj programske opreme, ki dela na Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.Valerio Perrone je vodja uporabne znanosti, ki dela na avtomatski nastavitvi modela in avtopilotu Amazon SageMaker.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.Meghana Satish je inženir za razvoj programske opreme, ki dela na Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai. Ali Takbiri je specialist za AI/ML Solutions Architect in strankam pomaga z uporabo strojnega učenja pri reševanju njihovih poslovnih izzivov v oblaku AWS.

Časovni žig:

Več od Strojno učenje AWS