Amazonski SageMaker avtopilot samodejno gradi, usposablja in prilagaja najboljše modele strojnega učenja (ML) na podlagi vaših podatkov, hkrati pa vam omogoča, da ohranite popoln nadzor in vidljivost. Nedavno smo objavili podpora za podatke časovnih vrst v avtopilotu. Avtopilot lahko uporabite za reševanje nalog regresije in klasifikacije podatkov o časovni vrsti ali podatkov zaporedja na splošno. Podatki o časovni vrsti so posebna vrsta zaporednih podatkov, kjer se podatkovne točke zbirajo v enakih časovnih intervalih.
Ročna priprava podatkov, izbira pravega modela ML in optimizacija njegovih parametrov je zapletena naloga tudi za strokovnjaka. Čeprav obstajajo avtomatizirani pristopi, ki lahko najdejo najboljše modele in njihove parametre, ti običajno ne morejo obravnavati podatkov, ki prihajajo kot zaporedja, kot so omrežni promet, poraba električne energije ali gospodinjski stroški, zabeleženi skozi čas. Ker so ti podatki v obliki opazovanj, pridobljenih v različnih časovnih točkah, zaporednih opazovanj ni mogoče obravnavati kot neodvisnih drug od drugega in jih je treba obdelati kot celoto. Avtopilot lahko uporabite za širok spekter težav z zaporednimi podatki. Na primer, lahko razvrstite omrežni promet, zabeležen skozi čas, da prepoznate zlonamerne dejavnosti ali ugotovite, ali so posamezniki upravičeni do hipoteke na podlagi njihove kreditne zgodovine. Vi zagotovite nabor podatkov, ki vsebuje podatke o časovni vrsti, Autopilot pa poskrbi za ostalo, obdela zaporedne podatke s posebnimi transformacijami funkcij in poišče najboljši model v vašem imenu.
Avtopilot odpravi težko delo pri gradnji modelov ML in vam pomaga samodejno zgraditi, usposobiti in prilagoditi najboljši model ML na podlagi vaših podatkov. Avtopilot izvaja več algoritmov na vaših podatkih in prilagaja njihove hiperparametre na popolnoma upravljani računalniški infrastrukturi. V tej objavi prikazujemo, kako lahko uporabite Avtopilot za reševanje težav s klasifikacijo in regresijo podatkov časovnih vrst. Za navodila o ustvarjanju in usposabljanju modela avtopilota glejte Napovedovanje odliva strank z avtopilotom Amazon SageMaker.
Klasifikacija podatkov časovnih vrst z uporabo avtopilota
Kot tekoči primer obravnavamo večrazredni problem na časovni vrsti nabor podatkov UWaveGestureLibraryX, ki vsebuje ekvidistančne odčitke senzorjev merilnika pospeška med izvajanjem ene od osmih vnaprej določenih potez z roko. Zaradi poenostavitve upoštevamo samo X dimenzijo merilnika pospeška. Naloga je zgraditi klasifikacijski model za preslikavo podatkov časovne serije iz odčitkov senzorja v vnaprej določene poteze. Naslednja slika prikazuje prve vrstice nabora podatkov v formatu CSV. Celotna tabela je sestavljena iz 896 vrstic in dveh stolpcev: prvi stolpec je oznaka geste, drugi stolpec pa časovna serija odčitkov senzorjev.
Pretvorite podatke v pravo obliko z Amazon SageMaker Data Wrangler
Poleg tega, da sprejema številčne, kategorične in standardne besedilne stolpce, Autopilot zdaj sprejema tudi stolpec zaporednega vnosa. Če vaši podatki o časovni vrsti ne sledijo tej obliki, jih lahko preprosto pretvorite Amazon SageMaker Data Wrangler. Data Wrangler zmanjša čas, potreben za združevanje in pripravo podatkov za ML, s tednov na minute. Z Data Wranglerjem lahko poenostavite postopek priprave podatkov in inženiringa funkcij ter dokončate vsak korak delovnega toka priprave podatkov, vključno z izbiro podatkov, čiščenjem, raziskovanjem in vizualizacijo iz enega samega vizualnega vmesnika. Na primer, razmislite o istem naboru podatkov, vendar v drugačni obliki vnosa: vsaka poteza (določena z ID-jem) je zaporedje enako oddaljenih meritev merilnika pospeška. Ko je shranjena navpično, vsaka vrstica vsebuje časovni žig in eno vrednost. Naslednja slika primerja te podatke v izvirni obliki in obliki zaporedja.
Če želite pretvoriti ta nabor podatkov v prej opisano obliko z uporabo Data Wranglerja, naložite nabor podatkov iz Preprosta storitev shranjevanja Amazon (Amazon S3). Nato uporabite časovna vrsta Združi po transformaciji, kot je prikazano na naslednjem posnetku zaslona, in izvozite podatke nazaj v Amazon S3 v formatu CSV.
Ko je nabor podatkov v določeni obliki, lahko nadaljujete z avtopilotom. Če želite preveriti druge transformatorje časovnih vrst programa Data Wrangler, glejte Pripravite podatke o časovni vrsti z Amazon SageMaker Data Wrangler.
Zaženite opravilo AutoML
Kot pri drugih vrstah vnosa, ki jih podpira avtopilot, je vsaka vrstica nabora podatkov drugačno opazovanje in vsak stolpec je funkcija. V tem primeru imamo en sam stolpec, ki vsebuje podatke o časovni vrsti, lahko pa imate več stolpcev časovne vrste. Imate lahko tudi več stolpcev z različnimi vrstami vnosa, kot so časovne vrste, besedilo in številke.
Da ustvarite eksperiment z avtopilotom, postavite nabor podatkov v vedro S3 in v njem ustvarite nov poskus Amazon SageMaker Studio. Kot je prikazano na naslednjem posnetku zaslona, morate določiti ime poskusa, lokacijo S3 nabora podatkov, lokacijo S3 za izhodne artefakte in ime stolpca za predvidevanje.
Avtopilot analizira podatke, ustvari cevovode ML in izvede privzetih 250 iteracij optimizacije hiperparametrov za to nalogo klasifikacije. Kot je prikazano na naslednji lestvici najboljših modelov, avtopilot dosega natančnost 0.821 in najboljši model lahko uvedete z enim klikom.
Poleg tega avtopilot ustvari a poročilo o raziskovanju podatkov, kjer lahko vizualizirate in raziskujete svoje podatke.
Preglednost je temelj za avtopilot. Ustvarjene cevovode ML lahko pregledate in spremenite v zvezku z definicijo kandidatov. Naslednji posnetek zaslona prikazuje, kako avtopilot priporoča vrsto cevovodov, ki združujejo transformator časovnih vrst TSFeatureExtractor
z različnimi algoritmi ML, kot so odločitvena drevesa z gradientom in linearni modeli. The TSFeatureExtractor
za vas izvleče na stotine funkcij časovnih vrst, ki se nato posredujejo algoritmom na nižji stopnji za izdelavo napovedi. Za celoten seznam funkcij časovnih vrst glejte Pregled ekstrahiranih funkcij.
zaključek
V tej objavi smo pokazali, kako uporabiti SageMaker Autopilot za reševanje težav s klasifikacijo časovnih vrst in regresijo v samo nekaj klikih.
Za več informacij o avtopilotu glejte Amazonski SageMaker avtopilot. Če želite raziskati povezane funkcije SageMaker, glejte Amazon SageMaker Data Wrangler.
O avtorjih
Nikita Ivkin je uporabni znanstvenik, Amazon SageMaker Data Wrangler.
Anne Milbert je inženir za razvoj programske opreme, ki dela na Amazon SageMaker Automatic Model Tuning.
Valerio Perrone je vodja uporabne znanosti, ki dela na avtomatski nastavitvi modela in avtopilotu Amazon SageMaker.
Meghana Satish je inženir za razvoj programske opreme, ki dela na Amazon SageMaker Automatic Model Tuning.
Ali Takbiri je specialist za AI/ML Solutions Architect in strankam pomaga z uporabo strojnega učenja pri reševanju njihovih poslovnih izzivov v oblaku AWS.
- "
- 100
- O meni
- pridobljenih
- dejavnosti
- algoritmi
- Dovoli
- Čeprav
- Amazon
- razglasitve
- Avtomatizirano
- AWS
- BEST
- Povečana
- izgradnjo
- Building
- Gradi
- poslovni
- izzivi
- Razvrstitev
- Cloud
- Stolpec
- kompleksna
- Izračunajte
- zaporedna
- poraba
- Vsebuje
- nadzor
- Ustvarjanje
- kredit
- Stranke, ki so
- datum
- deliti
- razporedi
- Razvoj
- drugačen
- Dimenzije
- Ne
- enostavno
- elektrika
- inženir
- Inženiring
- Primer
- Stroški
- poskus
- raziskovanje
- Izvlečki
- Feature
- Lastnosti
- Fed
- Slika
- prva
- sledi
- po
- obrazec
- format
- polno
- splošno
- skupina
- Pomaga
- zgodovina
- gospodinjstvo
- Kako
- Kako
- HTTPS
- Stotine
- identificirati
- Vključno
- Podatki
- Infrastruktura
- vmesnik
- IT
- učenje
- Seznam
- obremenitev
- kraj aktivnosti
- stroj
- strojno učenje
- upravitelj
- map
- ML
- Model
- modeli
- mreža
- omrežni promet
- prenosnik
- optimizacija
- Ostalo
- napoved
- Napovedi
- problem
- Težave
- Postopek
- zagotavljajo
- območje
- priporoča
- REST
- tek
- Znanost
- Znanstvenik
- Serija
- Enostavno
- Software
- Razvoj programske opreme
- rešitve
- SOLVE
- specializirani
- shranjevanje
- Podprti
- Podpira
- Naloge
- skozi
- čas
- vrh
- Prometa
- usposabljanje
- vlaki
- uporaba
- vrednost
- vidljivost
- vizualizacija
- v
- deluje
- X