Valmistage ette aegridade andmed rakendusega Amazon SageMaker Data Wrangler

Taasavaldanud Platon

järgijaid: 0

Aegridade andmed on meie elus laialdaselt kohal. Aktsiahinnad, majade hinnad, ilmateave ja aja jooksul kogutud müügiandmed on vaid mõned näited. Kuna ettevõtted otsivad üha enam uusi viise aegridade andmete põhjal sisulise ülevaate saamiseks, on andmete visualiseerimine ja soovitud teisenduste rakendamine olulised sammud. Kuid aegridade andmetel on võrreldes muud tüüpi tabeliandmetega ainulaadsed omadused ja nüansid ning need nõuavad erilisi kaalutlusi. Näiteks kogutakse kindlal ajahetkel standardseid tabeli- või ristlõikeandmeid. Seevastu aegridade andmeid kogutakse aja jooksul korduvalt, kusjuures iga järgnev andmepunkt sõltub selle varasematest väärtustest.

Kuna enamik aegridade analüüse tugineb külgnevate vaatluste kogumi kaudu kogutud teabele, võivad puuduvad andmed ja loomupärane hõredus vähendada prognooside täpsust ja põhjustada eelarvamusi. Lisaks tugineb enamik aegridade analüüsi lähenemisviise andmepunktide vahelisele võrdsele kaugusele, teisisõnu perioodilisusele. Seetõttu on andmete vahekauguse ebakorrapärasuste parandamine ülioluline eeltingimus. Lõpuks nõuab aegridade analüüs sageli lisafunktsioonide loomist, mis aitavad selgitada sisendandmete ja tulevikuprognooside vahelist seost. Kõik need tegurid eristavad aegridade projekte traditsioonilistest masinõppe (ML) stsenaariumidest ja nõuavad selle analüüsile selget lähenemist.

See postitus kirjeldab, kuidas seda kasutada Amazon SageMaker Data Wrangler aegridade teisenduste rakendamiseks ja andmestiku ettevalmistamiseks aegridade kasutusjuhtude jaoks.

Data Wrangleri kasutusjuhtumid

Data Wrangler pakub aegridade analüüsi koodivaba/madala koodiga lahendust koos funktsioonidega andmete kiiremaks puhastamiseks, teisendamiseks ja ettevalmistamiseks. Samuti võimaldab see andmeteadlastel koostada aegridade andmeid vastavalt prognoosimudeli sisendvormingu nõuetele. Järgmised on mõned viisid, kuidas neid võimalusi kasutada.

Kirjeldav analüüs– Tavaliselt on mis tahes andmeteaduse projekti esimene samm andmete mõistmine. Kui joonistame aegridade andmeid, saame kõrgetasemelise ülevaate nende mustritest, nagu trend, hooajalisus, tsüklid ja juhuslikud variatsioonid. See aitab meil otsustada õige prognoosimismetoodika nende mustrite täpseks esitamiseks. Joonistamine võib samuti aidata tuvastada kõrvalekaldeid, hoides ära ebarealistlikud ja ebatäpsed prognoosid. Data Wrangleriga on kaasas a hooajalisuse-trendi lagunemise visualiseerimine aegrea komponentide esitamiseks ja an kõrvalekallete tuvastamise visualiseerimine kõrvalekallete tuvastamiseks.
Selgitav analüüs– Mitme muutujaga aegridade puhul on sisukate prognooside saamiseks oluline võimalus uurida, tuvastada ja modelleerida kahe või enama aegrea vahelist seost. The Grupi poolt Transform in Data Wrangler loob mitu aegrida, rühmitades andmed määratud lahtrite jaoks. Lisaks võimaldavad Data Wrangleri aegridade teisendused vajaduse korral täpsustada täiendavaid ID-veerge, mida rühmitada, võimaldades keerukat aegridade analüüsi.
Andmete ettevalmistamine ja funktsioonide projekteerimine– Aegridade andmed on harva aegridade mudelite ootuspärases vormingus. Toorandmete teisendamiseks aegreaspetsiifilisteks funktsioonideks on sageli vaja andmete ettevalmistamist. Võib-olla soovite enne analüüsi kinnitada, et aegridade andmed on korrapäraselt või võrdsete vahedega. Kasutusjuhtude prognoosimiseks võite soovida lisada ka täiendavaid aegridade omadusi, nagu autokorrelatsioon ja statistilised omadused. Data Wrangleri abil saate kiiresti luua aegrea funktsioone, nagu viivitusveerud mitme viivitusperioodi jaoks, võtta andmeid uuesti mitme ajalise detaili järgi ja eraldada automaatselt aegrea statistilised omadused, et nimetada mõnda võimalust.

Lahenduse ülevaade

Selles postituses selgitatakse, kuidas andmeteadlased ja analüütikud saavad Data Wranglerit kasutada aegridade andmete visualiseerimiseks ja ettevalmistamiseks. Kasutame bitcoini krüptovaluutade andmestikku krüptoandmete allalaadimine koos bitcoinidega kauplemise üksikasjadega, et neid võimalusi tutvustada. Puhastame, valideerime ja teisendame toorandmestiku aegridade funktsioonidega ning genereerime ka bitcoinide mahuhinna prognoose, kasutades sisendina teisendatud andmekogumit.

Bitcoini kauplemisandmete näidis on 1. jaanuarist 19. novembrini 2021, 464,116 XNUMX andmepunktiga. Andmestiku atribuudid hõlmavad hinnakirje ajatemplit, avamis- või esimest hinda, millega münt konkreetsel päeval vahetati, kõrgeimat hinda, millega münt sellel päeval vahetati, viimast hinda, millega münt vahetati päev, päeval vahetatud maht krüptovaluuta väärtuses BTC-s ja vastav USD valuuta.

Eeldused

Lae alla Bitstamp_BTCUSD_2021_minute.csv fail alates krüptoandmete allalaadimine ja laadige see üles Amazon Simple Storage Service (Amazon S3).

Importige bitcoini andmestik Data Wranglerisse

Data Wrangleri sisestusprotsessi alustamiseks toimige järgmiselt.

Kohta SageMakeri stuudio konsoolil fail menüüst valige Uus, siis vali Data Wrangleri voog.
Nimetage voog vastavalt soovile ümber.
eest Andmete importimine, vali Amazon S3.
Laadige üles Bitstamp_BTCUSD_2021_minute.csv faili oma S3 ämbrist.

Nüüd saate oma andmekogumit eelvaadata.

aasta Detailid paneel, valige Täpsem konfiguratsioon ja tühistage valik Luba proovivõtt.

See on suhteliselt väike andmekogum, nii et me ei vaja valimit.

Vali Import.

Olete edukalt loonud vooskeemi ja olete valmis teisendusetappe lisama.

Lisage teisendusi

Andmete teisenduste lisamiseks valige kõrval olev plussmärk Andmetüübid Ja vali Andmetüüpide muutmine.

Veenduge, et Data Wrangler tuletas andmeveergude jaoks automaatselt õiged andmetüübid.

Meie puhul on tuletatud andmetüübid õiged. Oletame aga, et üks andmetüüp oli vale. Saate neid hõlpsasti kasutajaliidese kaudu muuta, nagu on näidatud järgmisel ekraanipildil.

muuta ja vaadata üle andmetüüpe

Alustame analüüsiga ja alustame teisenduste lisamist.

Andmete puhastamine

Esmalt teostame mitu andmete puhastamise teisendust.

Langetage veerg

Alustame kukutades unix veerus, sest me kasutame date veergu indeksina.

Vali Tagasi andmevoo juurde.
Valige kõrval olev plussmärk Andmetüübid Ja vali Lisa teisendus.
Vali + Lisa samm aasta MUUNDAB pane.
Vali Veergude haldamine.
eest Muutma, vali Langetage veerg.
eest Veerg, mida kukutada, vali unix.
Vali Eelvaade.
Vali lisama sammu salvestamiseks.

Käepide puudu

Puuduvad andmed on reaalmaailma andmekogumites hästi tuntud probleem. Seetõttu on parim tava kontrollida puuduvate või nullväärtuste olemasolu ja neid asjakohaselt käsitleda. Meie andmestik ei sisalda puuduvaid väärtusi. Aga kui oleks, siis kasutaksime Käepide puudu aegridade teisendamine, et neid parandada. Tavaliselt kasutatavad puuduvate andmete käsitlemise strateegiad hõlmavad puuduvate väärtustega ridade mahajätmist või puuduvate väärtuste täitmist mõistlike hinnangutega. Kuna aegridade andmed põhinevad andmepunktide järjestusel aja jooksul, on eelistatud lähenemisviis puuduvate väärtuste täitmine. Puuduvate väärtuste täitmise protsessi nimetatakse imputeerimine. Käepide puudu aegridade teisendus võimaldab teil valida mitme imputeerimisstrateegia vahel.

Vali + Lisa samm aasta MUUNDAB pane.
Vali Ajaseeria teisendada.
eest Muutma, Vali Käepide puudu.
eest Aegridade sisendi tüüp, vali Mööda kolonni.
eest Väärtuste arvutamise meetod, vali Edasi täitmine.

. Edasi täitmine meetod asendab puuduvad väärtused puuduvatele väärtustele eelnevate mittepuuduvate väärtustega.

käsitleda puuduvate aegridade teisendust

Tagurpidi täitmine, Püsiv väärtus, Kõige tavalisem väärtus ja Interpoleerida on Data Wrangleris saadaval ka muid imputeerimisstrateegiaid. Interpolatsioonitehnikad toetuvad puuduvate väärtuste täitmiseks naaberväärtustele. Aegridade andmed näitavad sageli korrelatsiooni naaberväärtuste vahel, muutes interpoleerimise tõhusaks täitmisstrateegiaks. Lisateavet funktsioonide kohta, mida saate interpolatsiooni rakendamiseks kasutada, leiate jaotisest pandas.DataFrame.interpoleerida.

Kinnitage ajatempel

Aegridade analüüsis toimib ajatempli veerg indeksi veeruna, mille ümber analüüs keerleb. Seetõttu on oluline veenduda, et ajatempli veerg ei sisaldaks kehtetuid või valesti vormindatud ajatempli väärtusi. Kuna me kasutame date veergu ajatempli veeru ja indeksina, veendugem, et selle väärtused on õigesti vormindatud.

Vali + Lisa samm aasta MUUNDAB pane.
Vali Ajaseeria teisendada.
eest Ümber, valima Kinnitage ajatemplid.

. Kinnitage ajatemplid Teisendus võimaldab teil kontrollida, et teie andmestiku ajatempli veerus poleks vale ajatempliga väärtusi või puuduvaid väärtusi.

eest Ajatempli veerg, vali andmed.
eest Poliitika rippmenüüst, valige Märkige.

. Märkige poliitikavalik loob Boole'i veeru, mis näitab, kas ajatempli veerus olev väärtus on kehtiv kuupäeva/kellaaja vorming. Muud võimalused Poliitika järgmised:

viga – Viskab vea, kui ajatempli veerg puudub või on kehtetu
Drop – Loobub rea, kui ajatempli veerg puudub või on kehtetu

Vali Eelvaade.

Uus Boole'i veerg nimega date_is_valid loodi, koos true väärtused, mis näitavad õiget vormingut ja mitte-null kirjeid. Meie andmestik ei sisalda valesid ajatempli väärtusi date veerg. Aga kui see nii oleks, võiksite nende väärtuste tuvastamiseks ja parandamiseks kasutada uut Boole'i veergu.

Ajatempli aegridade teisenduse kinnitamine

Vali lisama selle sammu salvestamiseks.

Aegridade visualiseerimine

Pärast andmestiku puhastamist ja kinnitamist saame andmeid paremini visualiseerida, et mõista nende erinevat komponenti.

Proovi uuesti

Kuna oleme huvitatud igapäevastest prognoosidest, muutkem andmete esitamise sagedus igapäevaseks.

. Proovi uuesti teisendus muudab aegridade vaatluste sagedust kindlaksmääratud granulaarsusele ja sellega kaasnevad nii üles- kui ka alladiskreetimisvõimalused. Ülesproovimise rakendamine suurendab vaatluste sagedust (näiteks igapäevaselt tunnipõhisele), samal ajal kui alaproovimine vähendab vaatluste sagedust (näiteks tunni pealt igapäevaseks).

Kuna meie andmekogum on minuti detailsus, kasutame alladiskreetimise valikut.

Vali + Lisa samm.
Vali Ajaseeria teisendada.
eest Muutma, vali Proovi uuesti.
eest Ajatempel, vali andmed.
eest Sagedusühik, vali Kalendri päev.
eest Sageduskogus, sisestage 1.
eest Arvväärtuste liitmise meetod, vali keskmine.
Vali Eelvaade.

Meie andmestiku sagedus on muutunud minutist päevaseks.

Vali lisama selle sammu salvestamiseks.

Hooajaline trendi lagunemine

Pärast uuesti proovivõttu saame visualiseerida teisendatud seeriat ja sellega seotud STL-komponente (Seasonal and Trend Decomposition using LOESS) kasutades Hooajaline trendi lagunemine visualiseerimine. See jaotab algsed aegread erinevateks trendideks, hooajalisuseks ja jääkkomponentideks, andes meile hea ülevaate iga mustri käitumisest. Infot saame kasutada ka prognoosimisprobleemide modelleerimisel.

Data Wrangler kasutab trendide ja hooajaliste komponentide modelleerimiseks tugevat ja mitmekülgset statistilist meetodit LOESS. Selle aluseks olev rakendus kasutab aegrea komponentides (hooajalisus, trend ja jääk) esinevate mittelineaarsete seoste hindamiseks polünoomregressiooni.

Vali Tagasi andmevoo juurde.
Valige plussmärk kõrval Sammud on Andmevoog.
Vali Lisage analüüs.
aasta Loo analüüs paan, jaoks Analüüsi tüüp, valima Ajaseeria.
eest Visualiseerimine, vali Hooajaline trendi lagunemine.
eest Analüüsi nimi, sisestage nimi.
eest Ajatempli veerg, vali andmed.
eest Väärtuse veerg, vali Maht USD.
Vali Eelvaade.

Analüüs võimaldab visualiseerida sisestatud aegridu ja dekomponeeritud hooajalisust, trendi ja jääki.

Valmistage ette aegridade andmed rakendusega Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Vali Säästa analüüsi salvestamiseks.

Koos hooajalise trendi lagunemise visualiseerimine, saame luua neli mustrit, nagu on näidatud eelmisel ekraanipildil:

Originaal – Algsest aegreast valiti uuesti igapäevase täpsusega.
Trend – 2021. aasta üldise negatiivse trendiga polünoomtrend, mis näitab langust Volume USD väärtus.
hooaeg – Mitmekordne hooajalisus, mida esindavad erinevad võnkemustrid. Näeme hooajalise kõikumise vähenemist, mida iseloomustab võnkumiste amplituudi vähenemine.
Jääk – järelejäänud jääk- või juhuslik müra. Jääkseeriad on saadud seeriad pärast trendi- ja hooajakomponentide eemaldamist. Tähelepanelikult vaadates täheldame hüppeid jaanuarist märtsini ning aprillist juunini, mis viitab ruumi selliste konkreetsete sündmuste modelleerimiseks ajalooliste andmete põhjal.

Need visualiseeringud annavad andmeteadlastele ja analüütikutele väärtuslikke juhtnööre olemasolevate mustrite kohta ning aitavad teil valida modelleerimisstrateegia. Siiski on alati hea tava kinnitada STL-i lagunemise väljund kirjeldava analüüsi ja valdkonnateadmiste kaudu kogutud teabega.

Kokkuvõtteks võib öelda, et me täheldame algse seeria visualiseerimisega kooskõlas olevat langustrendi, mis suurendab meie usaldust trendide visualiseerimisega edastatud teabe kaasamisel järgnevatesse otsustusprotsessidesse. Seevastu hooajalisuse visualiseerimine aitab teavitada hooajalisuse olemasolust ja selle eemaldamise vajadusest, rakendades selliseid tehnikaid nagu diferentseerimine, see ei anna soovitud tasemel üksikasjalikku ülevaadet erinevatest hooajalistest mustritest, mistõttu on vaja sügavamat analüüsi.

Funktsioonide projekteerimine

Kui oleme oma andmekogus esinevatest mustritest aru saanud, saame hakata kavandama uusi funktsioone, mille eesmärk on suurendada prognoosimudelite täpsust.

Esitage kuupäeva ja kellaaeg

Alustame funktsioonide projekteerimise protsessi lihtsamate kuupäeva/kellaaja funktsioonidega. Kuupäeva/kellaaja funktsioonid luuakse timestamp veerus ja pakkuda andmeteadlastele optimaalset võimalust funktsioonide projekteerimisprotsessi alustamiseks. Alustame Esitage kuupäeva ja kellaaeg aegrea teisendus, et lisada meie andmekogumisse kuu, kuu päev, aastapäev, aasta nädal ja kvartali funktsioonid. Kuna pakume kuupäeva/kellaaja komponente eraldi funktsioonidena, võimaldame ML-algoritmidel prognoosimise täpsuse parandamiseks tuvastada signaale ja mustreid.

Vali + Lisa samm.
Vali Ajaseeria teisendada.
eest Ümber, valima Esitage kuupäeva ja kellaaeg.
eest Sisestusveerg, vali andmed.
eest Väljundveerg, sisenema date (see samm on valikuline).
eest Väljundrežiimis, vali Järjekord.
eest Väljundvorming, vali Veerud.
Kuupäeva/kellaaja funktsioonide eraldamiseks valige kuu, päev, Aasta nädal, Aasta päevja Kvartal.
Vali Eelvaade.

Andmekogum sisaldab nüüd uusi veerge nimega date_month, date_day, date_week_of_year, date_day_of_yearja date_quarter. Nendest uutest funktsioonidest hangitud teave võib aidata andmeteadlastel saada andmetest täiendavat teavet ning sisend- ja väljundfunktsioonide seost.

sisaldavad kuupäeva- ja aegridade teisendust

Vali lisama selle sammu salvestamiseks.

Kodeeri kategooriline

Kuupäeva/kellaaja funktsioonid ei piirdu täisarvu väärtustega. Samuti võite valida teatud ekstraheeritud kuupäeva/kellaaja funktsioonide käsitlemise kategooriliste muutujatena ja esitada need ühekordselt kodeeritud funktsioonidena, kusjuures iga veerg sisaldab binaarväärtusi. Vastloodud date_quarter veerg sisaldab väärtusi vahemikus 0–3 ja seda saab ühekordselt kodeerida nelja kahendveergu abil. Loome neli uut binaarfunktsiooni, millest igaüks esindab aasta vastavat kvartalit.

Vali + Lisa samm.
Vali Kodeeri kategooriline teisendada.
eest Muutma, vali Ühe kuuma kodeering.
eest Sisestusveerg, vali kuupäev_kvartal.
eest Väljundi stiil, vali Veerud.
Vali Eelvaade.
Vali lisama sammu lisamiseks.

Valmistage ette aegridade andmed rakendusega Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Viivitusfunktsioon

Järgmisena loome sihtveeru jaoks viivitusfunktsioonid Volume USD. Aegridade analüüsi viivitusfunktsioonid on varasemate ajatemplite väärtused, mida peetakse abiks tulevaste väärtuste järeldamisel. Samuti aitavad need tuvastada autokorrelatsiooni (tuntud ka kui jadakorrelatsioon) mustrid jääkreas, kvantifitseerides vaatluse seose eelnevate ajaetappide vaatlustega. Autokorrelatsioon on sarnane tavalisele korrelatsioonile, kuid seeria väärtuste ja selle varasemate väärtuste vahel. See on aluseks ARIMA seeria autoregressiivsetele prognoosimudelitele.

Data Wrangleriga Viivitusfunktsioon teisendusega saate hõlpsasti luua viivitusfunktsioone n perioodi vahega. Lisaks soovime sageli erinevate viivitustega luua mitu viivitusfunktsiooni ja lasta mudelil otsustada kõige olulisemate funktsioonide üle. Sellise stsenaariumi puhul on Viivitusfunktsioonid teisendus aitab luua mitu viivituse veergu määratud akna suuruses.

Vali Tagasi andmevoo juurde.
Valige plussmärk kõrval Sammud on Andmevoog.
Vali + Lisa samm.
Vali Ajaseeria teisendada.
eest Muutma, vali Viivitusfunktsioonid.
eest Loo selle veeru viivitusfunktsioonid, vali Maht USD.
eest Ajatempli veerg, vali andmed.
eest Meeskond, sisenema 7.
Kuna oleme huvitatud kuni seitsme eelmise viivitusväärtuse jälgimisest, teeme valiku Kaasake kogu viivituse aken.
Iga viivitusväärtuse jaoks uue veeru loomiseks valige Tasandage väljund.
Vali Eelvaade.

Lisatakse seitse uut veergu, mille järelliide on lag_number märksõna sihtveeru jaoks Volume USD.

Viivituse funktsiooni aegridade teisendus

Vali lisama sammu salvestamiseks.

Rullakna omadused

Samuti saame arvutada tähendusrikkaid statistilisi kokkuvõtteid erinevate väärtuste vahemikus ja lisada need sisendfunktsioonidena. Toome välja tavalised statistilise aegridade funktsioonid.

Data Wrangler rakendab avatud lähtekoodiga automaatsete aegridade funktsioonide ekstraheerimise võimalusi tsfresh pakett. Aegridade funktsioonide ekstraheerimise teisendustega saate funktsioonide eraldamise protsessi automatiseerida. See välistab muidu signaalitöötlusteekide käsitsi rakendamiseks kuluva aja ja vaeva. Selle postituse jaoks eraldame funktsioonid, kasutades Rullakna omadused teisendada. See meetod arvutab statistilisi omadusi vaatluste kogumi kohta, mis on määratletud akna suuruse järgi.

Vali + Lisa samm.
Vali Ajaseeria teisendada.
eest Muutma, vali Rullakna omadused.
eest Loo selle veeru jaoks jooksva akna funktsioonid, vali Maht USD.
eest Ajatempli veerg, vali andmed.
eest Akna suurus, sisenema 7.

Akna suuruse määramine 7 arvutab funktsioonid, kombineerides praeguse ajatempli väärtuse ja eelmise seitsme ajatempli väärtused.

valima Lamedamaks iga arvutatud funktsiooni jaoks uue veeru loomiseks.
Valige oma strateegia kui Minimaalne alamhulk.

See strateegia toob välja kaheksa funktsiooni, mis on kasulikud järgnevates analüüsides. Muud strateegiad hõlmavad Tõhus alamhulk, Kohandatud alamhulkja Kõik funktsioonid. Ekstraheerimiseks saadaolevate funktsioonide täieliku loendi leiate jaotisest Ekstraheeritud funktsioonide ülevaade.

Vali Eelvaade.

Näeme kaheksa uut veergu, mille akna suurus on määratud 7 nende nimel, mis on lisatud meie andmekogumile.

Vali lisama sammu salvestamiseks.

Valmistage ette aegridade andmed rakendusega Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Eksportige andmestik

Oleme aegridade andmestikku teisendanud ja oleme valmis kasutama teisendatud andmekogumit prognoosialgoritmi sisendina. Viimane samm on teisendatud andmekogumi eksportimine Amazon S3-sse. Data Wrangleris saate valida Ekspordi samm et automaatselt genereerida Jupyteri sülearvuti Amazon SageMaker Processing koodiga teisendatud andmestiku töötlemiseks ja eksportimiseks S3 ämbrisse. Kuna aga meie andmestik sisaldab veidi üle 300 kirje, kasutame ära Andmete eksportimine valik Lisage teisendus vaade teisendatud andmestiku eksportimiseks Data Wranglerist otse Amazon S3-sse.

Vali Andmete eksportimine.

Valmistage ette aegridade andmed rakendusega Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

eest S3 asukoht, vali brauseri ja valige oma S3 ämber.
Vali Andmete eksportimine.

Valmistage ette aegridade andmed rakendusega Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Nüüd, kui oleme bitcoini andmestiku edukalt muutnud, saame seda kasutada Amazoni prognoos bitcoini ennustuste loomiseks.

Koristage

Kui olete selle kasutusjuhtumiga lõpetanud, puhastage loodud ressursid, et vältida lisatasusid. Data Wrangleri puhul saate pärast lõpetamist aluseks oleva eksemplari sulgeda. Viitama Lülitage Data Wrangler välja dokumentatsioon üksikasjade saamiseks. Teise võimalusena võite jätkata Osa 2 seda andmestikku prognoosimiseks kasutada.

kokkuvõte

See postitus näitas, kuidas kasutada Data Wranglerit aegridade analüüsi lihtsustamiseks ja kiirendamiseks, kasutades selle sisseehitatud aegridade võimalusi. Uurisime, kuidas andmeteadlased saavad hõlpsasti ja interaktiivselt puhastada, vormindada, kinnitada ja teisendada aegridade andmeid soovitud vormingusse, et neid sisukaks analüüsiks teha. Samuti uurisime, kuidas saate oma aegridade analüüsi rikastada, lisades Data Wrangleri abil tervikliku statistiliste funktsioonide komplekti. Lisateavet Data Wrangleri aegridade teisenduste kohta vt Andmete teisendamine.

Teave Autor

Roop Bains on AWS-i lahenduste arhitekt, kes keskendub AI/ML-ile. Ta on kirglik aidata klientidel tehisintellekti ja masinõppe abil uuendusi teha ja oma ärieesmärke saavutada. Vabal ajal meeldib Roopile lugeda ja matkata.

Nikita Ivkin on Amazon SageMaker Data Wrangleri rakendusteadlane.

Ajatempel: Veebruar 16, 2022

Ajatempel: Juuli 20, 2023

Tarbijate kaitsmine ja innovatsiooni edendamine – tehisintellekti reguleerimine ja vastutustundliku tehisintellekti vastu usalduse loomine

Allikaklaster:

AWS-i masinõpe

Allikasõlm: 1765573

Ajatempel: Detsember 1, 2022

Valmistage ette aegridade andmed rakendusega Amazon SageMaker Data Wrangler

Taasavaldanud Platon

Data Wrangleri kasutusjuhtumid

Lahenduse ülevaade

Eeldused

Lisage teisendusi

Andmete puhastamine

Langetage veerg

Käepide puudu

Kinnitage ajatempel

Aegridade visualiseerimine

Proovi uuesti

Hooajaline trendi lagunemine

Funktsioonide projekteerimine

Esitage kuupäeva ja kellaaeg

Kodeeri kategooriline

Viivitusfunktsioon

Rullakna omadused

Eksportige andmestik

Koristage

kokkuvõte

Teave Autor

Veel alates AWS-i masinõpe

Jälgige oma ML-katseid otsast lõpuni andmete versioonikontrolli ja Amazon SageMaker Experiments abil

Amazon Titan Text Embeddingsiga alustamine | Amazoni veebiteenused

Lubage mitme piirkonna Amazon SageMakeri lõpp-punktide CI/CD

AI21 Jurassic-1 vundamendimudel on nüüd saadaval Amazon SageMakeris

Bongo Learn pakub reaalajas tagasisidet, et parandada õpitulemusi rakendusega Amazon Transcribe

Lubage intelligentne otsuste tegemine Amazon SageMaker Canvase ja Amazon QuickSightiga

Treenige, häälestage ja juurutage kohandatud ansambleid tõhusalt, kasutades Amazon SageMaker | Amazoni veebiteenused

Tarbijate kaitsmine ja innovatsiooni edendamine – tehisintellekti reguleerimine ja vastutustundliku tehisintellekti vastu usalduse loomine

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto