Lihtne ja täpne prognoosimine AutoGluon-TimeSeries abil

Taasavaldanud Platon

järgijaid: 0

AutoGluon-TimeSeries on AutoGluoni uusim täiendus, mis aitab teil hõlpsalt luua võimsaid aegridade prognoosimudeleid vaid kolme koodireaga.

Aegridade prognoosimine on levinud ülesanne paljudes tööstusharudes ja ka teadusvaldkondades. Juurdepääs usaldusväärsetele pakkumise, nõudluse või võimsuse prognoosidele on ettevõtete planeerimisel ülioluline. Aegridade prognoosimine on aga keeruline probleem, eriti kui saadaval on tuhandeid potentsiaalselt seotud aegridu, näiteks müük suures e-kaubanduse kataloogis või sadade tegevuskohtade maht.

Lihtsad statistilised või hinnangutel põhinevad prognoosimismeetodid on sageli juba tugevad lähtealused, mida on uute masinõppe (ML) meetoditega raske täiustada. Veelgi enam, ML hiljutiste edusammude rakendused prognoosimisel on mitmekesised, vähesed meetodid, näiteks DeepAR [1] või Temporal Fusion Transformers [2], mis on populaarsed valikud. Neid meetodeid on aga tootmises raske treenida, häälestada ja kasutusele võtta, mistõttu on vaja ekspertteadmisi ML-i ja aegridade analüüsi kohta.

AutoML on ML-is kiiresti kasvav teema, mis keskendub ML-i konveierite tavapäraste toimingute automatiseerimisele, sealhulgas funktsioonide eeltöötlusele, mudelite valikule, mudelite häälestamisele, komplekteerimisele ja juurutamisele. AutoGluon-TimeSeries on uusim täiendus AutoGluon, mis on üks juhtivaid avatud lähtekoodiga AutoML-i lahendusi ja tugineb prognoosimisülesannetes AutoGluoni võimsale AutoML-i raamistikule. AutoGluon-TimeSeries loodi võimsate prognoosisüsteemide loomiseks kõigest kolme koodireaga, mis leevendab funktsioonide eeltöötluse, mudelivaliku, mudeli häälestamise ja juurutamise lihtsuse probleeme.

Lihtsa kõnega AutoGluon-TimeSeries's TimeSeriesPredictor, AutoGluon järgib mudelite sobitamisel intuitiivset prioriteetide järjekorda: alustades lihtsatest naiivsetest lähtejoontest ja liikudes võimsa globaalse närvivõrgu ja võimendatud puupõhiste meetodite poole, seda kõike kasutaja määratud ajaeelarve piires. Kui seotud aegread (ajas muutuvad ühismuutujad või eksogeensed muutujad) või üksuse metaandmed (staatilised tunnused) on saadaval, arvestab AutoGluon-TimeSeries need prognoosi. Teek kasutab ka Bayesi optimeerimist hüperparameetrite häälestamiseks, jõudes keerukate mudelite häälestamise abil parima mudelikonfiguratsioonini. Lõpuks ühendab AutoGluon-TimeSeries parimad statistilised ja ML-põhised meetodid mudelite kogumiks, mis on optimeeritud käesoleva probleemi jaoks.

Selles postituses tutvustame AutoGluon-TimeSeriesi kasutusmugavust võimsa ennustaja kiireks ehitamiseks.

Alustage AutoGluon-TimeSeriesiga

Alustuseks peate installima AutoGluoni, mida on lihtne teha UNIX-i kesta pipi abil:

pip install "autogluon>=0.6"

AutoGluon-TimeSeries tutvustab TimeSeriesDataFrame klass mitut seotud aegrida sisaldavate andmekogumitega töötamiseks (mida mõnikord nimetatakse ka paneeliandmestikuks). Neid andmekaadreid saab luua nn pika formaadi andmekaadritest, millel on ridadesse paigutatud aegridade ID-d ja ajatemplid. Järgmine on üks selline andmenäide, mis on võetud M4 võistlusest [3]. Siin, item_id veerg määrab ühe aegrea kordumatu identifikaatori, näiteks toote ID mitme toote igapäevaste müügiandmete jaoks. The target veerg on huvipakkuv väärtus, mida AutoGluon-TimeSeries prognoosima õpib. weekend on ajas muutuv lisamuutuja, mille me koostasime, et märkida, kas vaatlus toimus nädalavahetusel või mitte.

Saame hõlpsasti toota uue TimeSeriesDataFrame sellest andmekogumist kasutades from_data_frame konstruktor. Vaadake järgmist Pythoni koodi:

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

Mõnel aegrea andmetel on ajas mittemuutuvad funktsioonid (staatilised funktsioonid või üksuse metaandmed), mida saab kasutada prognoosimudeli koolitamisel. Näiteks M4 andmestik sisaldab iga aegrea jaoks kategooriamuutujat. Neid saab lisada TimeSeriesDataFrame seadistades static_features muutuja uue andmeraamiga.

Kasutage järgmist koodi:

df.static_features = raw_static_features

Treenige TimeSeriesPredictorit

Lõpuks saame helistada TimeSeriesPredictor Täpse prognoosimissüsteemi loomiseks sobitada laia valikut prognoosimudeleid. Vaadake järgmist koodi:

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

Siin täpsustame, et TimeSeriesPredictor peaks tootma mudeleid järgmise seitsme ajaperioodi prognoosimiseks ja parimate mudelite hindamiseks, kasutades keskmist absoluutset skaleeritud viga (MASE). Lisaks näitame, et ajas muutuv ühismuutuja weekend on andmestikus saadaval. Nüüd saame ennustava objekti sobitada TimeSeriesDataFrame varem toodetud:

predictor.fit(df, presets="medium_quality", time_limit=1800)

Lisaks treeningandmete esitamisele palume ennustajal seda kasutada “medium_quality” eelseadistused. AutoGluon-TimeSeries sisaldab mitut eelseadistust, et valida mudelite alamhulgad, mida kaaluda ja kui palju aega kulutada nende häälestamisele, haldades treeningkiiruse ja täpsuse vahelist kompromissi. Lisaks eelseadetele saavad kogenumad kasutajad kasutada a hyperparameters argument komponentide mudelite täpseks määramiseks ja nende jaoks seadistatavate hüperparameetrite määramiseks. Määrame ka ajalimiidi 1,800 sekundit, mille järel ennustaja lõpetab treeningu.

Kapoti all treenib AutoGluon-TimeSeries kindlaksmääratud aja jooksul nii palju mudeleid kui võimalik, alustades naiivsetest, kuid võimsatest baasjoontest ja töötades keerukamate prognoosijate poole, mis põhinevad võimendatud puudel ja närvivõrgu mudelitel. Helistades predictor.leaderboard(), näeme loendit kõigist mudelitest, mida see on treeninud, ning iga mudeli täpsusskoore ja treeninguaegu. Pange tähele, et iga AutoGluon-TimeSeriesi mudel teatab oma vigadest vormingus „suurem, seda parem”, mis tähendab, et enamik prognoosimise veanäitajaid korrutatakse raporteerimisel -1-ga. Vaadake järgmist näidet:

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

Prognoos TimeSeriesPredictoriga

Lõpuks saame ennustajat kasutada kõigi a aegridade ennustamiseks TimeSeriesDataFrame, 7 päeva tulevikus. Pange tähele, et kuna kasutasime ajas muutuvaid ühismuutujaid, mis eeldatavasti on tulevikus teada, tuleks need ka ennustusajal täpsustada. Vaadake järgmist koodi:

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

Vaikimisi pakub AutoGluon-TimeSeries nii punktiprognoose kui ka tõenäosuslikke (kvantiilseid) prognoose sihtväärtuse kohta. Tõenäosuslikud prognoosid on paljudes planeerimisülesannetes olulised ja neid saab kasutada intervallide paindlikuks arvutamiseks, võimaldades järgnevaid ülesandeid, nagu laoseisu ja võimsuse planeerimine.

Järgmine on prognoosgraafiku näidis, mis näitab punktiprognoose ja ennustusintervalle.

Järeldus

AutoGluon-TimeSeries annab prognoosijatele ja andmeteadlastele kiire ja lihtsa võimaluse võimsate prognoosimudelite loomiseks. Lisaks mõnele selles postituses tutvustatud teegi tavaliselt kasutatavale funktsioonile pakub AutoGluon-TimeSeries mitmeid viise, kuidas konfigureerida prognoose kogenud kasutajatele. Ennustajaid on ka lihtne koolitada, kasutusele võtta ja koos teenindada Amazon SageMaker, kasutades AutoGluoni süvaõpet konteinerid.

AutoGluoni kasutamise kohta lisateabe saamiseks, näidete, õpetuste ja muude ülesannete saamiseks, millega AutoGluon tegeleb, näiteks tabeli- või multimodaalsete andmete õppimiseks, külastage AutoGluon. AutoGluon-TimeSeriesi kasutamise alustamiseks vaadake meie kiire alguse õpetus või meie põhjalik õpetus kõigi raamatukogu pakutavate funktsioonide põhjalikumaks uurimiseks. Jälgige AutoGluoni sisselülitamist puperdamaja lisage meid tärniga GitHub saada kursis viimaste uuendustega.

Spetsiaalsete arvutuste ja töövoogude, ettevõtte tasemel toe, prognooside seletatavuse ja muuga ulatusliku prognoosimise jaoks vaadake ka Amazoni prognoos.

viited

[1] Salinas, David, Valentin Flunkert, Jan Gasthaus ja Tim Januschowski. "DeepAR: tõenäosuslik prognoosimine autoregressiivsete korduvate võrkudega." International Journal of Forecasting 36. 3 (2020): 1181-1191.

[2] Lim, Bryan, Sercan O Arik, Nicolas Loeff ja Tomas Pfister. "Temporal Fusion Transformers tõlgendatavate mitme horisondi aegridade prognoosimiseks." International Journal of Forecasting 37.4 (2021): 1748-1764.

[3] Makridakis, Spyros, Evangelos Spiliotis ja Vassilios Assimakopoulos. "M4 võistlus: 100,000 61 aegrida ja XNUMX prognoosimismeetodit." International Journal of Forecasting 36.1 (2020): 54-74.

Autoritest

Caner Türkmenistani on Amazon Web Servicesi rakendusteadlane, kus ta tegeleb lisaks AutoGluon-TimeSeriesi arendamisele ka masinõppe ja prognoosimise ristumiskohas olevate probleemidega. Enne AWS-iga liitumist töötas ta juhtimisnõustamisvaldkonnas andmeteadlasena, teenindades finantsteenuste ja telekommunikatsioonitööstust projektides üle kogu maailma. Caneri isiklikud uurimishuvid hõlmavad mitmesuguseid teemasid, sealhulgas prognoosimine, põhjuslikud järeldused ja AutoML.

Oleksandr Štšur on Amazon Web Servicesi rakendusteadlane, kus ta töötab AutoGluon-TimeSeries aegridade prognoosimisega. Enne AWS-iga liitumist lõpetas ta Saksamaal Müncheni tehnikaülikoolis masinõppe doktorikraadi, uurides sündmuste andmete tõenäosuslikke mudeleid. Tema uurimishuvide hulka kuuluvad ajaandmete masinõpe ja generatiivne modelleerimine.

Nick Erickson on Amazon Web Servicesi vanemrakendusteadlane. Magistrikraadi arvutiteaduse ja tehnika alal omandas ta Minnesota sõpruslinnade ülikoolis. Ta on avatud lähtekoodiga AutoML-i raamistiku AutoGluon kaasautor ja juhtivarendaja. Alustades 2018. aastal isikliku võistluse ML tööriistakomplektina, laiendas Nick pidevalt AutoGluoni võimalusi ja liitus 2019. aastal Amazon AI-ga, et projektile avatud lähtekoodiga luua ja töötada täiskohaga AutoML-i tipptasemel täiustamise nimel.

Ajatempel: November 18, 2022November 18, 2022

Ajatempel: Võib 2 2022

Lihtne ja täpne prognoosimine AutoGluon-TimeSeriesiga

Taasavaldanud Platon

Alustage AutoGluon-TimeSeriesiga

Treenige TimeSeriesPredictorit

Prognoos TimeSeriesPredictoriga

Järeldus

viited

Autoritest

Veel alates AWS-i masinõpe

Tutvustame Amazon Lexile mõeldud visuaalse vestluse koostajat

PGA TOURi generatiivse AI virtuaalse assistendi teekond kontseptsioonist arenduseni prototüübini | Amazoni veebiteenused

Amazon SageMaker Pipelinesi ja Amazon SageMaker SDK uued funktsioonid

Looge Amazon SageMakeris ilma koodita riskijuhtimise masinõppe töövoog

Intuitivo saavutab AWS Inferentia ja PyTorchi abil suurema läbilaskevõime, säästes samal ajal AI/ML kulusid | Amazoni veebiteenused

Täiustage oma iseteenindusassistente Amazon Lex | uute generatiivsete AI-funktsioonidega Amazoni veebiteenused

Automatiseerige piltide tausta muutmise protsess Amazon Bedrocki ja AWS Step Functions | abil Amazoni veebiteenused

Suurendage oma sisu ulatust automaatse dokumendist kõneks teisendamise abil, kasutades Amazoni AI teenuseid

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto