Helppo ja tarkka ennustaminen AutoGluon-TimeSeriesin avulla

Julkaissut Platon

seuraajia: 0

AutoGluon-TimeSeries on uusin lisäys AutoGluoniin, jonka avulla voit helposti rakentaa tehokkaita aikasarjaennustemalleja vain kolmella koodirivillä.

Aikasarjaennuste on yleinen tehtävä monilla toimialoilla sekä tieteenaloilla. Luotettavien tarjonnan, kysynnän tai kapasiteetin ennusteiden saatavuus on ratkaisevan tärkeää yritysten suunnittelussa. Aikasarjojen ennustaminen on kuitenkin vaikea ongelma, varsinkin kun saatavilla on tuhansia mahdollisesti toisiinsa liittyviä aikasarjoja, kuten myynti suuressa luettelossa verkkokaupassa tai kapasiteetti satoissa toimipisteissä.

Yksinkertaiset tilastolliset tai arvioon perustuvat ennustemenetelmät ovat usein jo vahvoja lähtökohtia, joita on vaikea parantaa uusilla koneoppimismenetelmillä (ML). Lisäksi ML:n viimeaikaisten kehityssuuntien sovellukset ennustamiseen ovat erilaisia, ja menetelmiä on vähän, kuten esim DeepAR [1] tai Temporal Fusion Transformers [2] nousemassa suosituiksi valinnaiksi. Näitä menetelmiä on kuitenkin vaikea kouluttaa, virittää ja ottaa käyttöön tuotannossa, mikä vaatii asiantuntemusta ML- ja aikasarjaanalyysistä.

AutoML on nopeasti kasvava aihe ML:ssä, ja se keskittyy ML-putkien yleisten tehtävien automatisointiin, mukaan lukien ominaisuuksien esikäsittely, mallin valinta, mallin viritys, kokoonpano ja käyttöönotto. AutoGluon-TimeSeries on uusin lisäys AutoGluon, yksi johtavista avoimen lähdekoodin AutoML-ratkaisuista, ja se perustuu AutoGluonin tehokkaaseen AutoML-kehykseen ennustetehtävissä. AutoGluon-TimeSeries on suunniteltu rakentamaan tehokkaita ennustejärjestelmiä, joissa on vain kolme koodiriviä, mikä lievittää ominaisuuksien esikäsittelyn, mallin valinnan, mallin virityksen ja käyttöönoton helppouden haasteita.

Yksinkertaisella puhelulla AutoGluon-TimeSeriesille TimeSeriesPredictor, AutoGluon noudattaa intuitiivista tärkeysjärjestystä sovittaessaan malleja: alkaen yksinkertaisista naiiveista peruslinjoista ja siirtymällä tehokkaaseen globaaliin hermoverkkoon ja tehostettuihin puupohjaisiin menetelmiin, kaikki käyttäjän määrittämän aikabudjetin sisällä. Kun liittyvät aikasarjat (ajassa vaihtuvat kovariaatit tai eksogeeniset muuttujat) tai kohteen metatiedot (staattiset ominaisuudet) ovat saatavilla, AutoGluon-TimeSeries ottaa ne huomioon ennusteessa. Kirjasto hyödyntää myös bayesilaista optimointia hyperparametrien virittämiseksi ja saavuttaa parhaan mallikonfiguraation monimutkaisten mallien virityksellä. Lopuksi AutoGluon-TimeSeries yhdistää parhaat tilastolliset ja ML-pohjaiset menetelmät mallikokonaisuuteen, joka on optimoitu käsillä olevaan ongelmaan.

Tässä viestissä esittelemme AutoGluon-TimeSeriesin helppokäyttöisyyttä tehokkaan ennustajan nopeassa rakentamisessa.

Aloita AutoGluon-TimeSeriesin käyttö

Aloittaaksesi sinun on asennettava AutoGluon, joka on helppo tehdä pip:llä UNIX-kuoressa:

pip install "autogluon>=0.6"

AutoGluon-TimeSeries esittelee TimeSeriesDataFrame luokka useiden toisiinsa liittyvien aikasarjojen sisältävien tietojoukkojen käsittelyyn (jota joskus kutsutaan paneelitietojoukoksi). Nämä tietokehykset voidaan luoda ns. pitkän formaatin tietokehyksistä, joissa on riveihin järjestetyt aikasarjatunnukset ja aikaleimat. Seuraava on yksi tällainen esimerkki M4-kilpailusta [3]. Tässä, item_id sarake määrittää yksittäisen aikasarjan yksilöllisen tunnisteen, kuten useiden tuotteiden päivittäisten myyntitietojen tuotetunnuksen. The target sarake on kiinnostava arvo, jonka AutoGluon-TimeSeries oppii ennustamaan. weekend on ylimääräinen ajassa vaihtuva kovariaatti, jonka tuotimme merkitsemään, oliko havainto viikonloppuna vai ei.

Voimme helposti valmistaa uuden TimeSeriesDataFrame tästä tietojoukosta käyttämällä from_data_frame rakentaja. Katso seuraava Python-koodi:

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

Joissakin aikasarjatiedoissa on ajassa muuttumattomia ominaisuuksia (staattisia ominaisuuksia tai nimikkeiden metatietoja), joita voidaan käyttää ennustemallin koulutuksessa. Esimerkiksi M4-tietojoukossa on luokkamuuttuja jokaiselle aikasarjalle. Nämä voidaan lisätä TimeSeriesDataFrame asettamalla static_features muuttuja uudella tietokehyksellä.

Käytä seuraavaa koodia:

df.static_features = raw_static_features

Kouluta TimeSeriesPredictor

Lopuksi voimme soittaa TimeSeriesPredictor sopii monenlaisiin ennustemalleihin tarkan ennustejärjestelmän rakentamiseksi. Katso seuraava koodi:

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

Tässä täsmennämme, että TimeSeriesPredictor pitäisi tuottaa malleja seuraavien seitsemän ajanjakson ennustamiseksi ja arvioida parhaat mallit käyttämällä keskimääräistä absoluuttista skaalattua virhettä (MASE). Lisäksi osoitamme, että ajassa vaihteleva kovariaatti weekend on saatavilla tietojoukossa. Voimme nyt sovittaa ennustajaobjektin TimeSeriesDataFrame valmistettu aiemmin:

predictor.fit(df, presets="medium_quality", time_limit=1800)

Harjoitustietojen toimittamisen lisäksi pyydämme ennustajaa käyttämään “medium_quality” esiasetukset. AutoGluon-TimeSeries sisältää useita esiasetuksia, joiden avulla voidaan valita harkittavia mallien osajoukkoja ja kuinka paljon aikaa kuluu niiden virittämiseen, mikä hallitsee harjoitusnopeuden ja tarkkuuden välistä kompromissia. Esiasetusten lisäksi kokeneemmat käyttäjät voivat käyttää a hyperparameters argumentti määrittääksesi tarkasti komponenttimallit ja mitkä hyperparametrit niille asetetaan. Määritämme myös 1,800 sekunnin aikarajan, jonka jälkeen ennustaja lopettaa harjoittelun.

Konepellin alla AutoGluon-TimeSeries kouluttaa niin monta mallia kuin se pystyy määritetyn ajanjakson sisällä aloittaen naiiveista mutta tehokkaista peruslinjoista ja pyrkien kohti monimutkaisempia ennustajia, jotka perustuvat tehostettuihin puihin ja hermoverkkomalleihin. Soittamalla predictor.leaderboard(), voimme nähdä luettelon kaikista sen kouluttamista malleista sekä tarkkuuspisteet ja harjoitusajat jokaiselle. Huomaa, että jokainen AutoGluon-TimeSeries-malli raportoi virheensä "korkeampi sitä parempi" -muodossa, mikä tarkoittaa, että useimmat ennusteen virhemitat kerrotaan -1:llä, kun ne raportoidaan. Katso seuraava esimerkki:

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

Ennuste TimeSeriesPredictorilla

Lopuksi voimme käyttää ennustajaa ennustamaan kaikki aikasarjat a:ssa TimeSeriesDataFrame, 7 päivää tulevaisuudessa. Huomaa, että koska käytimme ajassa vaihtelevia kovariaatteja, joiden oletetaan olevan tiedossa tulevaisuudessa, myös ne tulisi määrittää ennustushetkellä. Katso seuraava koodi:

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

Oletusarvoisesti AutoGluon-TimeSeries tarjoaa sekä pisteennusteita että todennäköisyysennusteita (kvantiili) tavoitearvosta. Todennäköisyysennusteet ovat välttämättömiä monissa suunnittelutehtävissä, ja niiden avulla voidaan joustavasti laskea aikavälejä, mikä mahdollistaa myöhempien tehtävien, kuten varaston ja kapasiteetin suunnittelun.

Seuraavassa on esimerkkiennustekaavio, joka esittää pisteennusteet ja ennustevälit.

Yhteenveto

AutoGluon-TimeSeries tarjoaa ennustajille ja datatieteilijöille nopean ja helpon tavan luoda tehokkaita ennustemalleja. Joidenkin tässä viestissä esiteltyjen kirjaston yleisesti käytettyjen ominaisuuksien lisäksi AutoGluon-TimeSeries sisältää joukon tapoja määrittää ennusteita kokeneille käyttäjille. Ennustajia on myös helppo kouluttaa, ottaa käyttöön ja palvella niiden kanssa mittakaavassa Amazon Sage Maker, käyttämällä AutoGluonin syväoppimista säiliöt.

Lisätietoja AutoGluonin käytöstä, esimerkkejä, opetusohjelmia ja muita AutoGluonin käsittelemiä tehtäviä, kuten taulukko- tai multimodaalitietojen oppimista, on osoitteessa AutoGluon. Aloita AutoGluon-TimeSeriesin käyttö tutustumalla meidän pika-aloitus opetusohjelma tai meidän syvällinen opetusohjelma tarkastellaksesi kirjaston kaikkia ominaisuuksia tarkemmin. Seuraa AutoGluonin toimintaa Twitter, ja merkitse meidät tähdellä GitHub saada tietoa viimeisimmistä päivityksistä.

Katso myös, jos haluat ennustaa mittakaavassa erillisen laskennan ja työnkulun, yritystason tuen, ennusteiden selitettävyyden ja paljon muuta. Amazonin sääennuste.

Viitteet

[1] Salinas, David, Valentin Flunkert, Jan Gasthaus ja Tim Januschowski. "DeepAR: Todennäköisyysennuste autoregressiivisillä toistuvilla verkoilla." International Journal of Forecasting 36. 3 (2020): 1181-1191.

[2] Lim, Bryan, Sercan O Arik, Nicolas Loeff ja Tomas Pfister. "Temporal Fusion Transformers tulkittavissa monihorisonttiaikasarjojen ennustamiseen." International Journal of Forecasting 37.4 (2021): 1748-1764.

[3] Makridakis, Spyros, Evangelos Spiliotis ja Vassilios Assimakopoulos. "M4-kilpailu: 100,000 61 aikasarjaa ja XNUMX ennustemenetelmää." International Journal of Forecasting 36.1 (2020): 54-74.

Tietoja kirjoittajista

Caner Turkmen on soveltuva tutkija Amazon Web Servicesissä, jossa hän työskentelee AutoGluon-TimeSeriesin kehittämisen lisäksi koneoppimisen ja ennustamisen risteyskohdassa. Ennen AWS:lle tuloaan hän työskenteli liikkeenjohdon konsultointialalla datatutkijana ja palveli rahoituspalvelu- ja televiestintäalaa projekteissa ympäri maailmaa. Canerin henkilökohtaiset tutkimusintressit kattavat useita aiheita, mukaan lukien ennustaminen, syy-seuraus ja AutoML.

Oleksandr Shchur on soveltuva tutkija Amazon Web Servicesissä, jossa hän työskentelee aikasarjaennusteiden parissa AutoGluon-TimeSeriesissa. Ennen AWS:ään liittymistään hän suoritti tohtorintutkinnon koneoppimisesta Münchenin teknillisessä yliopistossa Saksassa ja teki tutkimusta tapahtumatietojen todennäköisyysmalleista. Hänen tutkimusalueitaan ovat ajallisen datan koneoppiminen ja generatiivinen mallintaminen.

Nick Erickson on vanhempi soveltuva tutkija Amazon Web Services -palvelussa. Hän suoritti maisterin tutkinnon tietojenkäsittelytieteessä ja tekniikassa Minnesota Twin Citiesin yliopistosta. Hän on avoimen lähdekoodin AutoML-kehyksen AutoGluon toinen kirjoittaja ja johtava kehittäjä. Nick aloitti henkilökohtaisena kilpailun ML-työkalupakina vuonna 2018, ja se laajensi jatkuvasti AutoGluonin ominaisuuksia ja liittyi Amazon AI:hen vuonna 2019 avoimen lähdekoodin projektiin ja työskennelläkseen täysipäiväisesti AutoML:n huipputekniikan edistämiseksi.

Aikaleima: Marraskuussa 18, 2022Marraskuussa 18, 2022

Aikaleima: Voi 2, 2022

Helppo ja tarkka ennustaminen AutoGluon-TimeSeriesin avulla

Julkaissut Platon

Aloita AutoGluon-TimeSeriesin käyttö

Kouluta TimeSeriesPredictor

Ennuste TimeSeriesPredictorilla

Yhteenveto

Viitteet

Tietoja kirjoittajista

Lisää aiheesta AWS-koneoppiminen

Ilmoitamme Visual Conversation Builderin Amazon Lexille

PGA TOURin generatiivisen AI-virtuaaliassistentin matka konseptista kehitykseen prototyyppiin | Amazon Web Services

Uusia ominaisuuksia Amazon SageMaker Pipelinesille ja Amazon SageMaker SDK:lle

Rakenna riskienhallinnan koneoppimisen työnkulku Amazon SageMakerissa ilman koodia

AWS Inferentia ja PyTorch | Amazon Web Services

Paranna itsepalveluassistenttejasi uusilla generatiivisilla tekoälyominaisuuksilla Amazon Lex |:ssä Amazon Web Services

Automatisoi kuvien taustan vaihtamisprosessi käyttämällä Amazon Bedrockia ja AWS Step Functionsia | Amazon Web Services

Lisää sisältösi kattavuutta automaattisella asiakirjasta puheeksi muuntamalla Amazon AI -palveluiden avulla

Tietoa Meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili