Egyszerű és pontos előrejelzés az AutoGluon-TimeSeries PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.

Egyszerű és pontos előrejelzés az AutoGluon-TimeSeries segítségével

Az AutoGluon-TimeSeries az AutoGluon legújabb kiegészítése, amely segítségével egyszerűen hozhat létre hatékony idősoros előrejelzési modelleket, mindössze három sornyi kóddal.

Az idősoros előrejelzés az iparágak és a tudományos területek széles körében gyakori feladat. A kínálatra, keresletre vagy kapacitásra vonatkozó megbízható előrejelzésekhez való hozzáférés kulcsfontosságú a vállalkozások tervezésében. Az idősoros előrejelzés azonban nehéz probléma, különösen akkor, ha potenciálisan kapcsolódó idősorok ezrei állnak rendelkezésre, például az e-kereskedelemben egy nagy katalógusban történő értékesítés vagy több száz működő telephely kapacitása.

Az egyszerű statisztikai vagy ítéleten alapuló előrejelzési módszerek gyakran már erős kiindulópontok, amelyeket nehéz javítani az új gépi tanulási (ML) módszerekkel. Ezen túlmenően az ML legújabb fejlesztéseinek alkalmazása az előrejelzésben változatos, kevés módszerrel, mint pl DeepAR [1] vagy a Temporal Fusion Transformers [2] népszerű választás. Ezeket a módszereket azonban nehéz betanítani, hangolni és a termelésben üzembe helyezni, mivel az ML és az idősorelemzés szakértői ismerete szükséges.

Az AutoML egy gyorsan növekvő téma az ML-ben, amely az ML-folyamatokban lévő gyakori feladatok automatizálására összpontosít, beleértve a funkciók előfeldolgozását, a modellválasztást, a modellhangolást, az összeállítást és a telepítést. Az AutoGluon-TimeSeries a legújabb kiegészítése AutoGluon, az egyik vezető nyílt forráskódú AutoML-megoldás, és az AutoGluon erőteljes AutoML-keretrendszerére épít az előrejelzési feladatokban. Az AutoGluon-TimeSeries-t arra tervezték, hogy hatékony előrejelző rendszereket építsen fel mindössze három sornyi kóddal, enyhítve a funkciók előfeldolgozása, a modellválasztás, a modellhangolás és az egyszerű üzembe helyezés kihívásait.

Az AutoGluon-TimeSeries egyszerű hívásával TimeSeriesPredictorAz AutoGluon intuitív prioritási sorrendet követ a modellek illesztése során: az egyszerű naiv alapvonalaktól kezdve a hatékony globális neurális hálózatokig és a megnövelt faalapú módszerekig, mindezt a felhasználó által meghatározott időkereten belül. Ha rendelkezésre állnak kapcsolódó idősorok (időben változó kovariánsok vagy exogén változók) vagy elem-metaadatok (statikus jellemzők), az AutoGluon-TimeSeries figyelembe veszi ezeket az előrejelzésben. A könyvtár a bayesi optimalizálást is kihasználja a hiperparaméterek hangolásához, és az összetett modellek hangolásával eléri a legjobb modellkonfigurációt. Végül az AutoGluon-TimeSeries a legjobb statisztikai és ML-alapú módszereket egyesíti egy, az adott problémára optimalizált modellegyüttesben.

Ebben a bejegyzésben bemutatjuk, hogy az AutoGluon-TimeSeries könnyen használható egy hatékony előrejelző gyors elkészítéséhez.

Kezdje el az AutoGluon-TimeSeries használatát

A kezdéshez telepítenie kell az AutoGluon-t, ami könnyen elvégezhető a pip segítségével UNIX-héjon:

pip install "autogluon>=0.6"

Az AutoGluon-TimeSeries bemutatja a TimeSeriesDataFrame osztály több kapcsolódó idősort tartalmazó adatkészletekkel való munkavégzéshez (néha paneladatkészletnek is nevezik). Ezek az adatkeretek úgynevezett hosszú formátumú adatkeretekből hozhatók létre, amelyek sorokba rendezett idősorazonosítókkal és időbélyegekkel rendelkeznek. Az alábbiakban egy ilyen adatpélda látható az M4 versenyből [3]. Itt, a item_id oszlop egyetlen idősor egyedi azonosítóját adja meg, például több termék napi értékesítési adatainak termékazonosítóját. Az target oszlop az az érdeklődési érték, amelyet az AutoGluon-TimeSeries megtanul előre jelezni. weekend egy extra időben változó kovariáns, amelyet azért hoztunk létre, hogy megjelöljük, hogy a megfigyelés hétvégén volt-e vagy sem.

Könnyen előállíthatunk újat TimeSeriesDataFrame ebből az adatkészletből a from_data_frame konstruktőr. Lásd a következő Python kódot:

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

Egyes idősoros adatok nem időben változó jellemzőkkel rendelkeznek (statikus jellemzők vagy elem-metaadatok), amelyek felhasználhatók az előrejelzési modell betanításához. Például az M4 adatkészlet minden idősorhoz tartalmaz egy kategóriaváltozót. Ezeket hozzá lehet adni a TimeSeriesDataFrame a static_features változó egy új adatkerettel.

Egyszerű és pontos előrejelzés az AutoGluon-TimeSeries PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.

Használja a következő kódot:

df.static_features = raw_static_features

Tanítson meg egy TimeSeriesPredictort

Végül hívhatjuk a TimeSeriesPredictor hogy az előrejelzési modellek széles skálájához illeszkedjen a pontos előrejelzési rendszer felépítéséhez. Lásd a következő kódot:

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

Itt megadjuk, hogy a TimeSeriesPredictor modelleket kell készítenie a következő hét időszak előrejelzésére, és a legjobb modellek megítélésére az átlagos abszolút skálázott hiba (MASE). Továbbá jelezzük, hogy az időben változó kovariáns weekend elérhető az adatkészletben. Most már illeszthetjük a prediktor objektumot a TimeSeriesDataFrame korábban készült:

predictor.fit(df, presets="medium_quality", time_limit=1800)

A képzési adatok megadása mellett kérjük a prediktort, hogy használja “medium_quality” előbeállítások. Az AutoGluon-TimeSeries számos előbeállítást tartalmaz, amelyek segítségével kiválaszthatja a figyelembe veendő modellek részhalmazait, és mennyi időt kell tölteni a hangolásukkal, így kezelhető az edzési sebesség és a pontosság közötti kompromisszum. Az előre beállított beállításokon kívül a tapasztaltabb felhasználók használhatják a hyperparameters argumentum az összetevőmodellek pontos meghatározásához és a rajtuk beállítandó hiperparaméterek meghatározásához. Meghatározunk egy 1,800 másodperces időkorlátot is, amely után a prediktor leállítja az edzést.

A motorháztető alatt az AutoGluon-TimeSeries a lehető legtöbb modellt betanítja a megadott időkereten belül, kezdve a naiv, de erőteljes alapvonalakkal, és a megnövelt fákon és neurális hálózati modelleken alapuló összetettebb előrejelzők felé haladva. Hívással predictor.leaderboard(), láthatjuk az általa betanított modellek listáját, valamint az egyes modellek pontossági pontszámait és edzési idejét. Ne feledje, hogy minden AutoGluon-TimeSeries modell a hibáit „nagyobb, annál jobb” formátumban jelenti, ami azt jelenti, hogy a legtöbb előrejelzési hibamérték -1-gyel szorozódik jelentéskor. Lásd a következő példát:

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

Előrejelzés TimeSeriesPredictor segítségével

Végül felhasználhatjuk a prediktort az összes idősor előrejelzésére a TimeSeriesDataFrame, 7 nap a jövőbe. Vegye figyelembe, hogy mivel időben változó kovariánsokat használtunk, amelyekről feltételezzük, hogy a jövőben ismertek, ezeket is meg kell adni az előrejelzési időben. Lásd a következő kódot:

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

Alapértelmezés szerint az AutoGluon-TimeSeries pont előrejelzéseket és valószínűségi (kvantilis) előrejelzéseket is biztosít a célértékről. A valószínűségi előrejelzések számos tervezési feladatban nélkülözhetetlenek, és rugalmasan használhatók az intervallumok kiszámítására, lehetővé téve az olyan későbbi feladatokat, mint a készlet- és kapacitástervezés.

Egyszerű és pontos előrejelzés az AutoGluon-TimeSeries PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.

Az alábbiakban egy minta előrejelzési diagram látható, amely a pont-előrejelzéseket és az előrejelzési intervallumokat mutatja be.

Egyszerű és pontos előrejelzés az AutoGluon-TimeSeries PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.

Következtetés

Az AutoGluon-TimeSeries segítségével az előrejelzők és adattudósok gyorsan és egyszerűen hozhatnak létre hatékony előrejelzési modelleket. Az ebben a bejegyzésben bemutatott, a könyvtár néhány gyakran használt funkciója mellett az AutoGluon-TimeSeries számos módot kínál az előrejelzések konfigurálására haladó felhasználók számára. A prediktorok könnyen kiképezhetők, telepíthetők és nagyarányú szolgálatot tesznek velük Amazon SageMaker, AutoGluon mély tanulással konténerek.

Az AutoGluon használatával kapcsolatos további részletekért, példákért, oktatóanyagokért, valamint az AutoGluon által megoldott egyéb feladatokért, például táblázatos vagy multimodális adatokon való tanulásért látogasson el a weboldalra. AutoGluon. Az AutoGluon-TimeSeries használatának megkezdéséhez tekintse meg a mi oldalunkat gyors kezdési útmutató vagy mi mélyreható bemutató a könyvtár által kínált összes funkció mélyebb megismeréséhez. Kövesse az AutoGluon bekapcsolását Twitter, és csillagozzon meg minket GitHub hogy értesüljön a legújabb frissítésekről.

A dedikált számítási és munkafolyamatokkal, vállalati szintű támogatással, az előrejelzések magyarázhatóságával és még sok mással kapcsolatos nagymértékű előrejelzéshez tekintse meg a Amazon előrejelzés.

Referenciák

[1] Salinas, David, Valentin Flunkert, Jan Gasthaus és Tim Januschowski. "DeepAR: Valószínűségi előrejelzés autoregresszív visszatérő hálózatokkal." International Journal of Forecasting 36. 3 (2020): 1181-1191.

[2] Lim, Bryan, Sercan O Arik, Nicolas Loeff és Tomas Pfister. "Temporal Fusion Transformers az értelmezhető többhorizontú idősorok előrejelzéséhez." International Journal of Forecasting 37.4 (2021): 1748-1764.

[3] Makridakis, Spyros, Evangelos Spiliotis és Vassilios Assimakopoulos. "Az M4 verseny: 100,000 61 idősor és XNUMX előrejelzési módszer." International Journal of Forecasting 36.1 (2020): 54-74.


A szerzőkről

Egyszerű és pontos előrejelzés az AutoGluon-TimeSeries PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.Caner Türkmén Alkalmazott tudós az Amazon Web Servicesnél, ahol az AutoGluon-TimeSeries fejlesztése mellett a gépi tanulás és az előrejelzés találkozásánál felmerülő problémákkal foglalkozik. Mielőtt csatlakozott volna az AWS-hez, a vezetési tanácsadási ágazatban dolgozott adatkutatóként, a pénzügyi szolgáltatások és a telekommunikációs iparágak projektjei során világszerte. Caner személyes kutatási érdeklődési köre számos témát ölel fel, beleértve az előrejelzést, az ok-okozati következtetéseket és az AutoML-t.

Egyszerű és pontos előrejelzés az AutoGluon-TimeSeries PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.Olekszandr Shchur az Amazon Web Services alkalmazott tudósa, ahol az AutoGluon-TimeSeries idősoros előrejelzésével foglalkozik. Mielőtt csatlakozott volna az AWS-hez, PhD fokozatot szerzett gépi tanulásból a Müncheni Műszaki Egyetemen (Németország), ahol eseményadatok valószínűségi modelljeivel foglalkozott. Kutatási területe az időbeli adatok gépi tanulása és a generatív modellezés.

Egyszerű és pontos előrejelzés az AutoGluon-TimeSeries PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.Nick Erickson az Amazon Web Services vezető alkalmazott tudósa. Mester fokozatát a Minnesota Twin Cities Egyetemen szerezte számítástechnika és mérnöki szakon. Társszerzője és vezető fejlesztője az AutoGluon nyílt forráskódú AutoML keretrendszernek. A 2018-ban személyes versenytárs ML eszköztárként indulva Nick folyamatosan bővítette az AutoGluon képességeit, és 2019-ben csatlakozott az Amazon AI-hez, hogy nyílt forráskódú projektet kapjon, és teljes munkaidőben dolgozzon az AutoML legkorszerűbb fejlesztésén.

Időbélyeg:

Még több AWS gépi tanulás