Olitpa sitten kohdentamassa resursseja tehokkaammin verkkoliikenteeseen, ennakoimassa potilaan kysyntää henkilöstötarpeisiin tai ennakoimassa yrityksen tuotteiden myyntiä, ennustaminen on olennainen työkalu monissa yrityksissä. Yksi erityinen käyttötapaus, joka tunnetaan nimellä kylmäkäynnistyksen ennustaminen, rakentaa ennusteita aikasarjalle, jolla on vähän tai ei ollenkaan historiallista tietoa, kuten uudesta tuotteesta, joka on juuri tullut markkinoille vähittäiskaupan alalla. Perinteiset aikasarjaennustusmenetelmät, kuten autoregressiivinen integroitu liukuva keskiarvo (ARIMA) tai eksponentiaalinen tasoitus (ES), perustuvat suuresti kunkin yksittäisen tuotteen historiallisiin aikasarjoihin, eivätkä siksi ole tehokkaita kylmäkäynnistysennusteissa.
Tässä viestissä esittelemme, kuinka kylmäkäynnistysmoottori rakennetaan käyttämällä AutoGluon AutoML aikasarjan ennustamiseen, avoimen lähdekoodin Python-paketti, joka automatisoi kuvien, tekstin, taulukkojen ja aikasarjatietojen koneoppimisen (ML). AutoGluon tarjoaa päästä päähän automatisoidun koneoppimisprosessin (AutoML) aloittelijoille kokeneille ML-kehittäjille, mikä tekee siitä tarkimman ja helppokäyttöisimmän täysin automatisoidun ratkaisun. Käytämme ilmaista Amazon SageMaker Studio Lab palvelua tälle esittelylle.
Johdatus AutoGluon-aikasarjoihin
AutoGluon on johtava avoimen lähdekoodin kirjasto teksti-, kuva- ja taulukkotiedoille AutoML:lle, jonka avulla voit tuottaa erittäin tarkkoja malleja raakatiedoista yhdellä koodirivillä. Viime aikoina tiimi on pyrkinyt laajentamaan näitä ominaisuuksia aikasarjatietoihin ja kehittänyt automaattisen ennustemoduulin, joka on julkisesti saatavilla GitHub. autogluon.forecasting
moduuli käsittelee automaattisesti raaka-aikasarjatiedot sopivaan muotoon ja kouluttaa ja virittää sitten erilaisia huippuluokan syväoppimismalleja tarkkojen ennusteiden tuottamiseksi. Tässä viestissä esittelemme, kuinka sitä käytetään autogluon.forecasting
ja soveltaa sitä kylmäkäynnistysennustetehtäviin.
Ratkaisun yleiskatsaus
Koska AutoGluon on avoimen lähdekoodin Python-paketti, voit ottaa tämän ratkaisun käyttöön paikallisesti kannettavassa tietokoneessa tai Amazon SageMaker Studio Labissa. Käymme läpi seuraavat vaiheet:
- Ota AutoGluon käyttöön Amazon SageMaker Studio Labia varten.
- Valmistele tietojoukko.
- Määritä harjoitusparametrit AutoGluonilla.
- Harjoittele kylmäkäynnistysennustemoottori aikasarjan ennustamista varten.
- Visualisoi kylmäkäynnistysennusteita.
Kylmäkäynnistysennusteen keskeinen oletus on, että ominaisuuksiltaan samanlaisilla kohteilla tulisi olla samanlaiset aikasarjat, minkä ansiosta kylmäkäynnistysennuste voi tehdä ennusteita eristä ilman historiatietoja, kuten seuraavassa kuvassa näkyy.
Käytämme läpikäynnissämme synteettistä sähkönkulutukseen perustuvaa tietojoukkoa, joka koostuu 370 kohteen tuntiaikasarjoista, joista jokaisella on item_id
0-369. Tämän synteettisen tietojoukon sisällä jokainen item_id
liittyy myös staattiseen ominaisuuteen (ominaisuus, joka ei muutu ajan myötä). Koulutamme a DeepAR mallinnu AutoGluonilla oppiaksesi samankaltaisten kohteiden tyypillisen käyttäytymisen ja siirtää tällaisen käyttäytymisen tehdäksesi ennusteita uusista kohteista (item_id
370–373), joilla ei ole historiallisia aikasarjatietoja. Vaikka esittelemme kylmäkäynnistysennusteen lähestymistapaa vain yhdellä staattisella ominaisuudella, käytännössä informatiiviset ja laadukkaat staattiset ominaisuudet ovat hyvän kylmäkäynnistysennusteen avain.
Seuraava kaavio tarjoaa korkean tason yleiskatsauksen ratkaisustamme. Avoimen lähdekoodin koodi on saatavilla osoitteessa GitHub repo.
Edellytykset
Tätä kävelyä varten sinulla tulisi olla seuraavat edellytykset:
- An Amazon SageMaker Studio Lab -tili
- GitHub tilin käyttöoikeus
Kirjaudu sisään Amazon SageMaker Studio Lab -tilillesi ja määritä ympäristö päätelaitteen avulla:
Näiden ohjeiden pitäisi toimia myös kannettavalla tietokoneellasi, jos sinulla ei ole pääsyä Amazon SageMaker Studio Labiin (suosittelemme asentamaan Anacondan ensin kannettavaan tietokoneeseen).
Kun virtuaaliympäristö on täysin määritetty, käynnistä muistikirja AutoGluon-cold-start-demo.ipynb
ja valitse mukautettu ympäristö .conda-autogluon:Python
ydin.
Valmistele tavoiteaikasarja ja kohteen metatietojoukko
Lataa seuraavat tietojoukot muistikirjaasi, jos ne eivät sisälly, ja tallenna ne hakemistoon data/
. Löydät nämä tietojoukot sivuiltamme GitHub repo:
- Test.csv.gz
- coldStartTargetData.csv
- itemMetaData.csv
Suorita seuraava koodinpätkä ladataksesi kohdeaikasarjatietojoukon ytimeen:
AutoGluon-aikasarja edellyttää staattisten ominaisuuksien esittämistä numeerisessa muodossa. Tämä voidaan saavuttaa hakemalla LabelEncoder()
staattisessa ominaisuudessamme type
, jossa koodaamme A=0, B=1, C=2, D=3 (katso seuraava koodi). Oletusarvoisesti AutoGluon päättelee staattisen ominaisuuden olevan joko järjestys- tai kategorinen. Voit myös korvata tämän muuntamalla staattisen ominaisuuden sarakkeen objekti-/merkkijonotietotyypiksi kategorisille ominaisuuksille tai kokonaisluku-/kelluketietotyypiksi järjestyskohtaisille ominaisuuksille.
Määritä ja aloita AutoGluon-mallikoulutus
Meidän on täsmennettävä save_path = ‘autogluon-coldstart-demo’
mallin artefaktikansion nimenä (katso seuraava koodi). Asetamme myös omamme eval_metric
as keskimääräinen absoluuttinen prosentuaalinen virhetai ‘MAPE’
lyhyesti sanottuna, missä määrittelimme prediction_length
kuin 24 tuntia. Jos sitä ei ole määritetty, AutoGluon tuottaa oletusarvoisesti todennäköisyysennusteita ja pisteyttää ne -sovelluksen kautta painotettu kvantiilihäviö. Katsomme vain DeepAR malli esittelyssämme, koska tiedämme, että DeepAR-algoritmi mahdollistaa kylmäkäynnistyksen ennakoinnin. Asetamme yhden DeepAR-hyperparametreistä mielivaltaisesti ja välitämme sen hyperparametrille ForecastingPredictor().fit()
soittaa puhelimella. Tämä antaa AutoGluonille mahdollisuuden tarkastella vain määritettyä mallia. Täydellinen luettelo viritettävistä hyperparametreista on kohdassa gluonts.model.deepar-paketti.
Harjoittelu kestää 30-45 minuuttia. Saat mallin yhteenvedon kutsumalla seuraavaa funktiota:
Ennuste kylmäkäynnistyskohteesta
Nyt olemme valmiita luomaan ennusteita kylmäkäynnistystuotteelle. Suosittelemme, että kullekin on vähintään viisi riviä item_id
. Siksi varten item_id
jossa on vähemmän kuin viisi havaintoa, täytämme NaN:illa. Demossamme molemmat item_id
370:llä ja 372:lla on nolla havainto, puhdas kylmäkäynnistysongelma, kun taas kahdella muulla on viisi tavoitearvoa.
Lataa kylmäkäynnistyksen tavoiteaikasarjatietojoukko seuraavalla koodilla:
Syötämme kylmäkäynnistyksen tavoiteaikasarjat AutoGluon-malliimme sekä kylmäkäynnistyksen kohteen metatietojoukon item_id
:
Visualisoi ennusteet
Voimme luoda piirtofunktion luomaan visualisoinnin kylmäkäynnistysennusteesta seuraavan kaavion mukaisesti.
Puhdistaa
Resurssien käytön optimoimiseksi harkitse Amazon SageMaker Studio Labin suoritusajan pysäyttämistä, kun olet tutkinut muistikirjan kokonaan.
Yhteenveto
Tässä viestissä näytimme, kuinka kylmäkäynnistysennustemoottori rakennetaan AutoGluon AutoML:n avulla aikasarjatiedoille Amazon SageMaker Studio Labissa. Niille teistä, jotka ihmettelevät eroa Amazonin sääennuste ja AutoGluon (aikasarja), Amazon Forecast on täysin hallittu ja tuettu palvelu, joka käyttää koneoppimista (ML) erittäin tarkkojen ennusteiden luomiseen ilman aikaisempaa ML-kokemusta. Vaikka AutoGluon on avoimen lähdekoodin projekti, jota yhteisö tukee uusimmalla tutkimuspanoksella. Kävimme läpi kattavan esimerkin osoittaaksemme, mihin aikasarjojen AutoGluon pystyy, ja toimitimme tietojoukon ja käyttötapauksen.
Aikasarjatietojen AutoGluon on avoimen lähdekoodin Python-paketti, ja toivomme, että tämä viesti yhdessä koodiesimerkkimme kanssa antaa sinulle suoraviivaisen ratkaisun haastaviin kylmäkäynnistysennustusongelmiin. Löydät koko esimerkin sivultamme GitHub repo. Kokeile sitä ja kerro meille mielipiteesi!
Tietoja Tekijät
Ivan Cui on tietotutkija AWS Professional Services -palvelussa, jossa hän auttaa asiakkaita rakentamaan ja ottamaan käyttöön ratkaisuja koneoppimisen avulla AWS:ssä. Hän on työskennellyt asiakkaiden kanssa eri toimialoilla, mukaan lukien ohjelmisto-, rahoitus-, lääke- ja terveydenhuoltoala. Vapaa-ajallaan hän nauttii lukemisesta, perheen kanssa viettämisestä ja osakesalkkunsa maksimoinnista.
Jonas Mueller on vanhempi soveltuva tutkija AWS:n tekoälytutkimus- ja koulutusryhmässä, jossa hän kehittää uusia algoritmeja parantaakseen syväoppimista ja kehittääkseen automatisoitua koneoppimista. Ennen kuin hän liittyi AWS:ään demokratisoimaan ML:ää, hän suoritti tohtorin tutkinnon MIT:n tietojenkäsittelytieteen ja tekoälylaboratoriossa. Vapaa-ajallaan hän nauttii vuorten ja ulkoilun tutkimisesta.
Wenming Ye on AWS AI:n tutkimustuotepäällikkö. Hän haluaa auttaa tutkijoita ja yritysasiakkaita skaalaamaan innovaatioitaan nopeasti avoimen lähdekoodin ja huippuluokan koneoppimisteknologian avulla. Wenmingillä on monipuolinen T&K-kokemus Microsoft Researchista, SQL-suunnittelutiimistä ja menestyneistä startupeista.
- "
- 100
- 9
- Meistä
- absoluuttinen
- pääsy
- Tili
- tarkka
- saavutettu
- poikki
- AI
- ai tutkimusta
- algoritmi
- algoritmit
- Salliminen
- Vaikka
- Amazon
- Hakeminen
- lähestymistapa
- keinotekoinen
- tekoäly
- Automatisoitu
- saatavissa
- keskimäärin
- AWS
- rakentaa
- rakentaa
- yritykset
- soittaa
- Voi saada
- kyvyt
- CD
- muuttaa
- Kassa
- koodi
- Sarake
- yhteisö
- Yrityksen
- Tietojenkäsittelyoppi
- kulutus
- Asiakkaat
- tiedot
- tietojen tutkija
- Kysyntä
- sijoittaa
- Malli
- kehittää
- kehitetty
- kehittäjille
- ei
- koulutus
- Tehokas
- sähkö
- Tekniikka
- astui sisään
- yritys
- ympäristö
- olennainen
- esimerkki
- experience
- kokenut
- laajentaa
- perhe
- Ominaisuus
- Ominaisuudet
- Kuva
- rahoittaa
- Etunimi
- jälkeen
- muoto
- Ilmainen
- koko
- toiminto
- tulevaisuutta
- tuottaa
- mennä
- hyvä
- Ryhmä
- ottaa
- terveydenhuollon
- auttaa
- erittäin
- historiallinen
- Miten
- Miten
- HTTPS
- kuva
- toteuttaa
- parantaa
- mukana
- Mukaan lukien
- henkilökohtainen
- teollisuuden
- teollisuus
- integroitu
- Älykkyys
- IT
- avain
- tunnettu
- kannettava tietokone
- uusin
- käynnistää
- johtava
- OPPIA
- oppiminen
- Kirjasto
- linja
- Lista
- vähän
- kuormitus
- kone
- koneoppiminen
- Tekeminen
- johtaja
- markkinat
- Meta
- Microsoft
- MIT
- ML
- malli
- mallit
- eniten
- liikkuvat
- uusi tuote
- muistikirja
- avoimen lähdekoodin
- Muut
- ulkona
- osuus
- Lääkealan
- salkku
- Ennusteet
- Ongelma
- ongelmia
- Prosessit
- tuottaa
- Tuotteet
- Tuotteemme
- ammatillinen
- projekti
- tarjoaa
- T & K-
- raaka
- Lukeminen
- suositella
- tutkimus
- resurssi
- Esittelymateriaalit
- vähittäiskauppa
- myynti
- Asteikko
- skaalaus
- tiede
- Tiedemies
- Sarjat
- palvelu
- Palvelut
- setti
- Lyhyt
- samankaltainen
- Tuotteemme
- Ratkaisumme
- menot
- Alkaa
- Startups
- Varastossa
- studio
- onnistunut
- Tuetut
- Kohde
- tehtävät
- joukkue-
- Elektroniikka
- terminaali
- Kautta
- aika
- yhdessä
- perinteinen
- liikenne
- koulutus
- junat
- us
- käyttää
- Virtual
- visualisointi
- verkko
- Mitä
- KUKA
- sisällä
- ilman
- Referenssit
- työskenteli
- työskentely
- nolla-