Koneoppimisen (ML) yleistyessä useilla toimialoilla organisaatiot havaitsevat tarpeen kouluttaa ja palvella suuria määriä ML-malleja vastatakseen asiakkaidensa erilaisiin tarpeisiin. Erityisesti ohjelmiston palveluntarjoajille (SaaS) on kyky kouluttaa ja palvella tuhansia malleja tehokkaasti ja kustannustehokkaasti kilpailukykyisenä nopeasti kehittyvillä markkinoilla.
Tuhansien mallien kouluttaminen ja palveleminen vaatii vankan ja skaalautuvan infrastruktuurin Amazon Sage Maker voi auttaa. SageMaker on täysin hallittu alusta, jonka avulla kehittäjät ja datatieteilijät voivat rakentaa, kouluttaa ja ottaa käyttöön ML-malleja nopeasti ja tarjoaa samalla AWS-pilviinfrastruktuurin käytön kustannussäästöetuja.
Tässä viestissä tutkimme, kuinka voit käyttää SageMaker-ominaisuuksia, mukaan lukien Amazon SageMaker -käsittely, SageMaker-koulutustyöt ja SageMaker-monimallipäätepisteet (MME), joiden avulla voit kouluttaa ja palvella tuhansia malleja kustannustehokkaalla tavalla. Pääset alkuun kuvaillun ratkaisun kanssa tutustumalla mukana tulevaan muistikirjaan GitHub.
Käyttötapaus: Energian ennustaminen
Tässä postauksessa otamme ISV-yrityksen roolin, joka auttaa asiakkaitaan tulemaan kestävämmiksi seuraamalla heidän energiankulutustaan ja tarjoamalla ennusteita. Yrityksellämme on 1,000 asiakasta, jotka haluavat ymmärtää paremmin energiankäyttöään ja tehdä tietoisia päätöksiä ympäristövaikutusten vähentämiseksi. Tätä varten käytämme synteettistä tietojoukkoa ja koulutamme siihen perustuvan ML-mallin profeetta kunkin asiakkaan tehtäväksi tehdä energiankulutusennusteita. SageMakerin avulla voimme tehokkaasti kouluttaa ja palvella näitä 1,000 XNUMX mallia ja tarjota asiakkaillemme tarkkoja ja käytännöllisiä tietoja heidän energiankäytöstään.
Luodussa tietojoukossa on kolme ominaisuutta:
- Asiakas ID – Tämä on kokonaislukutunniste jokaiselle asiakkaalle, joka vaihtelee välillä 0–999.
- aikaleima – Tämä on päivämäärä/aika-arvo, joka osoittaa ajan, jolloin energiankulutus mitattiin. Aikaleimat luodaan satunnaisesti koodissa määritettyjen alkamis- ja lopetuspäivien välillä.
- kulutus – Tämä on kelluva arvo, joka ilmaisee energiankulutuksen, mitattuna jollakin mielivaltaisella yksiköllä. Kulutusarvot generoidaan satunnaisesti välillä 0–1,000 XNUMX sinimuotoisella kausivaihtelulla.
Ratkaisun yleiskatsaus
Voimme käyttää seuraavia SageMaker-ominaisuuksia kouluttaaksemme ja palvellaksemme tehokkaasti tuhansia ML-malleja:
- SageMaker-käsittely – SageMaker Processing on täysin hallittu tietojen valmistelupalvelu, jonka avulla voit suorittaa syötetietojesi tietojenkäsittely- ja mallinarviointitehtäviä. Voit käyttää SageMaker Processingia muuntaaksesi raakadataa koulutusta ja päätelmiä varten tarvittavaan muotoon sekä suorittaaksesi mallien erä- ja online-arviointeja.
- SageMaker koulutustyöt – Voit käyttää SageMaker-harjoitustehtäviä mallien kouluttamiseen erilaisilla algoritmeilla ja syötetietotyypeillä sekä määrittää koulutukseen tarvittavat laskentaresurssit.
- SageMaker MME:t – Usean mallin päätepisteiden avulla voit isännöidä useita malleja yhdessä päätepisteessä, mikä tekee useiden mallien ennusteiden tarjoamisesta helppoa yhden API:n avulla. SageMaker MME:t voivat säästää aikaa ja resursseja vähentämällä useiden mallien ennusteiden palvelemiseen tarvittavien päätepisteiden määrää. MME:t tukevat sekä CPU- että GPU-tuettujen mallien isännöintiä. Huomaa, että skenaariossamme käytämme 1,000 XNUMX mallia, mutta tämä ei rajoita itse palvelua.
Seuraava kaavio kuvaa ratkaisuarkkitehtuuria.
Työnkulku sisältää seuraavat vaiheet:
- Käytämme SageMaker Processingia tietojen esikäsittelyyn ja yksittäisen CSV-tiedoston luomiseen asiakasta kohti ja sen tallentamiseen Amazonin yksinkertainen tallennuspalvelu (Amazon S3).
- SageMaker-koulutustyö on määritetty lukemaan SageMaker Processing -työn tulos ja jakamaan se kiertoteitse koulutustapahtumiin. Huomaa, että tämä voidaan saavuttaa myös Amazon SageMaker -putkistot.
- Mallin artefaktit tallennetaan Amazon S3:een koulutustyön mukaan, ja ne toimitetaan suoraan SageMaker MME:stä.
Skaalaa koulutus tuhansiin malleihin
Tuhansien mallien koulutuksen skaalaaminen on mahdollista kautta distribution
parametri Koulutussyöttö luokka SageMaker Python SDK:ssa, jonka avulla voit määrittää, kuinka tiedot jaetaan useille koulutusesiintymille koulutustyötä varten. Vaihtoehtoja on kolme distribution
parametri: FullyReplicated
, ShardedByS3Key
ja ShardedByRecord
. ShardedByS3Key
Vaihtoehto tarkoittaa, että harjoitustiedot jaetaan S3-objektiavaimella, jolloin jokainen harjoitusinstanssi vastaanottaa yksilöllisen osajoukon dataa, jolloin vältetään päällekkäisyys. Kun SageMaker on kopioinut tiedot koulutussäiliöihin, voimme lukea kansio- ja tiedostorakenteen ja kouluttaa yksilöllisen mallin asiakastiedostoa kohden. Seuraavassa on esimerkkikoodinpätkä:
Jokainen SageMaker-koulutustyö tallentaa malliin, joka on tallennettu /opt/ml/model
koulutussäiliön kansio ennen sen arkistointia a model.tar.gz
tiedostoon ja lataa sen sitten Amazon S3:een koulutustyön päätyttyä. Tehokäyttäjät voivat myös automatisoida tämän prosessin SageMaker Pipelinesin avulla. Kun useita malleja tallennetaan saman koulutustyön kautta, SageMaker luo yhden model.tar.gz
tiedosto, joka sisältää kaikki koulutetut mallit. Tämä tarkoittaisi sitä, että meidän on ensin purettava arkisto, jotta voimme palvella mallia. Tämän välttämiseksi käytämme tarkistuspisteitä yksittäisten mallien tilan säästämiseksi. SageMaker tarjoaa toiminnon kopioida koulutustyön aikana luodut tarkistuspisteet Amazon S3:een. Tässä tarkistuspisteet on tallennettava ennalta määritettyyn paikkaan oletusasetuksena /opt/ml/checkpoints
. Näitä tarkistuspisteitä voidaan käyttää koulutuksen jatkamiseen myöhemmin tai mallina päätepisteessä. Katso korkeatasoinen yhteenveto siitä, kuinka SageMaker-koulutusalusta hallitsee harjoitustietojoukkojen, malliartefaktien, tarkistuspisteiden ja tulosteiden tallennuspolkuja AWS-pilvitallennusten ja SageMakerin koulutustöiden välillä. Amazon SageMaker Training -tallennuskansiot harjoitustietosarjoille, tarkistuspisteille, malliartefakteille ja tulosteille.
Seuraava koodi käyttää kuvitteellista model.save()
toimivat train.py
harjoituslogiikan sisältävä skripti:
Skaalaa johtopäätös tuhansiin malleihin SageMaker MME:illä
SageMaker MME:iden avulla voit palvella useita malleja samanaikaisesti luomalla päätepistemäärityksen, joka sisältää luettelon kaikista palvelevista malleista, ja luomalla sitten päätepisteen käyttämällä kyseistä päätepistemääritystä. Päätepistettä ei tarvitse ottaa uudelleen käyttöön joka kerta, kun lisäät uuden mallin, koska päätepiste palvelee automaattisesti kaikkia määritettyihin S3-polkuihin tallennettuja malleja. Tämä saavutetaan Monimallipalvelin (MMS), avoimen lähdekoodin kehys ML-mallien palvelemiseen, jotka voidaan asentaa säilöihin tarjoamaan käyttöliittymän, joka täyttää uusien MME-säilösovellusliittymien vaatimukset. Lisäksi voit käyttää muita mallipalvelimia, mukaan lukien SoihtuPalvelu ja Triton. MMS voidaan asentaa mukautettuun säilön kautta SageMaker Inference Toolkit. Lisätietoja Docker-tiedoston määrittämisestä sisällyttämään MMS-viestit ja käyttämään sitä mallien palvelemiseen on osoitteessa Rakenna oma säiliö SageMakerin usean mallin päätepisteille.
Seuraava koodinpätkä näyttää, kuinka MME luodaan SageMaker Python SDK:lla:
Kun MME on live-tilassa, voimme kutsua sitä ennusteiden luomiseksi. Kutsut voidaan tehdä missä tahansa AWS SDK:ssa sekä SageMaker Python SDK:lla, kuten seuraavassa koodinpätkässä näkyy:
Mallia kutsuttaessa malli ladataan alun perin Amazon S3:sta instanssiin, mikä voi aiheuttaa kylmäkäynnistyksen uutta mallia kutsuttaessa. Usein käytetyt mallit tallennetaan välimuistiin ja levylle alhaisen latenssin päätelmien aikaansaamiseksi.
Yhteenveto
SageMaker on tehokas ja kustannustehokas alusta tuhansien ML-mallien koulutukseen ja palvelemiseen. Sen ominaisuudet, mukaan lukien SageMaker Processing, koulutustyöt ja MME:t, antavat organisaatioille mahdollisuuden kouluttaa ja palvella tehokkaasti tuhansia malleja mittakaavassa, samalla kun ne hyötyvät AWS Cloud -infrastruktuurin käytön kustannussäästöeduista. Lisätietoja SageMakerin käyttämisestä tuhansien mallien koulutukseen ja palvelemiseen on osoitteessa Käsittele tietoja, Kouluta malli Amazon SageMakerilla ja Isännöi useita malleja yhdessä säilössä yhden päätepisteen takana.
Tietoja Tekijät
Davide Gallitelli on AI/ML:n erikoisratkaisuarkkitehti EMEA-alueella. Hänen kotipaikkansa on Bryssel ja työskentelee tiiviisti asiakkaiden kanssa kaikkialla Benelux-maissa. Hän on ollut kehittäjä pienestä pitäen, aloitti koodaamisen 7-vuotiaana. Hän aloitti tekoälyn/ML:n opiskelun yliopistossa ja on siitä lähtien rakastunut siihen.
Maurits de Groot on ratkaisuarkkitehti Amazon Web Servicesissä Amsterdamissa. Hän haluaa työskennellä koneoppimiseen liittyvien aiheiden parissa ja hänellä on taipumus startup-yrityksiin. Vapaa-ajallaan hän harrastaa hiihtoa ja squashia.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. Autot / sähköautot, hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- BlockOffsets. Ympäristövastuun omistuksen nykyaikaistaminen. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/scale-training-and-inference-of-thousands-of-ml-models-with-amazon-sagemaker/
- :on
- :On
- :ei
- :missä
- 000
- 000 asiakasta
- 1
- 10
- 100
- 12
- 15%
- 20
- 7
- a
- kyky
- Meistä
- tarkka
- saavutettu
- poikki
- lisätä
- Lisäksi
- etuja
- Jälkeen
- ikä
- AI / ML
- algoritmit
- Kaikki
- sallia
- mahdollistaa
- jo
- Myös
- Amazon
- Amazon Sage Maker
- Amazon Web Services
- Amsterdam
- an
- ja
- Kaikki
- api
- API
- arkkitehtuuri
- Archive
- OVAT
- perustelu
- AS
- olettaa
- At
- automatisoida
- automaattisesti
- välttää
- välttämällä
- AWS
- perustua
- BE
- koska
- tulevat
- tulee
- ollut
- ennen
- takana
- ovat
- hyötyvät
- Hyödyt
- Paremmin
- välillä
- sekä
- Bryssel
- rakentaa
- mutta
- by
- soittamalla
- CAN
- tapaus
- luokka
- tarkasti
- pilvi
- pilvi infrastruktuuri
- Cloud Storage
- koodi
- kylmä
- yritys
- kilpailukykyinen
- valmistuminen
- Laskea
- Konfigurointi
- määritetty
- kulutus
- Kontti
- Kontit
- kustannustehokas
- luoda
- luotu
- luo
- Luominen
- ratkaiseva
- asiakassuhde
- asiakas
- Asiakkaat
- tiedot
- Tietojen valmistelu
- tietojenkäsittely
- aineistot
- Päivämäärät
- päätökset
- oletusarvo
- määritellä
- määritelmä
- sijoittaa
- on kuvattu
- Kehittäjä
- kehittäjille
- suoraan
- näytöt
- jakaa
- jaettu
- useat
- do
- tehty
- aikana
- kukin
- helppo
- tehokkaasti
- EMEA
- mahdollistaa
- mahdollistaa
- loppu
- päätepiste
- energia
- Energian kulutus
- ympäristön
- arviointi
- arvioinnit
- Joka
- kehittyvä
- esimerkki
- tutkia
- Fallen
- Muoti
- Ominaisuudet
- filee
- Asiakirjat
- löytäminen
- Etunimi
- kellua
- jälkeen
- varten
- Aloittelijoille
- ennusteet
- muoto
- Puitteet
- usein
- alkaen
- etuosa
- etupään
- täysin
- toiminto
- toiminnallisuus
- tuottaa
- syntyy
- saada
- GitHub
- he
- auttaa
- auttaa
- tätä
- korkean tason
- hänen
- isäntä
- hotellit
- Miten
- Miten
- HTML
- http
- HTTPS
- tunniste
- havainnollistaa
- Vaikutus
- tuoda
- in
- sisältää
- sisältää
- Mukaan lukien
- yhä useammin
- ilmaisee
- henkilökohtainen
- teollisuuden
- tietoa
- Infrastruktuuri
- ensin
- panos
- tuloa
- sisällä
- oivalluksia
- asennetaan
- esimerkki
- tulee
- IT
- SEN
- itse
- Job
- Työpaikat
- jpg
- json
- avain
- suuri
- myöhemmin
- OPPIA
- oppiminen
- tykkää
- rajoitus
- Lista
- elää
- paikallisesti
- sijainti
- logiikka
- rakkaus
- kone
- koneoppiminen
- tehdä
- TEE
- onnistui
- hallinnoi
- markkinat
- tarkoittaa
- välineet
- Tavata
- Muisti
- ML
- malli
- mallit
- hetki
- lisää
- moninkertainen
- nimi
- Tarve
- tarvitaan
- tarpeet
- Uusi
- Nro
- muistikirja
- numero
- numerot
- objekti
- of
- tarjoamalla
- on
- ONE
- verkossa
- avoimen lähdekoodin
- Vaihtoehto
- Vaihtoehdot
- or
- tilata
- organisaatioiden
- OS
- Muut
- meidän
- Yhtiömme
- ulos
- ulostulo
- oma
- parametri
- erityinen
- kulkea
- polku
- varten
- Suorittaa
- aika
- kuva
- foorumi
- Platon
- Platonin tietotieto
- PlatonData
- pelaa
- mahdollinen
- Kirje
- teho
- voimakas
- Ennusteet
- Predictor
- valmistelu
- vallitseva
- prosessi
- käsittely
- toimittaa
- tarjoajat
- tarjoaa
- tarjoamalla
- Python
- nopeasti
- satunnaisesti tuotettu
- alue
- alainen
- nopeasti
- raaka
- Lue
- reaaliaikainen
- vastaanottava
- vähentää
- vähentämällä
- alue
- vaatimukset
- Vaatii
- Esittelymateriaalit
- johtua
- jatkaa
- luja
- Rooli
- ajaa
- SaaS
- sagemaker
- SageMaker-putkistot
- sama
- Säästä
- skaalautuva
- Asteikko
- skenaario
- tutkijat
- sdk
- palvella
- servers
- palvelu
- Palvelut
- palvelevat
- setti
- sirpaleinen
- esitetty
- Näytä
- Yksinkertainen
- koska
- single
- pätkä
- Tuotteemme
- ohjelmisto palveluna
- ratkaisu
- Ratkaisumme
- jonkin verran
- asiantuntija
- määritelty
- Alkaa
- alkoi
- Aloita
- Startups
- Osavaltio
- Askeleet
- Levytila
- verkkokaupasta
- tallennettu
- varastot
- tallentamiseksi
- rakenne
- YHTEENVETO
- tuki
- kestävä
- synteettinen
- Kohde
- tehtävät
- että
- -
- Valtion
- heidän
- sitten
- Siellä.
- Nämä
- tätä
- tuhansia
- kolmella
- kauttaaltaan
- aika
- että
- Aiheet
- Seuranta
- Juna
- koulutettu
- koulutus
- Muuttaa
- tyypit
- ymmärtää
- unique
- yksikkö
- yliopisto
- päälle
- Käyttö
- käyttää
- käytetty
- Käyttäjät
- käyttötarkoituksiin
- käyttämällä
- arvo
- arvot
- lajike
- hyvin
- kautta
- W
- haluta
- oli
- Tapa..
- we
- verkko
- verkkopalvelut
- HYVIN
- kun
- joka
- vaikka
- KUKA
- leveä
- Laaja valikoima
- tulee
- with
- sisällä
- Referenssit
- työnkulku
- toimii
- olisi
- Voit
- nuori
- Sinun
- zephyrnet