Amazon Sage Maker on ilmoitti kolmen uuden Amazon SageMakerin valmistumiskriteerin tuki automaattinen mallin viritys, joka tarjoaa sinulle ylimääräisen joukon vipuja, joilla voit hallita viritystyön pysäytyskriteerejä etsiessäsi mallillesi parasta hyperparametrikokoonpanoa.
Tässä viestissä keskustelemme näistä uusista valmistumiskriteereistä, milloin niitä tulee käyttää ja joistakin niistä tuomista eduista.
Automaattinen SageMaker-viritys
Automaattinen mallin viritys, jota kutsutaan myös hyperparametrien viritys, löytää parhaan version mallista valitsemamme mittarin mukaan mitattuna. Se pyörittää monia koulutustöitä toimitetussa tietojoukossa käyttämällä valittua algoritmia ja määritettyjä hyperparametrialueita. Jokainen koulutustyö voidaan suorittaa aikaisin, kun tavoitemittari ei parane merkittävästi, mikä tunnetaan varhaisena pysäyttämisenä.
Tähän asti yleistä viritystyötä oli rajoitettu, kuten koulutustöiden enimmäismäärän määrittäminen. Tämän parametrin arvon valinta on kuitenkin parhaimmillaan heuristista. Suurempi arvo nostaa virityskustannuksia, ja pienempi arvo ei välttämättä tuota mallin parasta versiota aina.
SageMakerin automaattinen mallin viritys ratkaisee nämä haasteet antamalla sinulle useita viritystyön suorittamiskriteerejä. Sitä sovelletaan viritystasolla kunkin yksittäisen koulutustyön sijaan, mikä tarkoittaa, että se toimii korkeammalla abstraktiotasolla.
Työn valmistumiskriteerien virittämisen edut
Hallitsemalla paremmin sitä, milloin viritystyö lopetetaan, saat kustannussäästöjä, koska työtä ei tehdä pitkiä aikoja ja se on laskennallisesti kallista. Se tarkoittaa myös, että pystyt varmistamaan, että työ ei pysähdy liian aikaisin ja saat riittävän laadukkaan mallin, joka täyttää tavoitteesi. Voit lopettaa viritystyön, kun mallit eivät enää parane iteraatioiden jälkeen tai kun arvioitu jäännösparannus ei oikeuta laskentaresursseja ja aikaa.
Nykyisen enimmäismäärän koulutustöiden suorittamiskriteerien lisäksi MaxNumberOfTrainingJobs, automaattinen mallin viritys sisältää mahdollisuuden lopettaa viritys maksimiviritysajan, parannusvalvonnan ja konvergenssitunnistuksen perusteella.
Tutkitaan jokaista näistä kriteereistä.
Maksimi viritysaika
Aikaisemmin sinulla oli mahdollisuus määrittää koulutustöiden enimmäismäärä resurssiraja-asetukseksi, jotta voit hallita viritysbudjettia laskentaresurssien suhteen. Tämä voi kuitenkin johtaa tarpeettomasti pitempiin tai lyhyempiin harjoitusaikoihin kuin tarvitaan tai toivotaan.
Kun olet lisännyt enimmäisviritysajan kriteerit, voit nyt jakaa harjoitusbudjettisi ajan mukaan viritystyön suorittamiseen ja lopettaa työn automaattisesti tietyn sekunneissa määritellyn ajan kuluttua.
Kuten yllä näkyy, käytämme MaxRuntimeInSeconds
määrittääksesi viritysajan sekunteina. Viritysaikarajan asettaminen auttaa rajoittamaan viritystyön kestoa ja myös kokeen arvioituja kustannuksia.
Kokonaiskustannukset ennen sopimusalennusta voidaan arvioida seuraavalla kaavalla:EstimatedComputeSeconds= MaxRuntimeInSeconds * MaxParallelTrainingJobs * InstanceCost
Maksimikäyttöaikaa sekunneissa voidaan käyttää kustannusten ja ajoajan sitomiseen. Toisin sanoen se on budjetin valvonnan suorittamiskriteeri.
Tämä ominaisuus on osa resurssien ohjauskriteeriä, eikä se ota huomioon mallien konvergenssia. Kuten näemme myöhemmin tässä viestissä, tätä kriteeriä voidaan käyttää yhdessä muiden pysäytyskriteerien kanssa kustannusten hallinnan saavuttamiseksi tarkkuudesta tinkimättä.
Haluttu tavoitemittari
Toinen aiemmin esitelty kriteeri on tavoitetavoitteen määrittäminen etukäteen. Kriteerit valvovat parhaan mallin suorituskykyä tietyn tavoitemittarin perusteella ja lopettavat virityksen, kun mallit saavuttavat määritellyn kynnyksen suhteessa määritettyyn tavoitemittariin.
Kanssa TargetObjectiveMetricValue
kriteerit, voimme ohjeistaa SageMakeria lopettamaan mallin virityksen, kun parhaan mallin tavoitemittari on saavuttanut määritetyn arvon:
Tässä esimerkissä meitä kehotetaan SageMakeria lopettamaan mallin virittäminen, kun parhaan mallin tavoitemittari on saavuttanut arvon 0.95.
Tämä menetelmä on hyödyllinen, kun sinulla on tietty tavoite, jonka haluat mallillasi saavuttavan, kuten tietyn tason tarkkuus-, tarkkuus-, palautus-, F1-pisteet, AUC, log-häviö ja niin edelleen.
Tyypillinen käyttötapa tälle kriteerille olisi käyttäjälle, joka tuntee jo mallin suorituskyvyn tietyillä kynnyksillä. Tutkimusvaiheessa oleva käyttäjä voi ensin virittää mallin pienellä suuremman tietojoukon osajoukolla tunnistaakseen tyydyttävän arvioinnin metriikan kynnyksen, joka on kohdistettava harjoitellessaan täydellä tietojoukolla.
Parannuksen seuranta
Tämä kriteeri tarkkailee mallien konvergenssia jokaisen iteraation jälkeen ja pysäyttää virityksen, jos mallit eivät paranna tietyn koulutustöiden määrän jälkeen. Katso seuraava kokoonpano:
Tässä tapauksessa asetamme MaxNumberOfTrainingJobsNotImproving
10:een, mikä tarkoittaa, että jos tavoitemittari lakkaa paranemasta 10 harjoitustyön jälkeen, viritys lopetetaan ja paras malli ja mittari raportoidaan.
Parannusseurantaa tulisi käyttää mallin laadun ja työnkulun kokonaiskeston välisen kompromissin säätämiseen tavalla, joka on todennäköisesti siirrettävissä eri optimointiongelmien välillä.
Konvergenssin havaitseminen
Konvergenssin tunnistus on valmistumiskriteeri, jonka avulla automaattinen mallin viritys päättää, milloin viritys lopetetaan. Yleensä automaattinen mallin viritys lopettaa virityksen, kun se arvioi, ettei merkittävää parannusta voida saavuttaa. Katso seuraava kokoonpano:
Kriteerit sopivat parhaiten, kun et aluksi tiedä, mitä pysäytysasetuksia valita.
Se on hyödyllistä myös, jos et tiedä, mikä tavoitetavoitteen metriikka on järkevää hyvää ennustetta varten, kun otetaan huomioon ongelma ja tietojoukko, ja haluat mieluummin saada viritystyön valmiiksi, kun se ei enää parane.
Kokeile suorituskriteerien vertailua
Tässä kokeessa suoritamme regressiotehtävän perusteella 3 virityskoetta löytääksemme optimaalisen mallin kahden hyperparametrin hakuavaruudessa, joissa on yhteensä 2 hyperparametrikonfiguraatiota. suoramarkkinoinnin tietojoukko.
Kun kaikki muu oli sama, ensimmäinen malli viritettiin BestObjectiveNotImproving
valmistumiskriteerit, toinen malli viritettiin CompleteOnConvergence
ja kolmas malli viritettiin ilman valmistumiskriteerejä.
Kutakin työtä kuvattaessa voimme havaita, että asetus on BestObjectiveNotImproving
kriteerit ovat johtaneet optimaalisiin resursseihin ja aikaan verrattuna objektiiviseen mittariin ja huomattavasti vähemmän suoritettuja töitä.
- CompleteOnConvergence
kriteerit pystyivät myös lopettamaan virityksen kokeilun puolivälissä, mikä johti vähemmän koulutustehtäviin ja lyhyempään koulutusaikaan verrattuna kriteerien asettamatta jättämiseen.
Vaikka valmistumiskriteerien asettamatta jättäminen johti kalliiseen kokeiluun, sen määrittäminen MaxRuntimeInSeconds
osana resurssirajaa olisi yksi tapa minimoida kustannukset.
Yllä olevat tulokset osoittavat, että kun määritetään valmistumiskriteerit, Amazon SageMaker pystyy älykkäästi pysäyttämään viritysprosessin havaitessaan, että malli ei todennäköisesti parane nykyistä tulosta pidemmälle.
Huomaa, että SageMakerin automaattisen mallin virityksen tukemat valmistumiskriteerit eivät sulje toisiaan pois ja niitä voidaan käyttää samanaikaisesti mallin virittämisessä.
Kun useampi kuin yksi valmistumisehto on määritetty, viritystyö valmistuu, kun jokin ehdoista täyttyy.
Esimerkiksi resurssirajakriteerien, kuten maksimiviritysajan, yhdistelmä konvergenssikriteerien kanssa, kuten parannusseuranta tai konvergenssin havaitseminen, voi tuottaa optimaalisen kustannusten hallinnan ja optimaalisen tavoitemitan.
Yhteenveto
Tässä viestissä keskustelimme siitä, kuinka voit nyt älykkäästi lopettaa viritystyösi valitsemalla joukon SageMakerissa äskettäin käyttöön otettuja valmistumisehtoja, kuten enimmäisviritysaika, parannusvalvonta tai lähentymisen havaitseminen.
Osoitimme kokeella, että älykäs pysäyttäminen, joka perustuu parannushavaintoon iteraatioiden välillä, voi johtaa merkittävästi optimoituun budjettiin ja ajanhallintaan verrattuna valmistumiskriteerien määrittelemättä jättämiseen.
Osoitimme myös, että nämä kriteerit eivät sulje toisiaan pois ja niitä voidaan käyttää samanaikaisesti mallia viritettäessä, jotta voidaan hyödyntää sekä budjetin hallintaa että optimaalista konvergenssia.
Lisätietoja automaattisen mallin virityksen määrittämisestä ja suorittamisesta on kohdassa Määritä hyperparametrien viritystyön asetukset.
Tietoja Tekijät
Doug Mbaya on Senior Partner Solution -arkkitehti, joka keskittyy dataan ja analytiikkaan. Doug tekee tiivistä yhteistyötä AWS-kumppaneiden kanssa ja auttaa heitä integroimaan data- ja analytiikkaratkaisuja pilveen.
Chaitra Mathur on AWS:n pääratkaisuarkkitehti. Hän opastaa asiakkaita ja kumppaneita rakentamaan erittäin skaalautuvia, luotettavia, turvallisia ja kustannustehokkaita ratkaisuja AWS:lle. Hän on intohimoinen koneoppimisesta ja auttaa asiakkaita muuttamaan ML-tarpeensa ratkaisuiksi AWS AI/ML -palveluilla. Hänellä on 5 sertifikaattia, mukaan lukien ML Specialty -sertifikaatti. Vapaa-ajallaan hän nauttii lukemisesta, joogasta ja viettämisestä tyttäriensä kanssa.
Jaroslav Shcherbatyi on koneoppimisinsinööri AWS:ssä. Hän työskentelee pääasiassa Amazon SageMaker -alustan parannuksissa ja auttaa asiakkaita käyttämään sen ominaisuuksia parhaalla mahdollisella tavalla. Vapaa-ajallaan hän käy kuntosalilla, harrastaa ulkoilua, kuten luistelua tai patikointia, ja perehtyy uusiin tekoälytutkimuksiin.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- Platoblockchain. Web3 Metaverse Intelligence. Tietoa laajennettu. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-automatic-model-tuning-now-supports-three-new-completion-criteria-for-hyperparameter-optimization/
- 10
- 100
- 11
- 7
- 9
- a
- pystyy
- Meistä
- edellä
- Tili
- tarkkuus
- Saavuttaa
- saavutettu
- poikki
- Lisäksi
- lisä-
- Etu
- Jälkeen
- AI
- ai tutkimusta
- AI / ML
- algoritmi
- Kaikki
- jo
- Amazon
- Amazon Sage Maker
- määrä
- Analytics
- ja
- sovellettu
- automaattisesti
- automaattisesti
- AWS
- perustua
- ennen
- ovat
- hyödyttää
- Hyödyt
- PARAS
- Paremmin
- välillä
- Jälkeen
- sidottu
- tuoda
- talousarvio
- Rakentaminen
- nimeltään
- tapaus
- paini
- tietty
- Certification
- sertifikaatit
- haasteet
- Valita
- valittu
- tarkasti
- pilvi
- yhdistelmä
- verrattuna
- vertailu
- täydellinen
- Valmistunut
- Täydentää
- valmistuminen
- Laskea
- Konfigurointi
- ohjaus
- Lähentyminen
- Hinta
- kustannussäästöjä
- kustannustehokas
- kustannukset
- voisi
- kriteerit
- Nykyinen
- Asiakkaat
- tiedot
- määritelty
- määrittelemällä
- osoittivat
- haluttu
- yksityiskohdat
- Detection
- eri
- Alennus
- pohtia
- keskusteltiin
- ei
- Dont
- kukin
- Varhainen
- käytössä
- insinööri
- varmistaa
- arvioidaan
- arviot
- arviointi
- kaikki
- esimerkki
- Exclusive
- olemassa
- kallis
- kokeilu
- tutkimus
- tutkia
- tuttu
- Ominaisuus
- Ominaisuudet
- Löytää
- löytäminen
- löydöt
- Etunimi
- Keskittää
- jälkeen
- kaava
- koko
- yleensä
- saada
- tietty
- Antaminen
- Go
- tavoite
- hyvä
- Oppaat
- kuntosali
- ottaa
- auttaa
- auttaa
- korkeampi
- erittäin
- pitää
- Miten
- Miten
- Kuitenkin
- HTML
- HTTPS
- Hyperparametrien optimointi
- Hyperparametrien viritys
- ICE
- tunnistaa
- parantaa
- parannus
- parannuksia
- parantaminen
- in
- Muilla
- Mukaan lukien
- Lisäykset
- henkilökohtainen
- ensin
- yhdistää
- Älykäs
- käyttöön
- Esittelee
- IT
- iteraatio
- toistojen
- Job
- Työpaikat
- Tietää
- tunnettu
- suurempi
- kerros
- johtaa
- oppiminen
- Led
- Lets
- Taso
- Todennäköisesti
- RAJOITA
- rajallinen
- kauemmin
- kone
- koneoppiminen
- johto
- monet
- Marketing
- max
- Maksimoida
- maksimi
- välineet
- Meets
- menetelmä
- metrinen
- Metrics
- minimointia
- ML
- malli
- mallit
- seuranta
- näytöt
- lisää
- eniten
- moninkertainen
- molemminpuolisesti
- tarpeet
- Uusi
- numero
- tavoite
- tavoitteet
- tarkkailla
- ONE
- toimii
- optimaalinen
- optimointi
- optimoitu
- Vaihtoehto
- Muut
- yleinen
- parametri
- osa
- kumppani
- kumppani
- intohimoinen
- suorituskyky
- aikoja
- vaihe
- foorumi
- Platon
- Platonin tietotieto
- PlatonData
- Kirje
- Tarkkuus
- ennustus
- aiemmin
- Pääasiallinen
- Ongelma
- ongelmia
- prosessi
- tuottaa
- ennustetaan
- mikäli
- tarjoamalla
- laatu
- tavoittaa
- saavutettu
- Lukeminen
- kohtuullinen
- suhde
- luotettava
- raportoitu
- tutkimus
- resurssi
- Esittelymateriaalit
- johtua
- Saatu ja
- tulokset
- ajaa
- uhraa
- sagemaker
- SageMaker automaattinen mallin viritys
- Säästöt
- skaalautuva
- Haku
- Toinen
- sekuntia
- turvallinen
- valitsemalla
- valinta
- vanhempi
- Palvelut
- setti
- asetus
- settings
- shouldnt
- näyttää
- merkittävä
- merkittävästi
- pieni
- pienempiä
- So
- ratkaisu
- Ratkaisumme
- Ratkaisee
- jonkin verran
- Tila
- Erikoisuus
- erityinen
- määritelty
- menot
- pyörii
- Urheilu
- stop
- pysähtynyt
- pysäyttäminen
- Lopettaa
- niin
- tuki
- Tuetut
- Tukee
- ottaa
- Kohde
- Tehtävä
- ehdot
- -
- heidän
- kolmas
- kolmella
- kynnys
- Kautta
- aika
- kertaa
- että
- liian
- Yhteensä
- koulutus
- Kääntää
- tyypillinen
- käyttää
- käyttölaukku
- käyttäjä
- validointi
- arvo
- versio
- tavalla
- Mitä
- joka
- KUKA
- tulee
- sisällä
- ilman
- sanoja
- toimii
- olisi
- tuotto
- Jooga
- Voit
- Sinun
- zephyrnet