Joulukuussa 2020, AWS ilmoitti yleisestä saatavuudesta of Amazon SageMaker JumpStart, kyky Amazon Sage Maker jonka avulla pääset nopeasti ja helposti alkuun koneoppimisen (ML) kanssa. JumpStart tarjoaa yhdellä napsautuksella hienosäätöä ja laajan valikoiman valmiiksi koulutettuja malleja yleisiin ML-tehtäviin sekä valikoiman päästä päähän -ratkaisuja, jotka ratkaisevat yleisiä liiketoimintaongelmia. Nämä ominaisuudet poistavat raskasta nostoa ML-prosessin jokaisesta vaiheesta, mikä helpottaa korkealaatuisten mallien kehittämistä ja lyhentää käyttöönottoon kuluvaa aikaa.
Aikaisemmin kaikki JumpStart-sisältö oli saatavilla vain kautta Amazon SageMaker Studio, joka tarjoaa a käyttäjäystävällinen graafinen käyttöliittymä olla vuorovaikutuksessa ominaisuuden kanssa. Tänään olemme iloisia voidessamme ilmoittaa helppokäyttöisen julkaisun julkaisemisesta JumpStart API:t SageMaker Python SDK:n laajennuksena. Näiden sovellusliittymien avulla voit ottaa ohjelmallisesti käyttöön ja hienosäätää laajan valikoiman JumpStart-tuettuja esikoulutettuja malleja omissa tietojoukoissasi. Tämä julkaisu vapauttaa JumpStart-ominaisuuksien käytön koodityönkuluissa, MLOps-putkissa ja missä tahansa muualla, jossa olet vuorovaikutuksessa SageMakerin kanssa SDK:n kautta.
Tässä viestissä tarjoamme päivityksen JumpStartin ominaisuuksien nykytilasta ja opastamme sinut JumpStart API:n käyttökulkuun esimerkin avulla.
JumpStart yleiskatsaus
JumpStart on monipuolinen tuote, joka sisältää erilaisia ominaisuuksia, joiden avulla pääset nopeasti alkuun ML:n kanssa SageMakerissa. Kirjoitushetkellä JumpStart antaa sinun tehdä seuraavat:
- Ota käyttöön esikoulutettuja malleja yleisiin ML-tehtäviin – JumpStartin avulla voit ratkaista yleisiä ML-tehtäviä ilman kehitysponnisteluja tarjoamalla helposti käyttöönotettuja malleja, jotka on esikoulutettu julkisesti saatavilla oleville suurille tietojoukoille. ML-tutkijayhteisö on tehnyt paljon vaivaa saattaakseen suurimman osan äskettäin kehitetyistä malleista julkisesti saataville. JumpStart isännöi yli 300 mallin kokoelmaa, jotka kattavat 15 suosituinta ML-tehtävää, kuten objektien havaitseminen, tekstin luokittelu ja tekstin luominen, mikä tekee niiden käyttämisestä helppoa aloittelijalle. Nämä mallit ovat peräisin suosituista mallikeskittimistä, kuten TensorFlow, PyTorch, Hugging Face ja MXNet Hub.
- Hienosäädä esikoulutettuja malleja – JumpStartin avulla voit hienosäätää esikoulutettuja malleja ilman, että sinun tarvitsee kirjoittaa omaa harjoitusalgoritmiasi. ML:ssä kutsutaan kykyä siirtää yhdeltä toimialueelta opittua tietoa toiselle alueelle siirrä oppimista. Voit käyttää siirtooppimista tuottaaksesi tarkkoja malleja pienemmille tietojoukoillesi paljon pienemmillä koulutuskustannuksilla kuin alkuperäisen mallin opetuksessa alusta alkaen. JumpStart sisältää myös suosittuja LightGBM-, CatBoost-, XGBoost- ja Scikit-learniin perustuvia harjoitusalgoritmeja, joita voit harjoitella alusta alkaen tietojen taulukkomuotoista regressiota ja luokittelua varten.
- Käytä valmiita ratkaisuja – JumpStart tarjoaa joukon 17 valmiiksi rakennettua ratkaisua yleisiin ML-käyttötapauksiin, kuten kysynnän ennustamiseen sekä teollisuus- ja taloussovelluksiin, jotka voit ottaa käyttöön vain muutamalla napsautuksella. Ratkaisut ovat päästä päähän ML-sovelluksia, jotka yhdistävät erilaisia AWS-palveluita tietyn yrityskäyttötilanteen ratkaisemiseksi. He käyttävät AWS-pilven muodostuminen mallit ja viitearkkitehtuurit nopeaa käyttöönottoa varten, mikä tarkoittaa, että ne ovat täysin muokattavissa.
- Käytä muistikirjan esimerkkejä SageMaker-algoritmeille – SageMaker tarjoaa sarjan sisäänrakennetut algoritmit auttaa datatieteilijöitä ja ML-harjoittajia pääsemään nopeasti alkuun ML-mallien koulutuksessa ja käyttöönotossa. JumpStart tarjoaa mallimuistikirjoja, joiden avulla voit käyttää näitä algoritmeja nopeasti.
- Hyödynnä koulutusvideot ja blogit – JumpStart tarjoaa myös lukuisia blogikirjoituksia ja videoita, jotka opettavat käyttämään SageMakerin eri toimintoja.
JumpStart hyväksyy mukautetut VPC-asetukset ja KMS-salausavaimet, jotta voit käyttää saatavilla olevia malleja ja ratkaisuja turvallisesti yritysympäristössäsi. Voit siirtää suojausasetukset JumpStartiin SageMaker Studiossa tai SageMaker Python SDK:n kautta.
JumpStart-tuetut ML-tehtävät ja API-esimerkkimuistikirjat
JumpStart tukee tällä hetkellä 15 suosituinta ML-tehtävää; Näistä 13 on visio- ja NLP-pohjaisia tehtäviä, joista 8 tukee kooditonta hienosäätöä. Se tukee myös neljää suosittua taulukkomuotoisen tietojen mallintamisalgoritmia. Tehtävät ja linkit heidän mallimuistikirjoihin on yhteenveto seuraavassa taulukossa.
Tehtävä | Päätelmä esikoulutetuista malleista | Mukautetun tietojoukon koulutus | Tuetut puitteet | Esimerkkikannettavat |
Kuvien luokittelu | Joo | Joo | PyTorch, TensorFlow | Johdatus JumpStartiin – kuvien luokittelu |
Objektin tunnistus | Joo | Joo | PyTorch, TensorFlow, MXNet | Johdatus JumpStartiin – Objektin tunnistus |
Semanttinen segmentointi | Joo | Joo | MX Net | Johdatus JumpStartiin – semanttinen segmentointi |
Esimerkki segmentointi | Joo | Nro | MX Net | Johdatus JumpStartiin – ilmentymien segmentointi |
Kuvan upottaminen | Joo | Nro | TensorFlow, MXNet | Johdatus JumpStartiin – kuvien upottaminen |
Tekstiluokitus | Joo | Joo | TensorFlow | Johdatus JumpStartiin – Tekstin luokittelu |
Lauseparien luokittelu | Joo | Joo | TensorFlow, halaavat kasvot | Johdatus JumpStartiin – lauseparien luokittelu |
Kysymykseen vastaaminen | Joo | Joo | PyTorch | JumpStartin esittely – Kysymyksiin vastaaminen |
Nimeltään entiteetin tunnustaminen | Joo | Nro | Halaaminen kasvot | Johdatus JumpStartiin – Nimettyjen entiteettien tunnistus |
Tekstin yhteenveto | Joo | Nro | Halaaminen kasvot | JumpStartin esittely – Tekstin yhteenveto |
Tekstin luominen | Joo | Nro | Halaaminen kasvot | Johdatus JumpStartiin – Tekstin luominen |
Konekäännös | Joo | Nro | Halaaminen kasvot | Johdatus JumpStartiin – Konekäännös |
Tekstin upottaminen | Joo | Nro | TensorFlow, MXNet | Johdatus JumpStartiin – Tekstin upottaminen |
Taulukkoluokitus | Joo | Joo | LightGBM, CatBoost, XGBoost, lineaarinen oppija | Johdatus JumpStartiin – Taulukkoluokitus – LightGBM, CatBoost Johdatus JumpStartiin – Taulukkoluokitus – XGBoost, Lineaarinen oppija |
Taulukkoregressio | Joo | Joo | LightGBM, CatBoost, XGBoost, lineaarinen oppija | Johdatus JumpStartiin – Taulukkoregressio – LightGBM, CatBoost Johdatus JumpStartiin – Taulukkoregressio – XGBoost, Lineaarinen oppija |
Tehtävästä riippuen edellisessä taulukossa linkitetyt mallimuistikirjat voivat opastaa sinua kaikissa tai osassa seuraavista prosesseista:
- Valitse tehtävääsi varten JumpStartin tukema esikoulutettu malli.
- Isännöi esikoulutettu malli, hanki siitä reaaliaikaisia ennusteita ja näytä tulokset asianmukaisesti.
- Hienosäädä esikoulutettu malli omalla hyperparametrivalikoimallasi ja ota se käyttöön päätelmien tekemiseen.
Hienosäädä ja ota käyttöön objektintunnistusmalli JumpStart API:illa
Seuraavissa osioissa tarjoamme vaiheittaisen esittelyn siitä, kuinka uusia JumpStart API:ita käytetään edustavaan objektien havaitsemiseen. Näytämme, kuinka käyttää esiopetettua objektintunnistusmallia objektien tunnistamiseen ennalta määritetyistä luokkien joukosta kuvassa, jossa on rajauslaatikot. Lopuksi näytämme, kuinka voit hienosäätää valmiiksi koulutettua mallia omassa tietojoukossasi tunnistamaan kuvissa yrityksesi tarpeisiin sopivia kohteita yksinkertaisesti tuomalla omat tietosi. Tarjoamme an mukana oleva muistikirja tätä läpikäyntiä varten.
Käymme läpi seuraavat korkean tason vaiheet:
- Tee johtopäätös esikoulutetusta mallista.
- Hae JumpStart-artefaktit ja ota käyttöön päätepiste.
- Tee kysely päätepisteestä, jäsennä vastaus ja näytä malliennusteet.
- Hienosäädä esikoulutettu malli omalla tietojoukollasi.
- Hae harjoitusartefaktit.
- Juokse koulutus.
Tee johtopäätös esikoulutetusta mallista
Tässä osiossa valitsemme JumpStartissa sopivan esiopetetun mallin, otamme tämän mallin käyttöön SageMaker-päätepisteeseen ja näytämme, kuinka päättely suoritetaan käyttöönotetusta päätepisteestä. Kaikki vaiheet ovat saatavilla osoitteessa mukana Jupyter-muistikirja.
Hae JumpStart-artefaktit ja ota käyttöön päätepiste
SageMaker on Docker-säiliöihin perustuva alusta. JumpStart käyttää saatavilla olevaa kehyskohtaista SageMaker Deep Learning -säiliöt (DLC:t). Haemme mahdolliset lisäpaketit sekä komentosarjat koulutuksen ja johtopäätösten käsittelemiseksi valitulle tehtävälle. Lopuksi esiopetetut malliesineet haetaan erikseen model_uris
, joka tarjoaa alustalle joustavuutta. Voit käyttää mitä tahansa mallia, jotka on esikoulutettu samaan tehtävään yhdellä harjoitus- tai päättelykomentosarjalla. Katso seuraava koodi:
Seuraavaksi syötämme resurssit a SageMaker malli esiintyy ja ota käyttöön päätepiste:
Päätepisteen käyttöönotto voi kestää muutaman minuutin.
Tee kysely päätepisteestä, jäsennä vastaus ja näytä ennusteet
Päätelmien saamiseksi käyttöönotetusta mallista syötekuva on toimitettava binäärimuodossa hyväksymistyypin kanssa. JumpStartissa voit määrittää palautettavien rajausruutujen määrän. Seuraavassa koodinpätkässä ennustamme kymmenen rajausruutua kuvaa kohden liittämällä ;n_predictions=10
että Accept
. Jos haluat ennustaa xx-laatikoita, voit muuttaa sen muotoon ;n_predictions=xx
tai saat kaikki ennustetut ruudut jättämällä pois ;n_predictions=xx
täysin.
Seuraava koodinpätkä antaa sinulle välähdyksen siitä, miltä kohteen tunnistus näyttää. Jokaiselle objektiluokalle ennustettu todennäköisyys visualisoidaan yhdessä sen rajauslaatikon kanssa. Käytämme parse_response
ja display_predictions
aputoiminnot, jotka on määritelty mukana muistikirja.
Seuraavassa kuvakaappauksessa näkyy kuvan tulos ennustetarroineen ja rajauslaatikoineen.
Hienosäädä esikoulutettu malli omalla tietojoukollasi
Olemassa olevat JumpStartin objektientunnistusmallit on esikoulutettu joko COCO- tai VOC-tietojoukoissa. Jos sinun on kuitenkin tunnistettava objektiluokkia, joita ei ole alkuperäisessä esiopetustietojoukossa, sinun on hienosäädettävä mallia uudessa tietojoukossa, joka sisältää nämä uudet objektityypit. Jos esimerkiksi sinun on tunnistettava keittiövälineet ja suoritettava päätelmiä käyttöön otetusta esikoulutetusta SSD-mallista, malli ei tunnista uusien kuvatyyppien ominaisuuksia ja siksi tulos on virheellinen.
Tässä osiossa osoitamme, kuinka helppoa on hienosäätää esikoulutettu malli tunnistamaan uudet objektiluokat JumpStart API:iden avulla. Täydellinen koodiesimerkki lisätietoineen on saatavilla osoitteessa mukana oleva muistikirja.
Hae harjoitusartefaktit
Koulutusartefaktit ovat samanlaisia kuin edellisessä osiossa käsitellyt päättelyartefaktit. Koulutus vaatii Docker-perussäiliön, nimittäin seuraavan esimerkkikoodin MXNet-kontin. Kaikki koulutukseen tarvittavat lisäpaketit sisältyvät koulutusskripteihin train_sourcer_uri
. Esikoulutettu malli ja sen parametrit pakataan erikseen.
Juokse koulutus
Harjoittelun suorittamiseksi syötämme tarvittavat artefaktit ja joitain lisäparametreja a SageMaker estimaattori ja soita .fit
toiminto:
Algoritmin harjoittelun aikana voit seurata sen edistymistä joko SageMaker-muistikirjassa, jossa käytät itse koodia, tai amazonin pilvikello. Kun koulutus on suoritettu, hienosäädetyt malliesineet ladataan tiedostoon Amazonin yksinkertainen tallennuspalvelu (Amazon S3) lähtöpaikka määritetty koulutuskokoonpanossa. Voit nyt ottaa mallin käyttöön samalla tavalla kuin esikoulutettu malli. Voit seurata prosessin loppua kohdassa mukana oleva muistikirja.
Yhteenveto
Tässä viestissä kuvailimme äskettäin julkaistujen JumpStart API:iden arvoa ja niiden käyttöä. Annoimme linkit 17 esimerkkimuistikirjaan JumpStartin tukemiin erilaisiin ML-tehtäviin ja opastimme sinut objektintunnistusmuistikirjan läpi.
Odotamme innolla kuulevasi, kun kokeilet JumpStartia.
Tietoja Tekijät
Tohtori Vivek Madan on soveltuva tutkija Amazon SageMaker JumpStart -tiimin kanssa. Hän sai tohtorin tutkinnon Illinoisin yliopistosta Urbana-Champaignissa ja oli tutkijatohtorina Georgia Techissä. Hän on aktiivinen koneoppimisen ja algoritmisuunnittelun tutkija ja julkaissut julkaisuja EMNLP-, ICLR-, COLT-, FOCS- ja SODA-konferensseissa.
João Moura on AI/ML Specialist Solutions -arkkitehti Amazon Web Servicesissä. Hän keskittyy enimmäkseen NLP-käyttötapauksiin ja auttaa asiakkaita optimoimaan Deep Learning -mallin koulutusta ja käyttöönottoa.
Tohtori Ashish Khetan on vanhempi soveltuva tutkija Amazon SageMaker JumpStart ja Amazon SageMakerin sisäänrakennetut algoritmit ja auttaa kehittämään koneoppimisalgoritmeja. Hän on aktiivinen koneoppimisen ja tilastollisen päättelyn tutkija ja on julkaissut monia artikkeleita NeurIPS-, ICML-, ICLR-, JMLR- ja ACL-konferensseissa.
- Coinsmart. Euroopan paras Bitcoin- ja kryptopörssi.
- Platoblockchain. Web3 Metaverse Intelligence. Tietoa laajennettu. VAPAA PÄÄSY.
- CryptoHawk. Altcoinin tutka. Ilmainen kokeilu.
- Lähde: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-jumpstart-models-and-algorithms-now-available-via-api/
- "
- 100
- 2020
- tarkka
- poikki
- aktiivinen
- lisä-
- Etu
- algoritmi
- algoritmit
- Kaikki
- Amazon
- Amazon Web Services
- määrä
- Ilmoittaa
- ilmoitti
- Toinen
- kaikkialla
- api
- API
- sovellukset
- saatavissa
- AWS
- ovat
- Uutiset ja media
- Blogitekstit
- Laatikko
- sisäänrakennettu
- liiketoiminta
- soittaa
- kyvyt
- tapauksissa
- muuttaa
- luokittelu
- koodi
- kokoelma
- Yhteinen
- yhteisö
- konferenssit
- Konfigurointi
- Kontti
- Kontit
- sisältää
- pitoisuus
- kustannukset
- Nykyinen
- Nykyinen tila
- Asiakkaat
- tiedot
- tietojenkäsittely
- Kysyntä
- sijoittaa
- levityspinnalta
- käyttöönotto
- Malli
- Detection
- kehittää
- kehitetty
- Kehitys
- eri
- näyttö
- Satamatyöläinen
- ei
- verkkotunnuksen
- helposti
- salaus
- päätepiste
- yritys
- ympäristö
- esimerkki
- kokeilu
- Kasvot
- Ominaisuus
- Ominaisuudet
- Vihdoin
- taloudellinen
- Joustavuus
- virtaus
- keskityttiin
- seurata
- jälkeen
- muoto
- Eteenpäin
- koko
- toiminto
- general
- sukupolvi
- Georgia
- ohjaavat
- Käsittely
- auttaa
- auttaa
- Miten
- Miten
- HTTPS
- tunnistaa
- Illinois
- kuva
- mukana
- Mukaan lukien
- teollinen
- osallistuva
- IT
- itse
- Job
- avaimet
- tuntemus
- tarrat
- suuri
- käynnistää
- oppinut
- oppiminen
- linkit
- sijainti
- kone
- koneoppiminen
- Enemmistö
- Tekeminen
- ML
- malli
- mallit
- eniten
- Suosituin
- nimittäin
- muistikirja
- numero
- useat
- foorumi
- Suosittu
- Viestejä
- ennustus
- Ennusteet
- esittää
- ongelmia
- prosessi
- Prosessit
- tuottaa
- Tuotteet
- toimittaa
- tarjoaa
- kysymys
- nopeasti
- reaaliaikainen
- tunnistaa
- vähentämällä
- tarvitaan
- tutkimus
- Esittelymateriaalit
- vastaus
- REST
- tulokset
- ajaa
- juoksu
- Tiedemies
- tutkijat
- sdk
- turvallisesti
- turvallisuus
- valittu
- Palvelut
- setti
- samankaltainen
- Yksinkertainen
- So
- Ratkaisumme
- SOLVE
- alkoi
- Osavaltio
- tilastollinen
- Levytila
- studio
- tuki
- Tuetut
- Tukee
- tehtävät
- joukkue-
- teknologia
- Kautta
- aika
- tänään
- yhdessä
- koulutus
- junat
- yliopisto
- poistoista
- Päivitykset
- käyttää
- Käytä koteloita
- arvo
- Videoita
- visio
- verkko
- verkkopalvelut
- Mitä
- sisällä
- kirjoittaminen