Detsembris 2020, AWS teatas üldisest saadavusest of Amazon SageMaker JumpStart, võime Amazon SageMaker mis aitab teil masinõppega (ML) kiiresti ja lihtsalt alustada. JumpStart pakub ühe klõpsuga peenhäälestamist ja paljude eelkoolitatud mudelite juurutamist populaarsete ML-ülesannete jaoks, samuti valikut täislahendusi, mis lahendavad levinud äriprobleeme. Need funktsioonid eemaldavad ML-protsessi iga etapi raskused, muutes kvaliteetsete mudelite väljatöötamise lihtsamaks ja lühendades kasutuselevõtuks kuluvat aega.
Varem oli kogu KiirStardi sisu saadaval ainult läbi Amazon SageMaker Studio, mis annab a kasutajasõbralik graafiline liides funktsiooniga suhtlemiseks. Täna teatame rõõmuga hõlpsasti kasutatava rakenduse turuletoomisest KiirStardi API-d SageMaker Python SDK laiendusena. Need API-d võimaldavad teil programmiliselt juurutada ja viimistleda suurt valikut JumpStarti toetatud eelkoolitatud mudeleid teie enda andmekogumites. See käivitamine avab JumpStarti võimaluste kasutamise teie koodi töövoogudes, MLOps-i torustikes ja kõikjal mujal, kus SageMakeriga SDK kaudu suhtlete.
Selles postituses pakume värskendust JumpStarti võimaluste hetkeseisu kohta ja juhendame teid JumpStart API kasutusvoos koos näidiskasutusjuhtumiga.
KiirStardi ülevaade
JumpStart on mitmekülgne toode, mis sisaldab erinevaid võimalusi, mis aitavad teil SageMakeris ML-iga kiiresti alustada. Kirjutamise ajal võimaldab JumpStart teha järgmist.
- Kasutage tavaliste ML-ülesannete jaoks eelkoolitatud mudeleid – JumpStart võimaldab teil lahendada levinumaid ML-ülesandeid ilma arendustegevuseta, pakkudes avalikult kättesaadavatel suurtel andmekogudel eelkoolitatud mudelite hõlpsat juurutamist. ML-i teadlaskond on teinud palju pingutusi, et muuta enamik hiljuti välja töötatud mudeleid kasutamiseks avalikult kättesaadavaks. JumpStart majutab enam kui 300 mudelit, mis hõlmab 15 kõige populaarsemat ML-ülesannet, nagu objektide tuvastamine, teksti klassifitseerimine ja teksti genereerimine, muutes algajatele nende kasutamise lihtsaks. Need mudelid on koostatud populaarsetest mudelijaoturitest, nagu TensorFlow, PyTorch, Hugging Face ja MXNet Hub.
- Eelkoolitatud mudelite peenhäälestus - JumpStart võimaldab teil eelkoolitatud mudeleid peenhäälestada, ilma et oleks vaja oma treeningalgoritmi kirjutada. ML-is nimetatakse võimalust ühest valdkonnast õpitud teadmisi teise valdkonda üle kanda ülekandmisõpe. Saate kasutada ülekandeõpet, et luua oma väiksemate andmekogumite põhjal täpseid mudeleid, mille koolituskulud on palju väiksemad kui algmudeli nullist väljaõpetamisel. JumpStart sisaldab ka populaarseid LightGBM-il, CatBoostil, XGBoostil ja Scikit-learnil põhinevaid treeningalgoritme, mida saate nullist treenida andmete tabeli regressiooni ja klassifitseerimise jaoks.
- Kasutage valmislahendusi - KiirStart pakub komplekti 17 eelehitatud lahendust tavaliste ML kasutusjuhtude jaoks, nagu nõudluse prognoosimine ning tööstus- ja finantsrakendused, mida saate juurutada vaid mõne klõpsuga. Lahendused on täielikud ML-rakendused, mis ühendavad erinevaid AWS-teenuseid konkreetse ärilise kasutusjuhtumi lahendamiseks. Nad kasutavad AWS CloudFormation malle ja viitearhitektuure kiireks juurutamiseks, mis tähendab, et need on täielikult kohandatavad.
- Kasutage SageMakeri algoritmide jaoks märkmiku näiteid - SageMaker pakub komplekti sisseehitatud algoritmid et aidata andmeteadlastel ja ML-i praktikutel ML-mudelite koolitamist ja kasutuselevõttu kiiresti alustada. JumpStart pakub näidismärkmikke, mida saate nende algoritmide kiireks kasutamiseks kasutada.
- Kasutage koolitusvideoid ja blogisid – JumpStart pakub ka arvukalt ajaveebipostitusi ja videoid, mis õpetavad kasutama SageMakeri erinevaid funktsioone.
JumpStart aktsepteerib kohandatud VPC-sätteid ja KMS-i krüpteerimisvõtmeid, et saaksite saadaolevaid mudeleid ja lahendusi oma ettevõtte keskkonnas turvaliselt kasutada. Saate oma turvaseaded edastada JumpStartile SageMaker Studio või SageMaker Python SDK kaudu.
KiirStardi toetatud ML-ülesanded ja API-näidismärkmikud
KiirStart toetab praegu 15 kõige populaarsemat ML-ülesannet; Neist 13 on visiooni- ja NLP-põhised ülesanded, millest 8 toetab koodita peenhäälestust. Samuti toetab see nelja populaarset tabeliandmete modelleerimise algoritmi. Ülesanded ja nende näidismärkmike lingid on kokku võetud järgmises tabelis.
Sõltuvalt ülesandest võivad eelmises tabelis lingitud näidismärkmikud teid juhendada kõigi järgmiste protsesside või nende alamhulga puhul.
- Valige oma konkreetse ülesande jaoks JumpStarti toetatud eelkoolitatud mudel.
- Hostige eelkoolitatud mudel, hankige sellest reaalajas ennustusi ja kuvage tulemusi adekvaatselt.
- Viimistlege eelkoolitatud mudelit oma hüperparameetrite valikuga ja juurutage see järelduste tegemiseks.
Täpsustage ja juurutage objekti tuvastamise mudel JumpStart API-dega
Järgmistes jaotistes anname samm-sammult ülevaate uute JumpStart API-de kasutamisest objektide tuvastamise tüüpilises ülesandes. Näitame, kuidas kasutada eelkoolitatud objektituvastusmudelit, et identifitseerida objektid eelmääratletud klasside komplektist pildil piirdekastidega. Lõpuks näitame, kuidas peenhäälestada oma andmestikul eelkoolitatud mudelit, et tuvastada piltidelt objekte, mis vastavad teie ettevõtte vajadustele, tuues lihtsalt oma andmed. Pakume an kaasas olev märkmik selle ülevaate jaoks.
Läbime järgmised kõrgetasemelised sammud:
- Tehke eelkoolitatud mudeli põhjal järeldused.
- Tooge JumpStarti artefaktid ja juurutage lõpp-punkt.
- Esitage päring lõpp-punkti kohta, sõeluge vastust ja kuvage mudeli ennustused.
- Viimistlege eelkoolitatud mudelit oma andmestiku põhjal.
- Treeningute artefaktide hankimine.
- Jooksu treening.
Tehke eelkoolitatud mudeli põhjal järeldused
Selles jaotises valime JumpStartis sobiva eelkoolitatud mudeli, juurutame selle mudeli SageMakeri lõpp-punktis ja näitame, kuidas juurutatud lõpp-punktist järeldusi teha. Kõik sammud on saadaval aadressil kaasas olev Jupyteri märkmik.
Tooge JumpStarti artefaktid ja juurutage lõpp-punkt
SageMaker on Dockeri konteineritel põhinev platvorm. KiirStart kasutab saadaolevat raamistikupõhist SageMakeri süvaõppekonteinerid (DLC-d). Toome kõik lisapaketid ja skriptid valitud ülesande treenimiseks ja järelduste tegemiseks. Lõpuks tuuakse eelkoolitatud mudeliartefaktid eraldi model_uris
, mis pakub platvormile paindlikkust. Saate ühe koolituse või järeldusskriptiga kasutada mis tahes arvu mudeleid, mis on sama ülesande jaoks eelnevalt koolitatud. Vaadake järgmist koodi:
Järgmisena söötame ressursid a SageMakeri mudel eksemplar ja juurutage lõpp-punkt:
Lõpp-punkti juurutamise lõpuleviimiseks võib kuluda mõni minut.
Esitage lõpp-punkti päring, sõeluge vastust ja kuvage ennustused
Juurutatud mudeli põhjal järelduste tegemiseks tuleb sisendkujutis esitada binaarvormingus koos aktsepteerimistüübiga. KiirStartis saate määrata tagastatavate piirdekastide arvu. Järgmises koodilõigul ennustame lisamise teel kümmet piirdekasti pildi kohta ;n_predictions=10
et Accept
. Xx-kasti ennustamiseks saate selle muuta ;n_predictions=xx
või hankige kõik ennustatud kastid väljajättes ;n_predictions=xx
täielikult.
Järgmine koodilõik annab teile ülevaate sellest, kuidas objekti tuvastamine välja näeb. Iga objektiklassi jaoks ennustatud tõenäosus visualiseeritakse koos selle piirdekastiga. Me kasutame parse_response
ja display_predictions
abifunktsioonid, mis on määratletud kaasasolevas märkmik.
Järgmine ekraanipilt näitab ennustussiltide ja piirdekastidega pildi väljundit.
Viimistlege eelnevalt koolitatud mudelit oma andmestiku põhjal
JumpStarti olemasolevad objektituvastusmudelid on eelnevalt koolitatud kas COCO või VOC andmekogumite osas. Kui teil on aga vaja tuvastada objektiklassid, mida algses koolituseelses andmekogumis ei eksisteeri, peate mudelit täpsustama uues andmestikus, mis sisaldab neid uusi objektitüüpe. Näiteks kui teil on vaja tuvastada köögiriistad ja teha järeldusi juurutatud eelkoolitatud SSD-mudeli kohta, ei tuvasta mudel uute pilditüüpide omadusi ja seetõttu on väljund vale.
Selles jaotises näitame, kui lihtne on eelkoolitatud mudelit viimistleda uute objektiklasside tuvastamiseks JumpStart API-de abil. Koodi täielik näide koos üksikasjadega on saadaval aadressil kaasas olev märkmik.
Treeningute artefaktide hankimine
Koolitusartefaktid on sarnased eelmises jaotises käsitletud järelduste artefaktidega. Koolituse jaoks on vaja Dockeri baaskonteinerit, nimelt MXNeti konteinerit järgmises näitekoodis. Kõik koolituseks vajalikud lisapaketid on lisatud koolitusskriptidele train_sourcer_uri
. Eelkoolitatud mudel ja selle parameetrid on pakendatud eraldi.
Jooksu treening
Treeningu läbiviimiseks söödame lihtsalt vajalikud artefaktid koos mõne lisaparameetriga a-le SageMakeri hindaja ja helistage .fit
funktsioon:
Algoritmi treenimise ajal saate jälgida selle edenemist kas SageMakeri sülearvutis, kus te koodi kasutate, või Amazon CloudWatch. Kui koolitus on lõppenud, laaditakse peenhäälestatud mudeliartefaktid üles Amazoni lihtne salvestusteenus (Amazon S3) treeningkonfiguratsioonis määratud väljundi asukoht. Nüüd saate mudeli juurutada samal viisil kui eelkoolitatud mudelit. Ülejäänud protsessi saate jälgida jaotises kaasas olev märkmik.
Järeldus
Selles postituses kirjeldasime äsja välja antud JumpStart API-de väärtust ja nende kasutamist. Esitasime lingid 17-le näidismärkmikule JumpStartis toetatud erinevate ML-ülesannete jaoks ja juhatasime teid läbi objektituvastuse märkmiku.
Ootame huviga teie vastust KiirStardi katsetamisel.
Autoritest
Dr Vivek Madan on Amazon SageMaker JumpStart meeskonna rakendusteadlane. Ta sai doktorikraadi Illinoisi ülikoolist Urbana-Champaignis ja oli Georgia Techi järeldoktor. Ta on aktiivne masinõppe ja algoritmide kujundamise uurija ning avaldanud ettekandeid EMNLP, ICLR, COLT, FOCS ja SODA konverentsidel.
João Moura on AI/ML spetsialistilahenduste arhitekt ettevõttes Amazon Web Services. Ta keskendub peamiselt NLP kasutusjuhtudele ja aitab klientidel optimeerida süvaõppe mudeli koolitust ja juurutamist.
Dr Ashish Khetan on vanemrakendusteadlane Amazon SageMaker JumpStart ja Amazon SageMakeri sisseehitatud algoritmid ja aitab välja töötada masinõppe algoritme. Ta on aktiivne masinõppe ja statistiliste järelduste uurija ning avaldanud palju artikleid NeurIPS-i, ICML-i, ICLR-i, JMLR-i ja ACL-i konverentsidel.
- Münditark. Euroopa parim Bitcoini ja krüptobörs.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. TASUTA PÄÄS.
- CryptoHawk. Altcoini radar. Tasuta prooviversioon.
- Allikas: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-jumpstart-models-and-algorithms-now-available-via-api/
- "
- 100
- 2020
- täpne
- üle
- aktiivne
- Täiendavad lisad
- ADEelis
- algoritm
- algoritme
- Materjal: BPA ja flataatide vaba plastik
- Amazon
- Amazon Web Services
- summa
- Teatama
- teatas
- Teine
- kuskil
- API
- API-liidesed
- rakendused
- saadaval
- AWS
- on
- Blogi
- Blogi postitused
- Kast
- sisseehitatud
- äri
- helistama
- võimeid
- juhtudel
- muutma
- klassifikatsioon
- kood
- kogumine
- ühine
- kogukond
- konverentsid
- konfiguratsioon
- Konteiner
- Konteinerid
- sisaldab
- sisu
- kulud
- Praegune
- Praegune olek
- Kliendid
- andmed
- andmetöötlus
- Nõudlus
- juurutada
- juurutamine
- kasutuselevõtu
- Disain
- Detection
- arendama
- arenenud
- & Tarkvaraarendus
- erinev
- Ekraan
- laevalaadija
- Ei tee
- domeen
- kergesti
- krüpteerimist
- Lõpp-punkt
- ettevõte
- keskkond
- näide
- eksperiment
- nägu
- tunnusjoon
- FUNKTSIOONID
- Lõpuks
- finants-
- Paindlikkus
- voog
- keskendunud
- järgima
- Järel
- formaat
- edasi
- täis
- funktsioon
- Üldine
- põlvkond
- Georgia
- suunata
- Käsitsemine
- aitama
- aitab
- Kuidas
- Kuidas
- HTTPS
- identifitseerima
- Illinois
- pilt
- lisatud
- Kaasa arvatud
- tööstus-
- seotud
- IT
- ise
- töö
- võtmed
- teadmised
- Labels
- suur
- algatama
- õppinud
- õppimine
- lingid
- liising
- masin
- masinõpe
- Enamus
- Tegemine
- ML
- mudel
- mudelid
- kõige
- Populaarseim
- nimelt
- märkmik
- number
- arvukad
- inimesele
- populaarne
- Postitusi
- ennustus
- Ennustused
- esitada
- probleeme
- protsess
- Protsessid
- tootma
- Toode
- anda
- annab
- küsimus
- kiiresti
- reaalajas
- tunnistama
- vähendamine
- nõutav
- teadustöö
- Vahendid
- vastus
- REST
- Tulemused
- jooks
- jooksmine
- teadlane
- teadlased
- SDK
- kindlalt
- turvalisus
- väljavalitud
- Teenused
- komplekt
- sarnane
- lihtne
- So
- Lahendused
- LAHENDAGE
- alustatud
- riik
- statistiline
- ladustamine
- stuudio
- toetama
- Toetatud
- Toetab
- ülesanded
- meeskond
- tech
- Läbi
- aeg
- täna
- kokku
- koolitus
- rongid
- Ülikool
- avab
- Värskendused
- kasutama
- kasutamise juhtumid
- väärtus
- Videod
- nägemus
- web
- veebiteenused
- M
- jooksul
- kirjutamine