Tänapäeval ehitavad paljud AWS-i kliendid ettevõtte jaoks valmis masinõppe (ML) platvorme Amazoni elastse Kubernetese teenus (Amazon EKS) kasutades Kubeflow AWS-is (Kubeflow AWS-spetsiifiline jaotus) paljudel kasutusjuhtudel, sealhulgas arvutinägemine, loomuliku keele mõistmine, kõne tõlkimine ja finantsmodelleerimine.
Koos avatud lähtekoodiga Kubeflow v1.6.1 uusim väljalase, toetab Kubeflow kogukond jätkuvalt Kubeflow laiaulatuslikku kasutuselevõttu ettevõtete jaoks. Viimane väljalase sisaldab palju uusi põnevaid funktsioone, nagu Kubernetes v1.22 tugi, PyTorchi ühendatud Python SDK, MXNet, MPI, XGBoost Kubeflow hajutatud koolitusoperaatoris, uued ClusterServingRuntime ja ServingRuntime CRD-d mudeliteenuse jaoks ja palju muud.
AWS-i panused Kubeflow'sse koos Kubeflow hiljutise käivitamisega AWS 1.6.1-s toetavad kõiki ülesvoolu avatud lähtekoodiga Kubeflow funktsioone ja sisaldavad palju uusi integratsioone kõrgelt optimeeritud, pilvepõhiste, ettevõtte jaoks valmis AWS-teenustega, mis aitavad teil luua väga töökindlaid, turvalised, kaasaskantavad ja skaleeritavad ML-süsteemid.
Selles postituses käsitleme AWS v1.6.1 uusi Kubeflow funktsioone ja tõstame esile kolm olulist integratsiooni, mis on koondatud ühele platvormile, et teile pakkuda:
- Infrastructure as Code (IaaC) ühe klõpsuga lahendus, mis automatiseerib Kubeflow otsast lõpuni installimise, sealhulgas EKS-klastri loomise
- Toetus hajutatud koolitusele Amazon SageMaker kasutamine Amazon SageMakeri operaatorid Kubernetese jaoks (ACK) ja SageMakeri komponendid Kubeflow torustike jaoks ja kohapeal Kubernetes kasutades Kubeflow koolitusoperaatorid. Paljud kliendid kasutavad seda võimalust hübriidsete masinõppearhitektuuride loomiseks, kus nad kasutavad nii Kubernetese arvutusi katsefaasis kui ka SageMakerit tootmismahu töökoormuse käitamiseks.
- ML-töökoormuste, sealhulgas Amazon EKS-i, Kubeflow mõõdikute ja rakenduste logide täiustatud jälgimine ja jälgitavus Prometheuse, Grafana ja Amazon CloudWatch integratsioon
Selle ajaveebi kasutusjuhtum keskendub konkreetselt SageMakeri integreerimisele Kubeflowiga AWS-is, mida saab lisada teie olemasolevatele Kubernetese töövoogudele, mis võimaldab teil luua hübriidseid masinõppearhitektuure.
Kubeflow AWS-is
Kubeflow versioonis AWS 1.6.1 pakub selget teed Kubeflow kasutamiseks, lisades olemasolevatele võimalustele järgmised AWS-teenused:
- SageMakeri integreerimine Kubeflowga hübriidse ML-i töövoogude käitamiseks, kasutades SageMakeri operaatoreid Kubernetese jaoks (ACK) ja SageMakeri komponente Kubeflow torujuhtmete jaoks.
- Automatiseeritud juurutamise valikuid on Kustomize skriptide ja Helmi diagrammide abil täiustatud ja lihtsustatud.
- Lisatud on tugi infrastruktuuri koodina (IaC) ühe klõpsuga juurutamiseks Kubeflow jaoks AWS-is, kasutades kõigi saadaolevate jaoks Terraformi juurutamise võimalused. See skript automatiseerib järgmiste AWS-i ressursside loomise:
- Toetus AWS PrivateLink Amazon S3 jaoks, mis võimaldab mitteärilistel piirkonna kasutajatel luua ühenduse vastavate S3 lõpp-punktidega.
- Lisatud integratsioon Amazoni hallatav teenus Prometheuse jaoks (AMP) ja Amazoni hallatav Grafana mõõdikute jälgimiseks Kubeflow abil AWS-is.
- Värskendatud Kubeflow märkmikuserveri konteinerid uusimate süvaõppe konteineri piltidega, mis põhinevad versioonidel TensorFlow 2.10.0 ja PyTorch 1.12.1.
- Integratsioon AWS-i DLC-dega, et käitada hajutatud koolitus ja järeldamine töökoormused.
Järgmine arhitektuuriskeem on kiire ülevaade kõigist teenuseintegratsioonidest (sealhulgas juba mainitud), mis on Kubeflow juhtimis- ja andmetasandi komponentide jaoks saadaval AWS-is Kubeflow'is. Kubeflow juhttasand on installitud Amazon EKS-i peale, mis on hallatav konteinerteenus, mida kasutatakse Kubernetese rakenduste pilves käitamiseks ja skaleerimiseks. Need AWS-i teenuste integratsioonid võimaldavad teil Kubeflow juhttasandi kriitilised osad Kubernetesist lahti siduda, pakkudes turvalist, skaleeritavat, vastupidavat ja kulutõhusat disaini. Lisateavet selle väärtuse kohta, mida need teenuste integratsioonid avatud lähtekoodiga Kubeflowle lisavad, leiate artiklist Ehitage ja juurutage Kubernetesis skaleeritav masinõppesüsteem Kubeflow abil AWS-is.
Arutleme üksikasjalikumalt, kuidas Kubeflow on AWS 1.6.1 põhifunktsioonid teie organisatsioonile kasulikud olla.
Kubeflow AWS-i funktsiooni üksikasjad
Kubeflow 1.6.1 versiooniga püüdsime pakkuda erinevat tüüpi klientidele paremaid tööriistu, mis muudavad Kubeflow kasutamise alustamise lihtsaks, olenemata sellest, milliseid valikuid valite. Need tööriistad on hea lähtepunkt ja neid saab muuta vastavalt teie vajadustele.
Juurutamisvõimalused
Pakume erinevaid juurutusvõimalusi klientide erinevateks kasutusjuhtudeks. Siin saate valida, milliste AWS-teenustega soovite oma Kubeflow juurutuse integreerida. Kui otsustate juurutussuvandeid hiljem muuta, soovitame teil teha uue juurutuse jaoks värske installi. Saadaval on järgmised juurutamisvalikud:
Kui soovite Kubeflow juurutada minimaalsete muudatustega, kaaluge vanill kasutuselevõtu võimalus. Kõiki saadaolevaid juurutusvalikuid saab installida Kustomize'i, Helmi või Terraformi abil.
Meil on ka erinevaid lisandmoodulite juurutusi, mida saab installida mis tahes järgmiste juurutusvalikute peale.
Installimisvõimalused
Kui olete otsustanud, milline juurutussuvand teie vajadustele kõige paremini sobib, saate valida, kuidas soovite neid juurutusi installida. Püüdes teenindada nii eksperte kui ka uusi tulijaid, on meil erinevad automatiseerimise ja konfiguratsiooni tasemed.
1. valik: Terraform (IaC)
See loob EKS-i klastri ja kõik sellega seotud AWS-i infrastruktuuri ressursid ning seejärel juurutab Kubeflow kõik ühes käsus, kasutades Terraformi. Sisemiselt kasutab see EKS-i jooniseid ja Helmi diagramme.
Sellel valikul on järgmised eelised:
- See pakub ettevõtetele paindlikkust Amazon EKS-i ja Kubeflow juurutamiseks ühe käsuga, ilma et peaks muretsema konkreetsete Kubeflow komponentide konfiguratsioonide pärast. See aitab tohutult kiirendada tehnoloogia hindamist, prototüüpide koostamist ja tootearenduse elutsüklit, pakkudes paindlikkust terraformmoodulite kasutamiseks ja nende muutmiseks, et see vastaks projekti spetsiifilistele vajadustele.
- Paljud organisatsioonid, kelle pilvestrateegia keskmeks on Terraform, saavad nüüd kasutada Kubeflow AWS Terraformi lahenduses, et oma pilveesmärke täita.
2. valik: Kustomize või Helm Charts:
See suvand võimaldab teil Kubeflow juurutada kaheastmelise protsessina:
- Looge AWS-i ressursse, nagu Amazon EKS, Amazon RDS, Amazon S3 ja Amazon Cognito, kas AWS-i distributsioonis sisalduvate automatiseeritud skriptide kaudu või käsitsi, järgides samm-sammult juhend.
- Installige Kubeflow juurutused kas Helmi diagrammide või Kustomize'i abil.
Sellel valikul on järgmised eelised:
- Selle installivaliku põhieesmärk on pakkuda Kubeflowga seotud Kubernetese konfiguratsioone. Seetõttu saate luua või tuua olemasolevaid EKS-klastreid või mis tahes seotud AWS-i ressursse, nagu Amazon RDS, Amazon S3 ja Amazon Cognito, ning konfigureerida ja hallata seda, et see töötaks koos Kubeflow'ga AWS-is.
- Lihtsam on liikuda avatud lähtekoodiga Kustomize Kubeflow manifestilt AWS Kubeflow distributsioonile.
Järgmine diagramm illustreerib mõlema valiku arhitektuuri.
Integratsioon SageMakeriga
SageMaker on täielikult hallatav teenus, mis on loodud ja optimeeritud spetsiaalselt ML-i töövoogude haldamiseks. See eemaldab infrastruktuuri haldamise diferentseerimata raske raskuse ja kaotab vajaduse investeerida IT-sse ja DevOpsi, et hallata klastreid ML-mudelite loomise, koolituse ja järelduste tegemiseks.
Paljud AWS-i kliendid, kellel on teisaldatavuse nõuded või kohapealsed standardpiirangud, kasutavad Amazon EKS-i korratavate ML-konveierite seadistamiseks, mis käitavad koolitust ja töökoormust. See nõuab aga, et arendajad kirjutaksid kohandatud koodi, et optimeerida aluseks olevat ML-i infrastruktuuri, tagada kõrge kättesaadavus ja töökindlus ning järgida asjakohaseid turva- ja regulatiivseid nõudeid. Seetõttu soovivad need kliendid kasutada SageMakerit kulude optimeerimise ja hallatava infrastruktuuri jaoks mudelite väljaõppeks ja juurutamiseks ning jätkata Kubernetese kasutamist orkestreerimiseks ja ML torujuhtmete jaoks, et säilitada standardimine ja teisaldatavus.
Selle vajaduse lahendamiseks võimaldab AWS teil treenida, häälestada ja juurutada Amazon EKS-i SageMakeris mudeleid, kasutades kahte järgmist võimalust.
- Amazon SageMaker ACK operaatorid Kubernetese jaoks, mis põhinevad AWS-kontrollerid Kubernetese jaoks (ACK) raamistik. ACK on AWS-i strateegia, mis toob kaasa Kubernetese kohandatud kontrollerite ehitamise standardimise, mis võimaldab Kubernetese kasutajatel pakkuda AWS-i ressursse, nagu andmebaasid või sõnumijärjekorrad, lihtsalt Kubernetese API-liidese abil. SageMaker ACK-operaatorid muudavad ML-i arendajatel ja andmeteadlastel, kes kasutavad Kubernetest oma juhtimistasandina, ML-mudelite treenimise, häälestamise ja juurutamise SageMakeris lihtsamaks ilma SageMakeri konsooli sisse logimata.
- . SageMakeri komponendid Kubeflow torujuhtmete jaoks, mis võimaldavad teil integreerida SageMakeri Kubeflow Pipelines'i teisaldatavuse ja orkestreerimisega. SageMakeri komponentide puhul töötab iga konveieri töövoo töö kohaliku Kubernetese klastri asemel SageMakeris. See võimaldab teil Kubeflow torujuhtmetest luua ja jälgida SageMakeri natiivset koolitust, häälestamist, lõpp-punkti juurutamist ja paketttransformatsiooni töid, võimaldades teil teisaldada täielikud arvutused, sealhulgas andmetöötlus- ja koolitustööd Kubernetese klastrist SageMakeri masinõppele optimeeritud hallatavasse teenusesse.
Alates Kubeflow versioonist AWS v1.6.1 koondavad kõik saadaolevad Kubeflow juurutusvalikud vaikimisi ühele platvormile mõlemad Amazon SageMakeri integreerimisvalikud. See tähendab, et saate nüüd esitada SageMakeri töid kasutades SageMaker ACK-i operaatoreid Kubeflow sülearvuti serverist, esitades kohandatud SageMakeri ressursi või Kubeflow torujuhtme sammust, kasutades SageMakeri komponente.
SageMakeri komponentidest on kaks versiooni – Boto3 (AWS SDK for AWS SDK for Python) põhinevad 1. versiooni komponendid ja SageMaker Operator for K8s (ACK) põhinevad versiooni 2 komponendid. Uued SageMakeri komponentide versioon 2 toetavad uusimaid SageMakeri koolitusrakendusi ja jätkame SageMakeri funktsioonide lisamist sellele komponendi versioonile. Teil on aga paindlikkus kombineerida Sagemakeri komponentide versiooni 2 koolituseks ja versiooni 1 muude SageMakeri funktsioonide jaoks, nagu hüperparameetrite häälestamine, töötlemistööd, hostimine ja palju muud.
Integratsioon Prometheuse ja Grafanaga
Prometheus on avatud lähtekoodiga mõõdikute koondamise tööriist, mille saate konfigureerida Kubernetese klastrites töötama. Kubernetese klastritel töötamisel kraabib Prometheuse põhiserver perioodiliselt kaustade lõpp-punkte.
Kubeflow komponendid, nagu Kubeflow Pipelines (KFP) ja Notebook, väljastavad Prometheuse mõõdikuid, mis võimaldavad jälgida komponentide ressursse, näiteks jooksvate katsete arvu või sülearvutite arvu.
Neid mõõdikuid saab koondada Kubernetese klastris töötav Prometheuse server ja teha päringuid Prometheuse päringukeele (PromQL) abil. Lisateavet Prometheuse toetatavate funktsioonide kohta leiate veebisaidilt Prometheuse dokumentatsioon.
Kubeflow AWS-i levitamisel pakub tuge integreerimiseks järgmiste AWS-i hallatavate teenustega:
- Amazoni hallatav Prometheus (AMP), mis on a Prometheus- ühilduv konteinerite infrastruktuuri jälgimisteenus ja konteinerite rakendusmõõdikud, mis hõlbustavad klientidel konteinerikeskkondade turvalist jälgimist ulatuslikult. AMP abil saate visualiseerida, analüüsida ja alarmeerida oma mõõdikuid, logisid ja jälgi, mis on kogutud teie jälgitavussüsteemi mitmest andmeallikast, sealhulgas AWS-ist, kolmanda osapoole ISV-dest ja muudest teie IT-portfelli ressurssidest.
- Amazon Managed Grafana, avatud lähtekoodil põhinev täielikult hallatav ja turvaline andmete visualiseerimisteenus grafana projekt, mis võimaldab klientidel teha koheselt päringuid, seostada ja visualiseerida oma rakenduste töömõõdikuid, logisid ja jälgi mitmest andmeallikast. Amazon Managed Grafana koormab Grafana operatiivjuhtimise maha, skaleerides automaatselt arvutus- ja andmebaasitaristut vastavalt kasutusvajadustele, kasutades automaatseid versioonivärskendusi ja turvapaigaldusi.
AWS-i levitamise Kubeflow pakub tuge Amazoni hallatava teenuse Prometheuse ja Amazon Managed Grafana integreerimiseks, et hõlbustada Prometheuse mõõdikute turvalist mastaabis allaneelamist ja visualiseerimist.
Järgmised mõõdikud on sisse võetud ja neid saab visualiseerida.
- Kubeflow komponentidest (nt Kubeflow Pipelines ja sülearvuti server) väljastatud mõõdikud
- KubeFlow juhttasandi mõõdikud
Amazoni hallatava teenuse Prometheuse ja Amazon Managed Grafana jaoks oma Kubeflow klastri jaoks konfigureerimiseks vaadake jaotist Kasutage Prometheust, Prometheuse Amazoni hallatavat teenust ja Amazon Managed Grafanat, et jälgida mõõdikuid Kubeflow abil AWS-is.
Lahenduse ülevaade
Sel juhul kasutame Kubeflow vanilli juurutamist, kasutades Terraformi installivalikut. Kui installimine on lõppenud, logime sisse Kubeflow armatuurlauale. Armatuurlaual käivitame Kubeflow Jupyteri sülearvutiserveri, et luua Kubeflow torujuhe, mis kasutab SageMakerit piltide klassifitseerimise mudeli jaotatud koolituse läbiviimiseks ja SageMakeri lõpp-punkti mudeli juurutamiseks.
Eeldused
Veenduge, et vastaksite järgmistele eeltingimustele:
- Teil on AWS-i konto.
- Veenduge, et olete
us-west-2
Piirkond selle näite käitamiseks. - Kasutage Google Chrome'i, et suhelda AWS-i juhtimiskonsool ja Kubeflow.
- Veenduge, et teie kontol oleks teenusekvootide konsooli abil SageMaker Trainingi ressursitüübi limiit ml.p3.2xlarge jaoks suurendatud 2-ni.
- Valikuliselt saate kasutada AWSi pilv, pilvepõhine integreeritud arenduskeskkond (IDE), mis võimaldab teha kogu töö teie veebibrauserist. Seadistusjuhiste saamiseks vaadake Seadistage Cloud9 IDE. Valige AWS Cloud18.04 seadetes platvormiks Ubuntu Server 9.Seejärel valige oma AWS Cloud9 keskkonnast plussmärk ja avage uus terminal.
Samuti saate konfigureerida an AWS-i käsurea liides (AWS CLI) profiil. Selleks vajate pääsuvõtme ID-d ja salajast juurdepääsuvõtit AWS-i identiteedi- ja juurdepääsuhaldus (AMI) kasutaja konto administraatoriõigustega (lisage olemasolev hallatud poliitika) ja programmiline juurdepääs. Vaadake järgmist koodi:
Kontrollige õigusi, mida cloud9 kasutab AWS-i ressursside kutsumiseks.
Kontrollige allolevast väljundist, et näete AWS CLI profiilis seadistatud administraatori kasutaja arn. Selles näites on see "kubeflow-kasutaja"
Installige AWS-i Amazon EKS ja Kubeflow
Amazon EKS-i ja Kubeflow'i installimiseks AWS-i toimige järgmiselt.
- Seadistage oma keskkond Kubeflow juurutamiseks AWS-is:
- Rakendage Kubeflow vaniljeversioon AWS-is ja sellega seotud AWS-i ressurssides, nagu EKS, kasutades Terraformi. Pange tähele, et EKS-i sõlmerühmas kasutatavad EBS-i köited ei ole vaikimisi krüptitud:
Seadistage Kubeflow õigused
- Lisage SageMakeri, S3 ja IAM-i api kõnede tegemiseks Notebooki ja Pipeline'i komponentide poodi load
kubeflow_iam_permissions.sh
skript. - Looge SageMakeri täitmisroll, et võimaldada SageMakeri koolitustööl juurdepääsuks S3 teenuse treeningandmetele
sagemaker_role.sh
skript.
Juurdepääs Kubeflow armatuurlauale
Kubeflow armatuurlauale juurdepääsemiseks toimige järgmiselt.
- Saate Kubeflow armatuurlauda käitada kohapeal Cloud9 keskkonnas, ilma et avaldaksite oma URL-e avalikule Internetile, käivitades allolevad käsud.
- Vali Töötava rakenduse eelvaade.
- Valige Kubeflow armatuurlaua nurgas ikoon, et avada see Chrome'is eraldi vahekaardina.
- Sisestage vaikemandaadid (
user@example.com/12341234
) Kubeflow armatuurlauale sisselogimiseks.
Seadistage Kubeflow AWS-i keskkonnas
Kui olete Kubeflow armatuurlauale sisse loginud, veenduge, et teil on õige nimeruum (kubeflow-user-example-com
) valitud. Kubeflow AWS-i keskkonnas seadistamiseks tehke järgmised toimingud.
- Valige Kubeflow armatuurlaual Sülearvutid navigeerimispaanil.
- Vali Uus sülearvuti.
- eest Nimi, sisenema
aws-nb
. - eest Jupyter Docketi pilt, valige pilt
jupyter-pytorch:1.12.0-cpu-py38-ubuntu20.04-ec2-2022-09-20
(viimane saadavaljupyter-pytorch
DLC-pilt). - eest Protsessor, sisenema
1
. - eest Mälu, sisenema
5
. - eest GPU, jäta nagu mitte ükski.
- Ärge tehke muudatusi Tööruum ja Andmemahud lõigud.
- valima Lubage juurdepääs Kubeflow torujuhtmetele aasta Konfiguratsioonid jaotist ja valige Käivita.
- Veenduge, et teie märkmik on edukalt loodud (see võib võtta paar minutit).
- Vali Võta meiega ühendust JupyterLabi sisse logimiseks.
- Kloonige repo sisestades
https://github.com/aws-samples/eks-kubeflow-cloudformation-quick-start.git
aasta Kloonige repo valdkonnas. - Vali Kloonide.
Käivitage hajutatud koolitusnäide
Pärast Jupyteri sülearvuti seadistamist saate käivitada kogu demo, kasutades kaustast järgmisi kõrgetasemelisi samme eks-kubeflow-cloudformation-quick-start/workshop/pytorch-distributed-training
kloonitud hoidlas:
- Käivitage PyTorch Distributed Data Parallel (DDP) treeningskript – Vaadake PyTorchi DDP treeningskripti
cifar10-distributed-gpu-final.py
, mis sisaldab näidiskonvolutsioonilist närvivõrku ja loogikat koolituse levitamiseks mitme sõlmega CPU ja GPU klastris. - Looge Kubeflow torujuhe – Käivitage märkmik
STEP1.0_create_pipeline_k8s_sagemaker.ipynb
et luua konveier, mis käitab ja juurutab mudeleid SageMakeris. Veenduge, et installite SageMakeri teegi esimese märkmiku lahtri osana ja taaskäivitage kernel enne ülejäänud märkmiku lahtrite käivitamist. - Kutsuge SageMakeri lõpp-punkt – Käivitage märkmik
STEP1.1_invoke_sagemaker_endpoint.ipynb
eelmises märkmikus loodud SageMakeri mudeli järelduse lõpp-punkti kutsumiseks ja testimiseks.
Järgmistes osades käsitleme kõiki neid samme üksikasjalikult.
Käivitage PyTorch DDP treeningskript
Jaotatud koolituse raames koolitame klassifikatsioonimudelit, mis on loodud lihtsa konvolutsioonilise närvivõrgu abil, mis töötab CIFAR10 andmestikul. Treeningu skript cifar10-distributed-gpu-final.py
sisaldab ainult avatud lähtekoodiga teeke ja ühildub nii Kubernetese kui ka SageMakeri koolitusklastrites töötamiseks kas GPU seadmetes või CPU eksemplarides. Enne märkmiku näidete käivitamist vaatame koolitusskripti mõnda olulist aspekti.
Me kasutame torch.distributed
moodul, mis sisaldab PyTorchi tuge ja sideprimitiive mitme protsessi paralleelsuse tagamiseks klastri sõlmede vahel:
Loome lihtsa kujutise klassifitseerimismudeli, kasutades konvolutsiooni-, maksimaalse koondamise ja lineaarsete kihtide kombinatsiooni, millele relu
Aktiveerimisfunktsiooni rakendatakse mudelitreeningu edasipääsul:
Kui treeningklastril on GPU-d, käivitab skript koolituse CUDA-seadmetes ja seadme muutuja sisaldab CUDA vaikeseadet:
Enne PyTorchi abil hajutatud koolituse läbiviimist DistributedDataParallel
hajutatud töötlemise käivitamiseks mitmes sõlmes peate hajutatud keskkonna lähtestama helistamise teel init_process_group
. See lähtestatakse igas koolitusklastri masinas.
Me loome klassifikaatori mudeli ja kopeerime mudeli sihtseadmesse. Kui hajutatud treening on lubatud mitmel sõlmel, siis DistributedDataParallel
klassi kasutatakse ümbrisobjektina mudelobjekti ümber, mis võimaldab sünkroonset hajutatud koolitust mitme masina vahel. Sisendandmed jagatakse partii mõõtmete järgi ja mudeli koopia paigutatakse igasse masinasse ja igasse seadmesse. Vaadake järgmist koodi:
Looge Kubeflow torujuhe
Märkmik kasutab Kubeflow Pipelines SDK ja selle pakutud Pythoni pakettide komplekti ML-i töövoo torujuhtmete täpsustamiseks ja käitamiseks. Selle SDK osana kasutame domeenipõhise keele (DSL) paketi dekoraatorit dsl.pipeline
, mis kaunistab Pythoni funktsioone torujuhtme tagastamiseks.
Kubeflow torujuhe kasutab SageMakeri komponenti V2 SageMakerile koolituse esitamiseks SageMakeri ACK-operaatorite abil. SageMakeri mudeli loomine ja juurutamine kasutab SageMakeri komponenti V1, mis on Boto3-põhised SageMakeri komponendid. Kasutame selles näites mõlema komponendi kombinatsiooni, et demonstreerida teie valiku paindlikkust.
- Laadige SageMakeri komponendid, kasutades järgmist koodi:
Järgmises koodis loome Kubeflow torujuhtme, kus juhime SageMakeri hajutatud koolitust, kasutades kahte
ml.p3.2xlarge
juhtumid:Pärast torujuhtme defineerimist saate selle Kubeflow Pipelines SDK abil kompileerida Argo YAML-i spetsifikatsioonile
kfp.compiler
pakett. Saate seda konveieri käitada, kasutades Kubeflow Pipelines SDK klienti, mis kutsub Pipelinesi teenuse lõpp-punkti ja edastab asjakohased autentimispäised otse sülearvutist. Vaadake järgmist koodi: - Vali Käivitamise üksikasjad link viimase lahtri all, et vaadata Kubeflow torujuhet. Järgmine ekraanipilt näitab meie SageMakeri koolituse ja juurutamise komponendi torujuhtme üksikasju.
- Valige koolitustöö samm ja Logid SageMakeri logidele juurdepääsuks valige link CloudWatchi logid.
Järgmisel ekraanipildil on CloudWatchi logid mõlema ml.p3.2xlarge eksemplari kohta. - Logide vaatamiseks valige mõni rühm.
- Jäädvustage SageMakeri lõpp-punkt, valides Sagemaker – juurutage mudel samm ja kopeerimine
endpoint_name
väljundartefakti väärtus.
Kutsuge SageMakeri lõpp-punkt
Märkmik STEP1.1_invoke_sagemaker_endpoint.ipynb
kutsub esile eelmises etapis loodud SageMakeri järelduse lõpp-punkti. Veenduge, et värskendate lõpp-punkti nime:
Koristage
Ressursside puhastamiseks toimige järgmiselt.
- AWS-i ressursside kustutamiseks käivitage AWS Cloud9-s järgmised käsud.
- Kustuta IAM-i roll "
sagemakerrole
" kasutades järgmist AWS CLI käsku: - Kustutage SageMakeri lõpp-punkt, kasutades järgmist AWS CLI käsku:
kokkuvõte
Selles postituses tõime esile väärtuse, mida Kubeflow AWS 1.6.1-s pakub AWS-i hallatavate teenuste integreerimise kaudu, et rahuldada ettevõtte tasemel AI ja ML kasutusjuhtumeid. Kubeflow'i installimiseks AWS-i koos erinevate teenuseintegratsioonidega, kasutades Terraformi, Kustomize'i või Helmi, saate valida mitme juurutusvaliku hulgast. Selle postituse kasutusjuhtum demonstreeris Kubeflow integreerimist SageMakeriga, mis kasutab SageMakeri hallatavat koolitusklastrit, et käitada hajutatud koolitust kujutiste klassifitseerimismudeli jaoks ja SageMakeri lõpp-punkti mudeli juurutamiseks.
Samuti oleme teinud kättesaadavaks a torujuhtme näidisnäide mis kasutab uusimaid SageMakeri komponente; saate seda käivitada otse Kubeflow armatuurlaualt. See torujuhe nõuab Amazon S3 andmed ja SageMakeri täitmise IAM-i roll vajalike sisenditena.
AWS-is Kubeflow kasutamise alustamiseks vaadake saadaolevaid AWS-iga integreeritud juurutusvalikuid Kubeflow AWS-is. Saate jälgida AWS Labsi hoidla et jälgida kõiki Kubeflow'i AWS-i kaastöid. Samuti leiate meid aadressilt Kubeflow #AWS Slack Channel; teie tagasiside aitab meil seada prioriteediks järgmised funktsioonid, mis aitavad Kubeflow projekti kaasa aidata.
Autoritest
Kanwaljit Khurmi on Amazon Web Services'i lahenduste vanemarhitekt. Ta teeb koostööd AWS-i klientidega, et pakkuda juhiseid ja tehnilist abi, mis aitab neil AWS-i kasutamisel oma lahenduste väärtust tõsta. Kanwaljit on spetsialiseerunud klientide abistamisele konteiner- ja masinõpperakendustega.
Kartik Kalamadi on Amazon AI tarkvaraarenduse insener. Praegu keskendub masinõppe Kubernetese avatud lähtekoodiga projektidele, nagu Kubeflow ja AWS SageMaker Controller for k8s. Vabal ajal meeldib mulle arvutimänge mängida ja Unity mootori abil VR-iga askeldada.
Rahul Kharse on Amazon Web Services tarkvaraarenduse insener. Tema töö keskendub AWS-i teenuste integreerimisele avatud lähtekoodiga konteinerite ML Ops platvormidega, et parandada nende mastaapsust, töökindlust ja turvalisust. Lisaks klientide funktsioonide soovidele keskendumisele meeldib Rahulile katsetada ka valdkonna uusimate tehnoloogiliste arengutega.
- Täpsem (300)
- AI
- ai kunst
- ai kunsti generaator
- on robot
- Amazon SageMaker
- tehisintellekti
- tehisintellekti sertifikaat
- tehisintellekt panganduses
- tehisintellekti robot
- tehisintellekti robotid
- tehisintellekti tarkvara
- AWS-i masinõpe
- blockchain
- plokiahela konverents ai
- coingenius
- vestluslik tehisintellekt
- krüptokonverents ai
- dall's
- sügav õpe
- google ai
- KubeFlow
- masinõpe
- Platon
- plato ai
- Platoni andmete intelligentsus
- Platoni mäng
- PlatoData
- platogaming
- skaala ai
- süntaks
- sephyrnet