Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMakeris ressursside märgistamist

Kuna ettevõtted ja IT-juhid soovivad kiirendada masinõppe (ML) kasutuselevõttu, kasvab vajadus mõista ML-keskkonna kulutuste ja kulude jaotamist, et see vastaks ettevõtte nõuetele. Ilma korraliku kulude juhtimise ja juhtimiseta võivad teie ML-i kulutused tuua teie igakuises AWS-i arvel üllatusi. Amazon SageMaker on täielikult hallatav ML-platvorm pilves, mis varustab meie ettevõtte kliente tööriistade ja ressurssidega, et kehtestada kulude jaotamise meetmed ning parandada üksikasjalike kulude ja kasutuse nähtavust teie meeskondade, äriüksuste, toodete ja muu poolt.

Selles postituses jagame näpunäiteid ja parimaid tavasid teie SageMakeri keskkonna ja töökoormuse kulude jaotamise kohta. Peaaegu kõigis AWS-i teenustes, sealhulgas SageMaker, on ressurssidele siltide lisamine tavaline viis kulude jälgimiseks. Need sildid aitavad teil ML-kulutusi jälgida, aru anda ja jälgida selliste valmislahenduste kaudu nagu AWS-i kuluuurija ja AWS-i eelarved, samuti kohandatud lahendused, mis on üles ehitatud andmetele AWS-i kulu- ja kasutusaruanded (CURs).

Kulude jaotamise sildistamine

Kulude jaotamine AWS-is on kolmeetapiline protsess:

  1. Kinnitama kulude jaotamise sildid oma ressurssidele.
  2. Aktiveerige oma sildid jaotises Kulude jaotamise sildid AWS-i arvelduskonsooli jaotises.
  3. Kasutage silte kulude jaotamise aruandluse jälgimiseks ja filtreerimiseks.

Pärast siltide loomist ja ressurssidele lisamist kuvatakse need AWS-i arvelduskonsoolis Kulude jaotamise sildid jaotises Kasutaja määratletud kulujaotuse sildid. Pärast märgendite loomist võib kuluda kuni 24 tundi. Seejärel peate need sildid AWS-i jaoks aktiveerima, et hakata neid oma ressursside jaoks jälgima. Tavaliselt kulub pärast sildi aktiveerimist umbes 24–48 tundi, enne kui need Cost Exploreris kuvatakse. Lihtsaim viis kontrollida, kas teie sildid töötavad, on otsida Cost Exploreri siltide filtrist oma uus silt. Kui see on olemas, siis olete valmis kasutama silte oma kulude jaotamise aruandluses. Seejärel saate rühmitada tulemused sildivõtmete järgi või filtreerida sildi väärtuste järgi, nagu on näidatud järgmisel ekraanipildil.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

Üks asi, mida tuleb tähele panna: kui kasutate AWS-i organisatsioonid ja neil on lingitud AWS-i kontod, saab silte aktiveerida ainult peamisel maksjakontol. Valikuliselt saate aktiveerida ka AWS-i kontode CUR-id, mis võimaldavad kulude jaotamise aruandeid CSV-failina, kus teie kasutus- ja kulud on rühmitatud teie aktiivsete siltide alusel. See võimaldab teil oma kulusid üksikasjalikumalt jälgida ja hõlbustab kohandatud aruandluslahenduste seadistamist.

Sildistamine SageMakeris

Kõrgel tasemel saab SageMakeri ressursside märgistamise rühmitada kahte gruppi:

  • Kas märgistada SageMaker märkmikukeskkond Amazon SageMaker Studio domeenid ja domeeni kasutajad või SageMakeri märkmiku eksemplarid
  • SageMakeri hallatavate tööde (märgistamine, töötlemine, väljaõpe, hüperparameetrite häälestamine, partii teisendus ja palju muud) ja ressursside (nt mudelid, töörühmad, lõpp-punktide konfiguratsioonid ja lõpp-punktid) märgistamine

Käsitleme neid selles postituses üksikasjalikumalt ja pakume mõningaid lahendusi juhtimiskontrolli rakendamiseks, et tagada hea märgistamishügieen.

SageMaker Studio domeenide ja kasutajate märgistamine

Studio on veebipõhine integreeritud arenduskeskkond (IDE) ML-i jaoks, mis võimaldab teil luua, koolitada, siluda, juurutada ja jälgida oma ML-mudeleid. Saate Stuudio märkmikud kiiresti käivitada ja dünaamiliselt üles või alla helistada aluseks olevaid arvutusressursse ilma tööd katkestamata.

Nende dünaamiliste ressursside automaatseks märgistamiseks peate määrama sildid SageMakeri domeenile ja domeeni kasutajatele, kellel on neile ressurssidele juurdepääs. Saate määrata need sildid parameetris sildid loo-domeen or loo-kasutaja-profiil profiili või domeeni loomise ajal või saate need hiljem lisada Lisa märksõnu API. Studio kopeerib ja määrab need sildid automaatselt domeenis või konkreetsete kasutajate loodud Studio märkmikutele. Samuti saate SageMakeri domeenidele silte lisada, muutes Studio juhtpaneelil domeeni sätteid.

Järgmine on näide profiilile siltide määramisest loomise ajal.

aws sagemaker create-user-profile --domain-id  --user-profile-name data-scientist-full --tags Key=studiouserid,Value= --user-settings ExecutionRole=arn:aws:iam:::role/SageMakerStudioExecutionRole_datascientist-full

Olemasolevate domeenide ja kasutajate märgistamiseks kasutage add-tags API. Seejärel lisatakse sildid uutele märkmikele. Nende siltide rakendamiseks oma olemasolevatele sülearvutitele peate taaskäivitama selle kasutajaprofiili juurde kuuluva Studio rakenduse (Kernel Gateway ja Jupyter Server). See ei põhjusta sülearvuti andmete kadu. Vaadake seda Lülitage välja ja värskendage SageMaker Studio ja Studio rakendused et õppida, kuidas Studio rakendusi kustutada ja taaskäivitada.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

SageMakeri märkmiku eksemplaride sildistamine

SageMakeri märkmiku eksemplari puhul rakendatakse sildistamine eksemplarile endale. Sildid määratakse kõigile samas eksemplaris töötavatele ressurssidele. Saate määrata sildid programmiliselt, kasutades parameetris tags loo-märkmik-eksemplar API või lisage need eksemplari loomise ajal SageMakeri konsooli kaudu. Samuti saate silte igal ajal lisada või värskendada, kasutades Lisa märksõnu API või SageMakeri konsooli kaudu.

Pange tähele, et see ei hõlma SageMakeri hallatavaid töid ja ressursse, nagu koolitus- ja töötlemistööd, kuna need on pigem teeninduskeskkonnas kui eksemplaris. Järgmises jaotises käsitleme üksikasjalikumalt nende ressursside sildistamise rakendamist.

SageMakeri hallatavate tööde ja ressursside märgistamine

SageMakeri hallatavate tööde ja ressursside puhul tuleb sildistada tags atribuut iga API päringu osana. An SKLearnProcessor näidet illustreerib järgmine kood. Rohkem näiteid selle kohta, kuidas määrata märgendeid teistele SageMakeri hallatavatele töödele ja ressurssidele, leiate saidilt GitHub repo.

from sagemaker import get_execution_role
from sagemaker.sklearn.processing import SKLearnProcessor

processing_tags = [{' Key':"cost-center','Value':'TF2WorkflowProcessing'}]
sklearn_processorl = SKLearnProcessor(framework_version='0.23-1' ,
									 role=get_execution_role(),
									 instance_type='ml.m5.xlarge',
									 instance_count=2,
									 tags=processing_tags)

SageMakeri torujuhtmete märgistamine

SageMakeri torujuhtmete puhul saate iga üksiku etapi asemel märgistada kogu konveieri tervikuna. Konveieri SageMaker levitab silte automaatselt igasse konveieri etappi. Teil on endiselt võimalus lisada vajadusel üksikutele etappidele täiendavaid eraldi silte. Studio kasutajaliideses kuvatakse konveieri sildid metaandmete jaotises.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

Konveierile siltide rakendamiseks kasutage SageMaker Python SDK-d:

pipeline_tags = [ {'Key': 'pipeline-type', 'Value': 'TF2WorkflowPipeline'}]
pipeline.upsert(role_arn=role, tags=pipeline_tags)
execution = pipeline.start()

Jõustage sildistamine IAM-eeskirjade abil

Kuigi sildistamine on tõhus mehhanism pilvehalduse ja -haldusstrateegiate rakendamiseks, võib õige märgistamiskäitumise jõustamine osutuda keeruliseks, kui jätate selle lihtsalt lõppkasutajatele. Kuidas vältida ML-i ressursi loomist, kui konkreetne silt puudub, kuidas tagada õigete siltide rakendamine ja kuidas takistada kasutajatel olemasolevaid silte kustutamast?

Saate seda teha kasutades AWS-i identiteedi- ja juurdepääsuhaldus (IAM) poliitikad. Järgmine kood on näide poliitikast, mis takistab SageMakeri toiminguid, nagu CreateDomain or CreateNotebookInstance kui päring ei sisalda keskkonnavõtit ja üht loendiväärtustest. The ForAllValues modifikaator koos aws:TagKeys tingimusklahv näitab, et ainult võti environment on taotluses lubatud. See takistab kasutajatel teiste võtmete kaasamist, näiteks juhuslikku kasutamist Environment asemel environment.

"sagemaker:CreateTrainingJob"
      ],
      "{
      "Sid": "SageMakerEnforceEnvtOnCreate",
      "Action": [
        "sagemaker:CreateDomain",
        "sagemaker:CreateEndpoint",
        "sagemaker:CreateNotebookInstance",
        Effect": "Allow",
      "Resource": "*",
  "Condition": {
            "StringEquals": {
                "aws:RequestTag/environment": [
                    "dev","staging","production"
                ]
            },
            "ForAllValues:StringEquals": {"aws:TagKeys": "environment"}
        }
      }

Sildi eeskirjad ja teenuse kontrolli poliitikad (SCP-d) võivad olla ka hea viis ML-ressursside loomise ja märgistamise standardimiseks. Lisateavet organisatsiooni tasandil märgistamist jõustava ja kinnitava märgistamisstrateegia rakendamise kohta leiate jaotisest Kulude jaotamise ajaveebi seeria nr 3: jõustage ja kinnitage AWS-i ressursside sildid.

Kulude jaotamise aruandlus

Saate vaadata silte, filtreerides vaateid Cost Exploreris, kuvades a igakuine kulude jaotamise aruannevõi CUR-i uurides.

Siltide visualiseerimine Cost Exploreris

Cost Explorer on tööriist, mis võimaldab teil vaadata ja analüüsida oma kulusid ja kasutust. Oma kasutust ja kulusid saate uurida põhigraafiku abil: kuluuurija kulu- ja kasutusaruanded. Kiire video Cost Exploreri kasutamise kohta vaadake siit Kuidas kasutada Cost Explorerit oma kulutuste ja kasutuse analüüsimiseks?

Cost Exploreriga saate märgendite järgi filtreerida, kuidas näete oma AWS-i kulusid. Grupi poolt võimaldab meil tulemusi välja filtreerida märgendivõtmete, näiteks Environment, Deploymentvõi Cost Center. Sildifilter aitab meil valida soovitud väärtuse sõltumata võtmest. Näited hõlmavad järgmist Production ja Staging. Pidage meeles, et pärast siltide lisamist ja aktiveerimist peate ressursse käivitama. vastasel juhul ei ole Cost Exploreril kasutusandmeid ja märgendi väärtust ei kuvata filtri või valiku alusel rühmana.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

Järgmine ekraanipilt on näide kõigi väärtuste järgi filtreerimisest BusinessUnit tag.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

Siltide uurimine CUR-is

Kulude ja kasutuse aruanne sisaldab kõige põhjalikumat saadaolevate kulu- ja kasutusandmete kogumit. Aruanne sisaldab reaüksusi iga kordumatu AWS-i toote, kasutustüübi ja toimingu kombinatsiooni kohta, mida teie AWS-i konto kasutab. Saate kohandada CUR-i, et koondada teave kas tundide või päevade kaupa. Igakuine kulude jaotamise aruanne on üks võimalus kulude jaotamise aruandluse seadistamiseks. Saate seadistada a igakuine kulude jaotamise aruanne mis loetleb teie konto AWS-i kasutuse tootekategooriate ja lingitud konto kasutajate kaupa. Aruanne sisaldab samu ridu, mis üksikasjalik arveldusaruanne ja täiendavad veerud teie märgendivõtmete jaoks. Saate selle seadistada ja aruande alla laadida, järgides juhiseid Igakuine kulude jaotamise aruanne.

Järgmine ekraanipilt näitab, kuidas kasutaja määratud sildiklahvid CUR-is kuvatakse. Kasutaja määratud sildivõtmetel on eesliide userNagu user:Department ja user:CostCenter. AWS-i loodud sildivõtmetel on eesliide aws.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

Visualiseerige CUR Amazon Athena ja Amazon QuickSighti abil

Amazonase Athena on interaktiivne päringuteenus, mis muudab Amazon S3 andmete analüüsi standardse SQL-i abil lihtsaks. Athena on serverita, seega puudub haldamiseks infrastruktuur ja maksate ainult käitatavate päringute eest. Athena integreerimiseks CUR-idega vt Kulude ja kasutusaruannete päringute tegemine Amazon Athena abil. Seejärel saate standardse SQL-i abil CUR-andmete päringute tegemiseks koostada kohandatud päringuid. Järgmine ekraanipilt on näide päringust kõigi ressursside filtreerimiseks, mille väärtus on TF2WorkflowTraining cost-center tag.

select * from {$table_name} where resource_tags_user_cost-center= 'TF2WorkflowTraining'

Järgmises näites püüame välja selgitada, milliste ressursside all puuduvad väärtused cost-center tag.

SELECT
 bill_payer_account_id, line_item_usage_account_id, DATE_FORMAT((line_item_usage_start_date), '%Y-%m-%d') AS day_line_item_usage_start_date, line_item_resource_id, line_item_usage_type, resource_tags_user_cost-center
FROM
{$table_name} 
WHERE
 resource_tags_user_cost-center IS NULL
AND line_item_product_code = 'AmazonSageMaker'

Lisateavet ja näidispäringuid leiate aadressilt AWS CUR päringuteek.

Saate sisestada ka CUR-i andmeid Amazon QuickSight, kus saate selle aruandluse või visualiseerimise eesmärgil mis tahes viisil viilutada. Juhised CUR-i andmete sisestamise kohta QuickSighti leiate artiklist Kuidas alla laadida ja visualiseerida AWS-i kulu- ja kasutusaruannet (CUR) Amazon QuickSighti.

Eelarve jälgimine siltide abil

AWS-i eelarved on suurepärane viis varajaseks hoiatamiseks, kui kulutused ootamatult suurenevad. Saate luua kohandatud eelarveid, mis hoiatavad teid, kui teie ML-i kulud ja kasutus ületavad (või prognooside kohaselt ületavad) teie kasutaja määratud läve. AWS-i eelarvetega saate jälgida oma igakuisi ML-i kogukulusid või filtreerida eelarveid, et jälgida konkreetsete kasutusmõõtmetega seotud kulusid. Näiteks saate määrata eelarve ulatuse nii, et see hõlmaks ka SageMakeri ressursikulusid, mis on märgitud kui cost-center: ML-Marketing, nagu on näidatud järgmisel ekraanipildil. Täiendavate mõõtmete ja üksikasjalike juhiste saamiseks AWS-i eelarvete seadistamise kohta vt siin.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

koos eelarve hoiatused, saate saata teatisi, kui teie eelarvelimiit on ületatud (või kohe-kohe). Neid hoiatusi saab postitada ka aadressile Amazoni lihtne teavitusteenus (Amazon SNS) teema. An AWS Lambda Seejärel käivitatakse funktsioon, mis tellib SNS-i teema, ja saab teha mis tahes programmiliselt rakendatavaid toiminguid.

AWS-i eelarved võimaldavad teil ka konfigureerida eelarvemeetmed, mis on sammud, mida saate teha, kui eelarvelävi (tegelikud või prognoositud summad) ületatakse. See kontrollitase võimaldab teil vähendada oma konto tahtmatut ülekulu. Saate oma kontol konfigureerida konkreetseid vastuseid kuludele ja kasutusele, mida rakendatakse automaatselt või töövoo kinnitusprotsessi kaudu, kui eelarve sihtmärk on ületatud. See on tõeliselt võimas lahendus tagamaks, et teie ML-kulutused on kooskõlas ettevõtte eesmärkidega. Saate valida, millist tüüpi toiminguid teha. Näiteks kui eelarvelävi on ületatud, saate teatud IAM-i kasutajad administraatoriõigustelt kirjutuskaitstuks teisaldada. Organisatsioone kasutavate klientide puhul saate rakendada toiminguid kogu organisatsiooniüksusele, teisaldades need administraatorilt kirjutuskaitstuks. Lisateavet selle kohta, kuidas eelarvetoiminguid kasutades kulusid hallata, leiate artiklist Kulude ületamise haldamine AWS-i mitme konto keskkonnas – 1. osa.

Samuti saate seadistada aruande, et jälgida oma olemasolevate eelarvete toimivust päeva-, nädala- või kuusageduse järgi ja edastada see aruanne kuni 50 e-posti aadressile. Koos AWS-i eelarvearuanded, saate ühendada kõik SageMakeriga seotud eelarved üheks aruandeks. See funktsioon võimaldab teil jälgida oma SageMakeri jalajälge ühest kohast, nagu on näidatud järgmisel ekraanipildil. Saate valida, kas soovite neid aruandeid saada igapäevase, nädala või kuu sagedusega (olen valinud Iganädalane selle näite jaoks) ja valige nädalapäev, millal soovite need kätte saada.

See funktsioon on kasulik, et hoida oma sidusrühmad kursis teie SageMakeri kulude ja kasutusega ning aidata neil näha, millal kulutused ei ole ootuspärased.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

Pärast selle konfiguratsiooni seadistamist peaksite saama järgmisega sarnase meili.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.

Järeldus

Selles postituses näitasime, kuidas saate SageMakeri jaoks kulude jaotamise sildistamise seadistada, ja jagasime näpunäiteid oma SageMakeri keskkonna ja töökoormuse sildistamise parimate tavade kohta. Seejärel arutasime erinevaid aruandlusvalikuid, nagu Cost Explorer ja CUR, et aidata teil parandada oma ML-kulude nähtavust. Lõpuks demonstreerisime AWS-i eelarveid ja eelarve kokkuvõtlikku aruannet, mis aitavad teil jälgida oma organisatsiooni ML-kulutusi.

Kulude jaotamise siltide rakendamise ja aktiveerimise kohta lisateabe saamiseks vt Kasutaja määratud kulude jaotamise sildid.


Autoritest

Sean MorganSean Morgan on AWS-i AI/ML-lahenduste arhitekt. Tal on kogemusi pooljuhtide ja akadeemilise uurimistöö valdkonnas ning ta kasutab oma kogemusi, et aidata klientidel AWS-is oma eesmärke saavutada. Vabal ajal on Sean aktiivne avatud lähtekoodiga kaastööline ja hooldaja ning on TensorFlow lisandmoodulite erihuvirühma juht.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.Brent Rabowsky keskendub AWS-i andmeteadusele ja kasutab oma teadmisi, et aidata AWS-i kliente nende endi andmeteaduse projektidega.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.Nilesh Shetty on AWS-i vanemtehniline kontohaldur, kus ta aitab ettevõtte tugiklientidel oma pilveteenuseid AWS-is sujuvamaks muuta. Ta on kirglik masinõppe vastu ning tal on konsultandi, arhitekti ja arendaja töökogemus. Väljaspool tööd kuulab ta meelsasti muusikat ja vaatab sporti.

Seadistage ettevõtte tasemel kulude jaotamine ML-keskkondade ja töökoormuste jaoks, kasutades Amazon SageMaker PlatoBlockchain Data Intelligence'is ressursside märgistamist. Vertikaalne otsing. Ai.James Wu on AWS-i vanem AI/ML-lahenduste spetsialist. aidata klientidel AI/ML lahendusi kavandada ja luua. Jamesi töö hõlmab laia valikut ML kasutusjuhtumeid, mille peamine huvi on arvutinägemine, sügav õppimine ja ML-i skaleerimine kogu ettevõttes. Enne AWS-iga liitumist oli James arhitekt, arendaja ja tehnoloogiajuht üle 10 aasta, sealhulgas 6 aastat inseneritöös ning 4 aastat turundus- ja reklaamitööstuses.

Ajatempel:

Veel alates AWS-i masinõpe