Täna Amazon SageMaker teatas SageMakeri koolituseksemplari varude toetamisest Amazon SageMakeri automaatne mudeli häälestamine (AMT) mis võimaldavad kasutajatel määrata alternatiivseid arvutusressursside konfiguratsioone.
SageMakeri automaatne mudeli häälestamine leiab mudeli parima versiooni, käivitades teie andmestikul palju koolitustöid, kasutades vahemikud hüperparameetritest, mille oma algoritmi jaoks määrate. Seejärel valib see hüperparameetrite väärtused, mille tulemuseks on mudel, mis toimib kõige paremini, mõõdetuna a-ga meetriline et valite.
Varem said kasutajad määrata ainult ühe eksemplari konfiguratsiooni. See võib põhjustada probleeme, kui määratud eksemplari tüüp pole suure kasutuse tõttu saadaval. Varem ebaõnnestusid teie koolitustööd InsufficientCapacityError (ICE) tõttu. AMT kasutas paljudel juhtudel nende tõrgete vältimiseks nutikaid korduskatsetusi, kuid jäi püsivalt väikese mahutavuse tingimustes jõuetuks.
See uus funktsioon tähendab, et saate määrata eelistuste järjekorras eksemplari konfiguratsioonide loendi, nii et teie AMT töö naaseb vähese võimsuse korral automaatselt loendi järgmisele eksemplarile.
Järgmistes osades käsitleme neid kõrgetasemelisi samme ICE ületamiseks:
- Määratlege HyperParameter Tuning Job Configuration
- Määratlege koolitustöö parameetrid
- Looge hüperparameetrite häälestustöö
- Kirjeldage koolitustööd
Määratlege HyperParameter Tuning Job Configuration
. HyperParameterTuningJobConfig objekt kirjeldab häälestustööd, sealhulgas otsingustrateegiat, koolitustööde hindamiseks kasutatavat eesmärgimõõdikut, otsitavate parameetrite vahemikke ja häälestustöö ressursipiiranguid. Tänase funktsiooni väljalaskega seda aspekti ei muudetud. Sellegipoolest läheme selle üle, et tuua täielik näide.
. ResourceLimits
objekt määrab selle häälestustöö maksimaalse koolitustööde ja paralleelsete koolitustööde arvu. Selles näites teeme a juhuslik otsing strateegia ja maksimaalselt 10 töökoha määramine (MaxNumberOfTrainingJobs
) ja 5 samaaegset tööd (MaxParallelTrainingJobs
) korraga.
. ParameterRanges
objekt määrab hüperparameetrite vahemikud, mida see häälestustöö otsib. Määrame otsitava hüperparameetri nime, samuti minimaalse ja maksimaalse väärtuse. Selles näites määratleme parameetrite Continuous ja Integer vahemiku minimaalsed ja maksimaalsed väärtused ning hüperparameetri nime (“eta”, “max_depth”).
AmtTuningJobConfig={
"Strategy": "Random",
"ResourceLimits": {
"MaxNumberOfTrainingJobs": 10,
"MaxParallelTrainingJobs": 5
},
"HyperParameterTuningJobObjective": {
"MetricName": "validation:rmse",
"Type": "Minimize"
},
"ParameterRanges": {
"CategoricalParameterRanges": [],
"ContinuousParameterRanges": [
{
"MaxValue": "1",
"MinValue": "0",
"Name": "eta"
}
],
"IntegerParameterRanges": [
{
"MaxValue": "6",
"MinValue": "2",
"Name": "max_depth"
}
]
}
}
Määratlege koolitustöö parameetrid
Koolitustöö määratluses määratleme koolitustöö käitamiseks vajaliku sisendi, kasutades meie määratud algoritmi. Pärast koolituse lõppu salvestab SageMaker saadud mudeli artefaktid an Amazon Simple Storage Service (Amazon S3) asukoht, mille määrate.
Varem määrasime eksemplari tüübi, arvu ja mahu suuruse all ResourceConfig
parameeter. Kui selle parameetri all olev eksemplar polnud saadaval, ilmus ebapiisava võimsuse tõrge (ICE).
Selle vältimiseks on meil nüüd olemas HyperParameterTuningResourceConfig
parameetri all TrainingJobDefinition
, kus määrame loendi eksemplaridest, millele tagasi pöörduda. Nende eksemplaride vorming on sama, mis failis ResourceConfig
. Töö läbib saadaoleva eksemplari konfiguratsiooni leidmiseks loendi ülalt alla. Kui eksemplar pole saadaval, valitakse ebapiisava võimsuse vea (ICE) asemel loendist järgmine eksemplar, ületades sellega ICE.
TrainingJobDefinition={
"HyperParameterTuningResourceConfig": {
"InstanceConfigs": [
{
"InstanceType": "ml.m4.xlarge",
"InstanceCount": 1,
"VolumeSizeInGB": 5
},
{
"InstanceType": "ml.m5.4xlarge",
"InstanceCount": 1,
"VolumeSizeInGB": 5
}
]
},
"AlgorithmSpecification": {
"TrainingImage": "433757028032.dkr.ecr.us-west-2.amazonaws.com/xgboost:latest",
"TrainingInputMode": "File"
},
"InputDataConfig": [
{
"ChannelName": "train",
"CompressionType": "None",
"ContentType": "json",
"DataSource": {
"S3DataSource": {
"S3DataDistributionType": "FullyReplicated",
"S3DataType": "S3Prefix",
"S3Uri": "s3://<bucket>/test/"
}
},
"RecordWrapperType": "None"
}
],
"OutputDataConfig": {
"S3OutputPath": "s3://<bucket>/output/"
},
"RoleArn": "arn:aws:iam::340308762637:role/service-role/AmazonSageMaker-ExecutionRole-20201117T142856",
"StoppingCondition": {
"MaxRuntimeInSeconds": 259200
},
"StaticHyperParameters": {
"training_script_loc": "q2bn-sagemaker-test_6"
},
}
Käivitage hüperparameetrite häälestustöö
Selles etapis loome ja käitame hüperparameetrite häälestustöö ülal määratletud hüperparameetrite häälestusressursi konfiguratsiooniga.
Initsialiseerime SageMakeri kliendi ja loome töö, määrates häälestamise konfiguratsiooni, koolitustöö määratluse ja töö nime.
import boto3
sm = boto3.client('sagemaker')
sm.create_hyper_parameter_tuning_job(
HyperParameterTuningJobName="my-job-name",
HyperParameterTuningJobConfig=AmtTuningJobConfig,
TrainingJobDefinition=TrainingJobDefinition)
Kirjeldage koolitustöid
Järgmine funktsioon loetleb kõik katse ajal kasutatud eksemplaritüübid ja seda saab kasutada kontrollimaks, kas SageMakeri koolituseksemplar on ressursside eraldamise ajal automaatselt loendis järgmise eksemplari juurde langenud.
Järeldus
Selles postituses näitasime, kuidas saate nüüd määratleda juhtumite kogumi, millele teie AMT eksperiment võib tagasi langeda, kui InsufficientCapacityError
. Nägime, kuidas määratleda hüperparameetrite häälestustöö konfiguratsioon, samuti määrata maksimaalne koolitustööde arv ja maksimaalne paralleelsete tööde arv. Lõpuks nägime, kuidas ületada InsufficientCapacityError
kasutades HyperParameterTuningResourceConfig
parameeter, mille saab määrata koolitustöö määratluse all.
AMT kohta lisateabe saamiseks külastage Amazon SageMakeri automaatne mudeli häälestamine.
Autoritest
Doug Mbaya on vanempartnerlahenduste arhitekt, kes keskendub andmetele ja analüüsile. Doug teeb tihedat koostööd AWS-i partneritega, aidates neil integreerida andmeid ja analüüsilahendusi pilve.
Kruthi Jayasimha Rao on Scale-PSA meeskonna partnerlahenduste arhitekt. Kruthi viib partnerite jaoks läbi tehnilisi valideerimisi, mis võimaldavad neil partneriteel edasi liikuda.
Bernard Jollans on Amazon SageMakeri automaatse mudeli häälestamise tarkvaraarenduse insener.
- AI
- ai kunst
- ai kunsti generaator
- on robot
- Amazoni masinõpe
- Amazon SageMaker
- tehisintellekti
- tehisintellekti sertifikaat
- tehisintellekt panganduses
- tehisintellekti robot
- tehisintellekti robotid
- tehisintellekti tarkvara
- AWS-i masinõpe
- blockchain
- plokiahela konverents ai
- coingenius
- vestluslik tehisintellekt
- krüptokonverents ai
- dall's
- sügav õpe
- google ai
- masinõpe
- Platon
- plato ai
- Platoni andmete intelligentsus
- Platoni mäng
- PlatoData
- platogaming
- skaala ai
- süntaks
- sephyrnet