Le réglage automatique du modèle Amazon SageMaker prend désormais en charge trois nouveaux critères d'achèvement pour l'optimisation des hyperparamètres

Republié par Platon

Suiveurs: 0

Amazon Sage Maker a annoncé la prise en charge de trois nouveaux critères de réalisation pour Amazon SageMaker réglage automatique du modèle, vous offrant un ensemble supplémentaire de leviers pour contrôler les critères d'arrêt de la tâche de réglage lors de la recherche de la meilleure configuration d'hyperparamètres pour votre modèle.

Dans cet article, nous discutons de ces nouveaux critères d'achèvement, quand les utiliser et de certains des avantages qu'ils apportent.

Réglage automatique du modèle SageMaker

Réglage automatique du modèle, également appelé réglage hyperparamètre, trouve la meilleure version d'un modèle telle que mesurée par la métrique que nous choisissons. Il lance de nombreuses tâches de formation sur l'ensemble de données fourni, en utilisant l'algorithme choisi et les plages d'hyperparamètres spécifiées. Chaque tâche de formation peut être terminée tôt lorsque la métrique objective ne s'améliore pas de manière significative, ce qui est connu sous le nom d'arrêt précoce.

Jusqu'à présent, il existait des moyens limités de contrôler la tâche de réglage globale, comme la spécification du nombre maximal de tâches de formation. Cependant, la sélection de cette valeur de paramètre est au mieux heuristique. Une valeur plus élevée augmente les coûts de réglage, et une valeur plus petite peut ne pas produire la meilleure version du modèle à tout moment.

Le réglage automatique du modèle SageMaker résout ces problèmes en vous donnant plusieurs critères d'achèvement pour la tâche de réglage. Il est appliqué au niveau du réglage plutôt qu'à chaque niveau de travail de formation individuel, ce qui signifie qu'il fonctionne à une couche d'abstraction plus élevée.

Avantages du réglage des critères d'achèvement des tâches

Avec un meilleur contrôle sur le moment où la tâche de réglage s'arrêtera, vous bénéficiez d'économies de coûts en n'exécutant pas la tâche pendant de longues périodes et en étant coûteux en calculs. Cela signifie également que vous pouvez vous assurer que le travail ne s'arrête pas trop tôt et que vous obtenez un modèle de qualité suffisante qui répond à vos objectifs. Vous pouvez choisir d'arrêter la tâche de réglage lorsque les modèles ne s'améliorent plus après un ensemble d'itérations ou lorsque l'amélioration résiduelle estimée ne justifie pas les ressources et le temps de calcul.

En plus du nombre maximal existant de critères d'achèvement des emplois de formation Nombre maximal d'emplois de formation, le réglage automatique du modèle introduit la possibilité d'arrêter le réglage en fonction d'un temps de réglage maximal, de la surveillance de l'amélioration et de la détection de la convergence.

Explorons chacun de ces critères.

Temps de réglage maximal

Auparavant, vous aviez la possibilité de définir un nombre maximal de tâches de formation en tant que paramètre de limite de ressources pour contrôler le budget de réglage en termes de ressources de calcul. Cependant, cela peut entraîner des temps de formation inutilement plus longs ou plus courts que nécessaire ou souhaité.

Avec l'ajout des critères de temps de réglage maximal, vous pouvez désormais allouer votre budget de formation en termes de temps pour exécuter la tâche de réglage et terminer automatiquement la tâche après un laps de temps spécifié défini en secondes.

"ResourceLimits": { "MaxParallelTrainingJobs": 10, "MaxNumberOfTrainingJobs": 100 "MaxRuntimeInSeconds": 3600
}

Comme on l'a vu plus haut, on utilise le MaxRuntimeInSeconds pour définir le temps de syntonisation en secondes. La définition de la limite de temps de réglage vous aide à limiter la durée de la tâche de réglage ainsi que le coût prévu de l'expérience.

Le coût total avant toute remise contractuelle peut être estimé à l'aide de la formule suivante :
EstimatedComputeSeconds= MaxRuntimeInSeconds * MaxParallelTrainingJobs * InstanceCost

La durée d'exécution maximale en secondes pourrait être utilisée pour limiter le coût et la durée d'exécution. En d'autres termes, il s'agit d'un contrôle budgétaire des critères de réalisation.

Cette fonctionnalité fait partie d'un critère de contrôle des ressources et ne prend pas en compte la convergence des modèles. Comme nous le verrons plus loin dans cet article, ce critère peut être utilisé en combinaison avec d'autres critères d'arrêt pour contrôler les coûts sans sacrifier la précision.

Métrique cible souhaitée

Un autre critère introduit précédemment consiste à définir l'objectif cible à l'avance. Les critères surveillent les performances du meilleur modèle en fonction d'une métrique objective spécifique et arrêtent le réglage lorsque les modèles atteignent le seuil défini par rapport à une métrique objective spécifiée.

Avec la TargetObjectiveMetricValue critères, nous pouvons demander à SageMaker d'arrêter de régler le modèle une fois que la métrique objective du meilleur modèle a atteint la valeur spécifiée :

{ "TuningJobCompletionCriteria": { "TargetObjectiveMetricValue": 0.95 }, "HyperParameterTuningJobObjective": { "MetricName": "validation:auc", "Type": "Maximize" }, }

Dans cet exemple, SageMaker nous demande d'arrêter de régler le modèle lorsque la métrique objective du meilleur modèle a atteint 0.95.

Cette méthode est utile lorsque vous souhaitez que votre modèle atteigne un objectif spécifique, tel qu'un certain niveau d'exactitude, de précision, de rappel, de score F1, d'AUC, de perte de log, etc.

Un cas d'utilisation typique pour ce critère serait pour un utilisateur qui est déjà familiarisé avec les performances du modèle à des seuils donnés. Un utilisateur dans la phase d'exploration peut d'abord ajuster le modèle avec un petit sous-ensemble d'un ensemble de données plus grand pour identifier un seuil de métrique d'évaluation satisfaisant à cibler lors de la formation avec l'ensemble de données complet.

Suivi de l'amélioration

Ce critère surveille la convergence des modèles après chaque itération et arrête le réglage si les modèles ne s'améliorent pas après un nombre défini de tâches d'entraînement. Voir la configuration suivante :

"TuningJobCompletionCriteria": { "BestObjectiveNotImproving":{ "MaxNumberOfTrainingJobsNotImproving":10 }, }

Dans ce cas, nous fixons le MaxNumberOfTrainingJobsNotImproving à 10, ce qui signifie que si la métrique objective cesse de s'améliorer après 10 tâches d'entraînement, le réglage sera arrêté et le meilleur modèle et la meilleure métrique seront signalés.

La surveillance de l'amélioration doit être utilisée pour ajuster un compromis entre la qualité du modèle et la durée globale du flux de travail d'une manière qui est probablement transférable entre différents problèmes d'optimisation.

Détection de convergence

La détection de convergence est un critère d'achèvement qui permet au réglage automatique du modèle de décider quand arrêter le réglage. Généralement, le réglage automatique du modèle s'arrête lorsqu'il estime qu'aucune amélioration significative ne peut être obtenue. Voir la configuration suivante :

"TuningJobCompletionCriteria": { "ConvergenceDetected":{ "CompleteOnConvergence":"Enabled" },
}

Les critères sont mieux adaptés lorsque vous ne savez pas initialement quels paramètres d'arrêt sélectionner.

C'est également utile si vous ne savez pas quelle métrique objective cible est raisonnable pour une bonne prédiction compte tenu du problème et de l'ensemble de données en main, et si vous préférez que le travail de réglage soit terminé lorsqu'il ne s'améliore plus.

Expérimenter une comparaison des critères d'achèvement

Dans cette expérience, étant donné une tâche de régression, nous exécutons 3 expériences de réglage pour trouver le modèle optimal dans un espace de recherche de 2 hyperparamètres ayant 200 configurations d'hyperparamètres au total en utilisant le ensemble de données de marketing direct.

Toutes choses étant égales par ailleurs, le premier modèle a été réglé avec le BestObjectiveNotImproving critères d'achèvement, le deuxième modèle a été réglé avec les CompleteOnConvergence et le troisième modèle a été réglé sans aucun critère d'achèvement défini.

Lors de la description de chaque tâche, nous pouvons observer que le réglage de la BestObjectiveNotImproving les critères ont conduit à la ressource et au temps les plus optimaux par rapport à la métrique objective avec beaucoup moins de travaux exécutés.

La CompleteOnConvergence Les critères ont également été en mesure d'arrêter le réglage à mi-chemin de l'expérience, ce qui a entraîné moins de tâches de formation et un temps de formation plus court par rapport à l'absence de définition de critères.

Bien que le fait de ne pas fixer de critères d'achèvement ait entraîné une expérience coûteuse, la définition des MaxRuntimeInSeconds dans le cadre de la limite des ressources serait un moyen de minimiser les coûts.

Les résultats ci-dessus montrent que lors de la définition d'un critère d'achèvement, Amazon SageMaker est capable d'arrêter intelligemment le processus de réglage lorsqu'il détecte que le modèle est moins susceptible de s'améliorer au-delà du résultat actuel.

Notez que les critères d'achèvement pris en charge dans le réglage automatique du modèle SageMaker ne s'excluent pas mutuellement et peuvent être utilisés simultanément lors du réglage d'un modèle.

Lorsque plusieurs critères d'achèvement sont définis, la tâche de réglage se termine lorsque l'un des critères est rempli.

Par exemple, une combinaison d'un critère de limite de ressources comme le temps de réglage maximal avec un critère de convergence, comme la surveillance de l'amélioration ou la détection de la convergence, peut produire un contrôle optimal des coûts et une métrique objective optimale.

Conclusion

Dans cet article, nous avons expliqué comment vous pouvez désormais arrêter intelligemment votre travail de réglage en sélectionnant un ensemble de critères d'achèvement nouvellement introduits dans SageMaker, tels que le temps de réglage maximal, la surveillance de l'amélioration ou la détection de convergence.

Nous avons démontré avec une expérience qu'un arrêt intelligent basé sur l'observation de l'amélioration à travers l'itération peut conduire à une gestion du budget et du temps considérablement optimisée par rapport à la non-définition d'un critère d'achèvement.

Nous avons également montré que ces critères ne sont pas mutuellement exclusifs et peuvent être utilisés simultanément lors du réglage d'un modèle, pour tirer parti à la fois du contrôle budgétaire et de la convergence optimale.

Pour plus de détails sur la configuration et l'exécution du réglage automatique du modèle, reportez-vous à Spécification des paramètres de la tâche de réglage des hyperparamètres.

À propos des auteurs

Doug Mbaya est un architecte de solution partenaire principal spécialisé dans les données et l'analyse. Doug travaille en étroite collaboration avec les partenaires AWS, les aidant à intégrer des solutions de données et d'analyse dans le cloud.

Amazon SageMaker Automatic Model Tuning prend désormais en charge trois nouveaux critères d'achèvement pour l'optimisation des hyperparamètres PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Chaitra Mathur est architecte principal de solutions chez AWS. Elle guide les clients et les partenaires dans la création de solutions hautement évolutives, fiables, sécurisées et rentables sur AWS. Elle est passionnée par l'apprentissage automatique et aide les clients à traduire leurs besoins en ML en solutions à l'aide des services AWS AI/ML. Elle détient 5 certifications dont la certification ML Specialty. Dans ses temps libres, elle aime lire, faire du yoga et passer du temps avec ses filles.

image-iaroslav Iaroslav Chtcherbatyi est ingénieur en apprentissage machine chez AWS. Il travaille principalement sur les améliorations de la plateforme Amazon SageMaker et aide les clients à utiliser au mieux ses fonctionnalités. Dans ses temps libres, il aime aller à la gym, faire des sports de plein air comme le patin à glace ou la randonnée, et se tenir au courant des nouvelles recherches sur l'IA.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-automatic-model-tuning-now-supports-three-new-completion-criteria-for-hyperparameter-optimization/

Horodatage: 7 février 2023

Annonce de la simultanéité provisionnée pour Amazon SageMaker Serverless Inference | Services Web Amazon

Cluster source:

Apprentissage automatique AWS

Nœud source: 1835572

Horodatage: 9 mai 2023

Amazon SageMaker Automatic Model Tuning prend désormais en charge trois nouveaux critères d'achèvement pour l'optimisation des hyperparamètres

Republié par Platon

Réglage automatique du modèle SageMaker

Avantages du réglage des critères d'achèvement des tâches

Temps de réglage maximal

Métrique cible souhaitée

Suivi de l'amélioration

Détection de convergence

Expérimenter une comparaison des critères d'achèvement

Conclusion

À propos des auteurs

Plus de Apprentissage automatique AWS

AWS DeepRacer permet aux constructeurs de tous niveaux de se perfectionner et de se lancer dans l'apprentissage automatique | Services Web Amazon

Traitement parallèle des données avec RStudio sur Amazon SageMaker

Implémentez la recherche unifiée de texte et d'image avec un modèle CLIP à l'aide d'Amazon SageMaker et d'Amazon OpenSearch Service

Optimisez les performances de diffusion stable et réduisez les coûts d'inférence avec AWS Inferentia2 | Services Web Amazon

Comment The Chefz sert le repas parfait avec Amazon Personalize

Créez de l'audio pour du contenu dans plusieurs langues avec le même personnage vocal TTS dans Amazon Polly

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte