Amazon SageMaker 自动模型调整现在支持超参数优化的三个新完成标准

由柏拉图重新发布

关注： 0

亚马逊SageMaker 具有公布支持 Amazon SageMaker 的三个新完成标准自动模型调整，为您提供一组额外的控制杆，以在为您的模型找到最佳超参数配置时控制调整作业的停止标准。

在这篇文章中，我们将讨论这些新的完成标准、何时使用它们以及它们带来的一些好处。

SageMaker自动模型调整

自动模型调整，也称为 超参数调整, 找到我们选择的度量标准衡量的模型的最佳版本。它使用选择的算法和指定的超参数范围在提供的数据集上启动许多训练作业。当目标指标没有显着改善时，可以提前完成每个训练作业，这称为提前停止。

到目前为止，控制整体调优作业的方法有限，例如指定训练作业的最大数量。然而，此参数值的选择充其量是启发式的。较大的值会增加调整成本，而较小的值可能不会始终产生模型的最佳版本。

SageMaker 自动模型调整通过为调整作业提供多个完成条件来解决这些挑战。它应用于调整级别而不是每个单独的训练作业级别，这意味着它在更高的抽象层上运行。

调整作业完成标准的好处

通过更好地控制调整作业何时停止，您可以通过不让作业长时间运行和计算成本高来获得成本节约的好处。这也意味着您可以确保工作不会过早停止，并且您可以获得满足您目标的质量足够好的模型。当模型在一组迭代后不再改进时，或者当估计的剩余改进不能证明计算资源和时间的合理性时，您可以选择停止调整作业。

除了现有的最大培训作业完成标准最大培训职位数，自动模型调整引入了基于最大调整时间、改进监控和收敛检测停止调整的选项。

让我们探讨这些标准中的每一个。

最大调谐时间

以前，您可以选择将最大训练作业数定义为资源限制设置，以控制计算资源方面的调整预算。然而，这可能导致比需要或期望的不必要的更长或更短的训练时间。

通过添加最大调整时间标准，您现在可以根据运行调整作业的时间分配训练预算，并在以秒为单位定义的指定时间后自动终止作业。

"ResourceLimits": { "MaxParallelTrainingJobs": 10, "MaxNumberOfTrainingJobs": 100 "MaxRuntimeInSeconds": 3600
}

如上所示，我们使用 MaxRuntimeInSeconds 以秒为单位定义调整时间。设置调整时间限制有助于您限制调整作业的持续时间以及实验的预计成本。

可以使用以下公式估算任何合同折扣前的总成本：
EstimatedComputeSeconds= MaxRuntimeInSeconds * MaxParallelTrainingJobs * InstanceCost

以秒为单位的最大运行时间可用于限制成本和运行时间。换句话说，它是一个预算控制完成标准。

此功能是资源控制标准的一部分，并未考虑模型的收敛性。正如我们在本文后面看到的那样，该标准可以与其他停止标准结合使用，以在不牺牲准确性的情况下实现成本控制。

期望的目标指标

另一个先前引入的标准是预先定义目标目标。该标准根据特定的目标指标监控最佳模型的性能，并在模型达到与指定目标指标相关的定义阈值时停止调整。

随着 TargetObjectiveMetricValue 标准，我们可以指示 SageMaker 在最佳模型的客观指标达到指定值后停止调整模型：

{ "TuningJobCompletionCriteria": { "TargetObjectiveMetricValue": 0.95 }, "HyperParameterTuningJobObjective": { "MetricName": "validation:auc", "Type": "Maximize" }, }

在此示例中，我们指示 SageMaker 在最佳模型的客观指标达到 0.95 时停止调整模型。

当您有一个希望模型达到的特定目标时（例如特定级别的准确度、精确度、召回率、F1 分数、AUC、对数损失等），此方法很有用。

此标准的典型用例是针对已经熟悉模型在给定阈值下的性能的用户。处于探索阶段的用户可能首先使用较大数据集的一小部分来调整模型，以确定在使用完整数据集进行训练时要确定的令人满意的评估指标阈值。

改进监控

此标准会在每次迭代后监控模型的收敛性，如果在定义的训练作业数量后模型没有改善，则停止调整。请参阅以下配置：

"TuningJobCompletionCriteria": { "BestObjectiveNotImproving":{ "MaxNumberOfTrainingJobsNotImproving":10 }, }

在这种情况下，我们设置 MaxNumberOfTrainingJobsNotImproving 到 10，这意味着如果客观指标在 10 个训练作业后停止改善，则调整将停止并报告最佳模型和指标。

改进监控应该用于调整模型质量和整个工作流程持续时间之间的权衡，其方式可能在不同的优化问题之间转移。

收敛检测

收敛检测是一个完成标准，它让自动模型调整决定何时停止调整。通常，自动模型调整会在估计无法实现显着改进时停止调整。请参阅以下配置：

"TuningJobCompletionCriteria": { "ConvergenceDetected":{ "CompleteOnConvergence":"Enabled" },
}

当您最初不知道要选择什么停止设置时，该标准最适合。

如果您不知道在给定问题和手头数据集的情况下什么目标客观指标对于进行良好预测是合理的，并且宁愿在不再改进时完成调优工作，它也很有用。

尝试比较完成标准

在这个实验中，给定一个回归任务，我们运行 3 个调整实验，以在总共具有 2 个超参数配置的 200 个超参数的搜索空间中找到最优模型，使用直销数据集.

在其他条件相同的情况下，第一个模型用 BestObjectiveNotImproving 完成标准，第二个模型用 CompleteOnConvergence 第三个模型在没有定义完成标准的情况下进行了调整。

在描述每项工作时，我们可以观察到设置 BestObjectiveNotImproving 标准导致了相对于目标指标的最佳资源和时间，运行的作业明显减少。

CompleteOnConvergence 与不设置标准相比，标准还能够在实验中途停止调整，从而减少培训工作并缩短培训时间。

Amazon SageMaker 自动模型调整现在支持超参数优化 PlatoBlockchain 数据智能的三个新完成标准。垂直搜索。人工智能。

虽然没有设置完成标准会导致代价高昂的实验，但定义 MaxRuntimeInSeconds 作为资源限制的一部分将是最小化成本的一种方式。

上面的结果表明，在定义完成条件时，Amazon SageMaker 能够在检测到模型不太可能改进超过当前结果时智能地停止调整过程。

请注意，SageMaker 自动模型调整中支持的完成条件并不相互排斥，可以在调整模型时同时使用。

当定义了多个完成条件时，只要满足任何一个条件，调整作业就会完成。

例如，资源限制标准（如最大调整时间）与收敛标准（如改进监控或收敛检测）的组合可以产生最佳成本控制和最佳目标指标。

结论

在本文中，我们讨论了您现在如何通过选择 SageMaker 中新引入的一组完成标准（例如最长调整时间、改进监控或收敛检测）来智能地停止调整作业。

我们通过实验证明，与不定义完成标准相比，基于跨迭代的改进观察的智能停止可能会导致显着优化的预算和时间管理。

我们还表明，这些标准并不相互排斥，可以在调整模型时同时使用，以利用预算控制和最优收敛。

有关如何配置和运行自动模型调整的更多详细信息，请参阅指定超参数调整作业设置.

作者简介

道格·姆巴亚 是一名高级合作伙伴解决方案架构师，专注于数据和分析。 Doug 与 AWS 合作伙伴密切合作，帮助他们在云中集成数据和分析解决方案。

Amazon SageMaker 自动模型调整现在支持超参数优化 PlatoBlockchain 数据智能的三个新完成标准。垂直搜索。人工智能。 柴特拉·马图尔 是 AWS 的首席解决方案架构师。她指导客户和合作伙伴在 AWS 上构建高度可扩展、可靠、安全且经济高效的解决方案。她对机器学习充满热情，并帮助客户使用 AWS AI/ML 服务将他们的 ML 需求转化为解决方案。她拥有 5 项认证，包括 ML 专业认证。在业余时间，她喜欢阅读、瑜伽和与女儿们共度时光。