Amazon SageMaker Automatic Model Tuning Now Supports Three New Completion Criteria For Hyperparameter Optimization

بازنشر افلاطون

دنبال: 0

آمازون SageMaker است اعلام کرد پشتیبانی از سه معیار تکمیل جدید برای Amazon SageMaker تنظیم خودکار مدل، مجموعه ای از اهرم ها را برای کنترل معیارهای توقف کار تنظیم هنگام یافتن بهترین پیکربندی هایپرپارامتر برای مدل خود در اختیار شما قرار می دهد.

در این پست، این معیارهای تکمیل جدید، زمان استفاده از آنها و برخی از مزایای آنها را مورد بحث قرار می دهیم.

تنظیم خودکار مدل SageMaker

تنظیم خودکار مدل نیز نامیده می شود تنظیم هایپرپارامتر، بهترین نسخه یک مدل را با معیاری که انتخاب می کنیم اندازه گیری می کند. با استفاده از الگوریتم انتخاب شده و محدوده هایپرپارامترهای مشخص شده، بسیاری از کارهای آموزشی را روی مجموعه داده ارائه شده می چرخاند. هر کار آموزشی می تواند زودتر تکمیل شود، زمانی که معیار هدف به طور قابل توجهی بهبود نمی یابد، که به عنوان توقف زودهنگام شناخته می شود.

تا به حال، راه های محدودی برای کنترل کار تنظیم کلی وجود داشت، مانند تعیین حداکثر تعداد مشاغل آموزشی. با این حال، انتخاب این مقدار پارامتر در بهترین حالت اکتشافی است. یک مقدار بزرگتر هزینه های تنظیم را افزایش می دهد و یک مقدار کوچکتر ممکن است بهترین نسخه مدل را همیشه ارائه ندهد.

تنظیم خودکار مدل SageMaker با ارائه معیارهای تکمیل چندگانه برای کار تنظیم، این چالش ها را حل می کند. این در سطح تنظیم به جای هر سطح شغل آموزشی فردی اعمال می شود، به این معنی که در یک لایه انتزاعی بالاتر عمل می کند.

مزایای تنظیم معیارهای تکمیل کار

با کنترل بهتر بر روی زمان توقف کار تنظیم، با عدم اجرای کار برای مدت طولانی و گران بودن محاسباتی از مزایای صرفه جویی در هزینه بهره مند می شوید. همچنین به این معنی است که می توانید اطمینان حاصل کنید که کار خیلی زود متوقف نمی شود و یک مدل با کیفیت به اندازه کافی خوب به دست می آورید که اهداف شما را برآورده می کند. هنگامی که مدل‌ها پس از مجموعه‌ای از تکرارها دیگر بهبود نمی‌یابند یا زمانی که بهبود باقیمانده تخمینی منابع و زمان محاسبه را توجیه نمی‌کند، می‌توانید کار تنظیم را متوقف کنید.

علاوه بر حداکثر تعداد معیارهای تکمیل شغل آموزشی موجود MaxNumberOfTraining Jobs، تنظیم خودکار مدل گزینه توقف تنظیم بر اساس حداکثر زمان تنظیم، نظارت بر بهبود و تشخیص همگرایی را معرفی می کند.

بیایید هر یک از این معیارها را بررسی کنیم.

حداکثر زمان تنظیم

قبلاً، شما این گزینه را داشتید که حداکثر تعداد مشاغل آموزشی را به عنوان تنظیم محدودیت منابع برای کنترل بودجه تنظیم از نظر منابع محاسباتی تعریف کنید. با این حال، این می‌تواند به زمان‌های غیرضروری طولانی‌تر یا کوتاه‌تر از حد مورد نیاز یا مطلوب منجر شود.

با اضافه شدن حداکثر معیارهای زمان تنظیم، اکنون می توانید بودجه آموزشی خود را بر حسب مدت زمان برای اجرای کار تنظیم اختصاص دهید و پس از مدت زمان مشخصی که در ثانیه تعریف شده است، به طور خودکار کار را خاتمه دهید.

"ResourceLimits": { "MaxParallelTrainingJobs": 10, "MaxNumberOfTrainingJobs": 100 "MaxRuntimeInSeconds": 3600
}

همانطور که در بالا مشاهده شد، ما از MaxRuntimeInSeconds برای تعریف زمان تنظیم بر حسب ثانیه. تنظیم محدودیت زمانی تنظیم به شما کمک می کند مدت زمان کار تنظیم و همچنین هزینه پیش بینی شده آزمایش را محدود کنید.

کل هزینه قبل از هر تخفیف قراردادی را می توان با فرمول زیر تخمین زد:
EstimatedComputeSeconds= MaxRuntimeInSeconds * MaxParallelTrainingJobs * InstanceCost

حداکثر زمان اجرا بر حسب ثانیه می تواند برای محدود کردن هزینه و زمان اجرا استفاده شود. به عبارت دیگر، این یک معیار تکمیل کنترل بودجه است.

این ویژگی بخشی از معیارهای کنترل منابع است و همگرایی مدل ها را در نظر نمی گیرد. همانطور که در ادامه این پست می بینیم، این معیار می تواند در ترکیب با سایر معیارهای توقف برای دستیابی به کنترل هزینه بدون کاهش دقت استفاده شود.

متریک هدف مورد نظر

یکی دیگر از معیارهای معرفی شده قبلی، تعریف هدف هدف هدف از قبل است. این معیار عملکرد بهترین مدل را بر اساس یک متریک هدف خاص نظارت می کند و زمانی که مدل ها به آستانه تعریف شده در رابطه با متریک هدف مشخص می رسند، تنظیم را متوقف می کند.

با TargetObjectiveMetricValue معیارها، می‌توانیم به SageMaker دستور دهیم پس از اینکه معیار هدف بهترین مدل به مقدار مشخص شده رسید، تنظیم مدل را متوقف کند:

{ "TuningJobCompletionCriteria": { "TargetObjectiveMetricValue": 0.95 }, "HyperParameterTuningJobObjective": { "MetricName": "validation:auc", "Type": "Maximize" }, }

در این مثال، به SageMaker دستور داده شده که وقتی معیار هدف بهترین مدل به 0.95 رسید، تنظیم مدل را متوقف کند.

این روش زمانی مفید است که هدف خاصی دارید که می‌خواهید مدل شما به آن برسد، مانند سطح مشخصی از دقت، دقت، یادآوری، امتیاز F1، AUC، log-loss و غیره.

یک مورد استفاده معمولی برای این معیار برای کاربری است که از قبل با عملکرد مدل در آستانه های داده شده آشنا است. کاربر در مرحله اکتشاف ممکن است ابتدا مدل را با یک زیرمجموعه کوچک از یک مجموعه داده بزرگتر تنظیم کند تا آستانه متریک ارزیابی رضایت بخشی را برای هدف در هنگام آموزش با مجموعه داده کامل شناسایی کند.

نظارت بر بهبود

این معیار بر همگرایی مدل‌ها پس از هر تکرار نظارت می‌کند و اگر مدل‌ها پس از تعداد مشخصی از کارهای آموزشی بهبود نیافتند، تنظیم را متوقف می‌کند. پیکربندی زیر را ببینید:

"TuningJobCompletionCriteria": { "BestObjectiveNotImproving":{ "MaxNumberOfTrainingJobsNotImproving":10 }, }

در این مورد ما تنظیم می کنیم MaxNumberOfTrainingJobsNotImproving به 10، به این معنی که اگر متریک هدف بعد از 10 کار آموزشی از بهبودی متوقف شود، تنظیم متوقف می شود و بهترین مدل و متریک گزارش می شود.

نظارت بر بهبود باید برای تنظیم معاوضه بین کیفیت مدل و مدت زمان کلی گردش کار به نحوی که احتمالاً بین مسائل مختلف بهینه‌سازی قابل انتقال باشد، استفاده شود.

تشخیص همگرایی

تشخیص همگرایی یک معیار تکمیل است که به تنظیم خودکار مدل اجازه می دهد تصمیم بگیرد که چه زمانی تنظیم را متوقف کند. به طور کلی، تنظیم خودکار مدل زمانی که تخمین می زند که هیچ بهبود قابل توجهی حاصل نمی شود، تنظیم را متوقف می کند. پیکربندی زیر را ببینید:

"TuningJobCompletionCriteria": { "ConvergenceDetected":{ "CompleteOnConvergence":"Enabled" },
}

این معیار زمانی مناسب است که در ابتدا نمی دانید چه تنظیمات توقفی را انتخاب کنید.

همچنین اگر ندانید با توجه به مشکل و مجموعه داده در دست، کدام متریک هدف برای یک پیش‌بینی خوب معقول است، مفید است و ترجیح می‌دهید زمانی که دیگر بهبود نمی‌یابد، کار تنظیم کامل شود.

با مقایسه معیارهای تکمیل آزمایش کنید

در این آزمایش، با توجه به یک کار رگرسیون، ما 3 آزمایش تنظیم را برای یافتن مدل بهینه در فضای جستجوی 2 ابرپارامتر با 200 پیکربندی هایپرپارامتر در مجموع با استفاده از مجموعه داده بازاریابی مستقیم.

در حالی که همه چیز برابر است، اولین مدل با آن تنظیم شد BestObjectiveNotImproving معیارهای تکمیل، مدل دوم با تنظیم شد CompleteOnConvergence و مدل سوم بدون هیچ معیار تکمیلی تنظیم شد.

هنگام توصیف هر کار، می‌توانیم آن تنظیم را مشاهده کنیم BestObjectiveNotImproving معیارها منجر به بهینه ترین منبع و زمان نسبت به متریک هدف با تعداد مشاغل کمتری شده است.

La CompleteOnConvergence معیارها همچنین توانستند تنظیم را در نیمه آزمایش متوقف کنند که منجر به مشاغل آموزشی کمتر و زمان آموزشی کوتاه‌تر در مقایسه با عدم تعیین معیار شد.

Amazon SageMaker Automatic Model Tuning now supports three new completion criteria for hyperparameter optimization PlatoBlockchain Data Intelligence. Vertical Search. Ai.

در حالی که تعیین نکردن معیارهای تکمیل منجر به یک آزمایش پرهزینه شد، تعریف آن MaxRuntimeInSeconds به عنوان بخشی از محدودیت منابع یکی از راه های به حداقل رساندن هزینه خواهد بود.

نتایج بالا نشان می‌دهد که هنگام تعریف معیار تکمیل، آمازون SageMaker می‌تواند به‌طور هوشمند فرآیند تنظیم را متوقف کند، وقتی تشخیص داد که احتمال کمتری بهبود مدل فراتر از نتیجه فعلی وجود دارد.

توجه داشته باشید که معیارهای تکمیل پشتیبانی شده در تنظیم خودکار مدل SageMaker متقابلاً منحصر به فرد نیستند و می‌توانند به طور همزمان هنگام تنظیم یک مدل استفاده شوند.

هنگامی که بیش از یک معیار تکمیل تعریف شده است، کار تنظیم زمانی که هر یک از معیارها برآورده شود، تکمیل می شود.

به عنوان مثال، ترکیبی از معیارهای حد منبع مانند حداکثر زمان تنظیم با معیارهای همگرایی، مانند نظارت بهبود یا تشخیص همگرایی، ممکن است یک کنترل هزینه بهینه و یک معیار هدف بهینه ایجاد کند.

نتیجه

در این پست، در مورد اینکه چگونه می‌توانید با انتخاب مجموعه‌ای از معیارهای تکمیلی که جدیداً در SageMaker معرفی شده‌اند، مانند حداکثر زمان تنظیم، نظارت بر بهبود، یا تشخیص هم‌گرایی، به‌طور هوشمندانه کار تنظیم خود را متوقف کنید، بحث کردیم.

ما با آزمایشی نشان دادیم که توقف هوشمند مبتنی بر مشاهده بهبود در سراسر تکرار ممکن است منجر به مدیریت بودجه و زمان قابل توجهی در مقایسه با عدم تعریف معیار تکمیل شود.

ما همچنین نشان دادیم که این معیارها متقابلاً منحصر به فرد نیستند و می‌توانند به طور همزمان در هنگام تنظیم یک مدل برای استفاده از کنترل بودجه و همگرایی بهینه استفاده شوند.

برای جزئیات بیشتر در مورد نحوه پیکربندی و اجرای تنظیم خودکار مدل، مراجعه کنید تنظیمات کار تنظیم Hyperparameter را مشخص کنید.

درباره نویسنده

داگ امبایا یک معمار راه حل شریک ارشد با تمرکز بر داده ها و تجزیه و تحلیل است. داگ همکاری نزدیکی با شرکای AWS دارد و به آنها کمک می کند تا داده ها و راه حل های تجزیه و تحلیل را در فضای ابری یکپارچه کنند.

Amazon SageMaker Automatic Model Tuning now supports three new completion criteria for hyperparameter optimization PlatoBlockchain Data Intelligence. Vertical Search. Ai. چایترا ماتور یک معمار اصلی راه حل در AWS است. او مشتریان و شرکا را در ساخت راه حل های بسیار مقیاس پذیر، قابل اعتماد، ایمن و مقرون به صرفه در AWS راهنمایی می کند. او علاقه زیادی به یادگیری ماشین دارد و به مشتریان کمک می کند تا نیازهای ML خود را با استفاده از خدمات AWS AI/ML به راه حل هایی تبدیل کنند. او دارای 5 گواهینامه از جمله گواهینامه تخصصی ML است. او در اوقات فراغت خود از مطالعه، یوگا و گذراندن وقت با دخترانش لذت می برد.

یاروسلاو-تصویر یاروسلاو شچرباتی مهندس یادگیری ماشین در AWS است. او عمدتاً روی بهبود پلتفرم Amazon SageMaker و کمک به مشتریان در استفاده بهینه از ویژگی‌های آن کار می‌کند. او دوست دارد در اوقات فراغت خود به باشگاه برود، ورزش‌هایی در فضای باز مانند اسکیت روی یخ یا پیاده‌روی انجام دهد و تحقیقات جدید هوش مصنوعی را دنبال کند.

محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی به اینجا.
منبع: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-automatic-model-tuning-now-supports-three-new-completion-criteria-for-hyperparameter-optimization/

تمبر زمان: فوریه 7، 2023

تمبر زمان: فوریه 23، 2022

Amazon SageMaker Automatic Model Tuning اکنون از سه معیار تکمیل جدید برای بهینه سازی هایپرپارامتر پشتیبانی می کند

بازنشر افلاطون

تنظیم خودکار مدل SageMaker

مزایای تنظیم معیارهای تکمیل کار

حداکثر زمان تنظیم

متریک هدف مورد نظر

نظارت بر بهبود

تشخیص همگرایی

با مقایسه معیارهای تکمیل آزمایش کنید

نتیجه

درباره نویسنده

بیشتر از آموزش ماشین AWS

با استفاده از Amazon SageMaker، Amazon Neptune و Deep Graph یک راه حل تشخیص تقلب در زمان واقعی مبتنی بر GNN بسازید.

چگونه The Chefz غذای عالی را با Amazon Personalize سرو می کند

ترجمه چند زبانه پشتیبانی مشتری در Salesforce Service Cloud با استفاده از مترجم آمازون آسان شد

فعال کردن گردش کار ترکیبی ML در Amazon EKS و Amazon SageMaker با یک کلیک Kubeflow در استقرار AWS

ML خودکار، مقیاس پذیر و مقرون به صرفه در AWS: شناسایی سرخس های درختی مهاجم استرالیایی در جنگل های هاوایی

با Amazon Kinesis، AWS Glue و Amazon SageMaker یک راه حل تعمیر و نگهداری پیش بینی بسازید

چگونه InpharmD از Amazon Kendra و Amazon Lex برای هدایت مراقبت از بیمار مبتنی بر شواهد استفاده می کند

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب