آمازون SageMaker است اعلام کرد پشتیبانی از سه معیار تکمیل جدید برای Amazon SageMaker تنظیم خودکار مدل، مجموعه ای از اهرم ها را برای کنترل معیارهای توقف کار تنظیم هنگام یافتن بهترین پیکربندی هایپرپارامتر برای مدل خود در اختیار شما قرار می دهد.
در این پست، این معیارهای تکمیل جدید، زمان استفاده از آنها و برخی از مزایای آنها را مورد بحث قرار می دهیم.
تنظیم خودکار مدل SageMaker
تنظیم خودکار مدل نیز نامیده می شود تنظیم هایپرپارامتر، بهترین نسخه یک مدل را با معیاری که انتخاب می کنیم اندازه گیری می کند. با استفاده از الگوریتم انتخاب شده و محدوده هایپرپارامترهای مشخص شده، بسیاری از کارهای آموزشی را روی مجموعه داده ارائه شده می چرخاند. هر کار آموزشی می تواند زودتر تکمیل شود، زمانی که معیار هدف به طور قابل توجهی بهبود نمی یابد، که به عنوان توقف زودهنگام شناخته می شود.
تا به حال، راه های محدودی برای کنترل کار تنظیم کلی وجود داشت، مانند تعیین حداکثر تعداد مشاغل آموزشی. با این حال، انتخاب این مقدار پارامتر در بهترین حالت اکتشافی است. یک مقدار بزرگتر هزینه های تنظیم را افزایش می دهد و یک مقدار کوچکتر ممکن است بهترین نسخه مدل را همیشه ارائه ندهد.
تنظیم خودکار مدل SageMaker با ارائه معیارهای تکمیل چندگانه برای کار تنظیم، این چالش ها را حل می کند. این در سطح تنظیم به جای هر سطح شغل آموزشی فردی اعمال می شود، به این معنی که در یک لایه انتزاعی بالاتر عمل می کند.
مزایای تنظیم معیارهای تکمیل کار
با کنترل بهتر بر روی زمان توقف کار تنظیم، با عدم اجرای کار برای مدت طولانی و گران بودن محاسباتی از مزایای صرفه جویی در هزینه بهره مند می شوید. همچنین به این معنی است که می توانید اطمینان حاصل کنید که کار خیلی زود متوقف نمی شود و یک مدل با کیفیت به اندازه کافی خوب به دست می آورید که اهداف شما را برآورده می کند. هنگامی که مدلها پس از مجموعهای از تکرارها دیگر بهبود نمییابند یا زمانی که بهبود باقیمانده تخمینی منابع و زمان محاسبه را توجیه نمیکند، میتوانید کار تنظیم را متوقف کنید.
علاوه بر حداکثر تعداد معیارهای تکمیل شغل آموزشی موجود MaxNumberOfTraining Jobs، تنظیم خودکار مدل گزینه توقف تنظیم بر اساس حداکثر زمان تنظیم، نظارت بر بهبود و تشخیص همگرایی را معرفی می کند.
بیایید هر یک از این معیارها را بررسی کنیم.
حداکثر زمان تنظیم
قبلاً، شما این گزینه را داشتید که حداکثر تعداد مشاغل آموزشی را به عنوان تنظیم محدودیت منابع برای کنترل بودجه تنظیم از نظر منابع محاسباتی تعریف کنید. با این حال، این میتواند به زمانهای غیرضروری طولانیتر یا کوتاهتر از حد مورد نیاز یا مطلوب منجر شود.
با اضافه شدن حداکثر معیارهای زمان تنظیم، اکنون می توانید بودجه آموزشی خود را بر حسب مدت زمان برای اجرای کار تنظیم اختصاص دهید و پس از مدت زمان مشخصی که در ثانیه تعریف شده است، به طور خودکار کار را خاتمه دهید.
همانطور که در بالا مشاهده شد، ما از MaxRuntimeInSeconds
برای تعریف زمان تنظیم بر حسب ثانیه. تنظیم محدودیت زمانی تنظیم به شما کمک می کند مدت زمان کار تنظیم و همچنین هزینه پیش بینی شده آزمایش را محدود کنید.
کل هزینه قبل از هر تخفیف قراردادی را می توان با فرمول زیر تخمین زد:EstimatedComputeSeconds= MaxRuntimeInSeconds * MaxParallelTrainingJobs * InstanceCost
حداکثر زمان اجرا بر حسب ثانیه می تواند برای محدود کردن هزینه و زمان اجرا استفاده شود. به عبارت دیگر، این یک معیار تکمیل کنترل بودجه است.
این ویژگی بخشی از معیارهای کنترل منابع است و همگرایی مدل ها را در نظر نمی گیرد. همانطور که در ادامه این پست می بینیم، این معیار می تواند در ترکیب با سایر معیارهای توقف برای دستیابی به کنترل هزینه بدون کاهش دقت استفاده شود.
متریک هدف مورد نظر
یکی دیگر از معیارهای معرفی شده قبلی، تعریف هدف هدف هدف از قبل است. این معیار عملکرد بهترین مدل را بر اساس یک متریک هدف خاص نظارت می کند و زمانی که مدل ها به آستانه تعریف شده در رابطه با متریک هدف مشخص می رسند، تنظیم را متوقف می کند.
با TargetObjectiveMetricValue
معیارها، میتوانیم به SageMaker دستور دهیم پس از اینکه معیار هدف بهترین مدل به مقدار مشخص شده رسید، تنظیم مدل را متوقف کند:
در این مثال، به SageMaker دستور داده شده که وقتی معیار هدف بهترین مدل به 0.95 رسید، تنظیم مدل را متوقف کند.
این روش زمانی مفید است که هدف خاصی دارید که میخواهید مدل شما به آن برسد، مانند سطح مشخصی از دقت، دقت، یادآوری، امتیاز F1، AUC، log-loss و غیره.
یک مورد استفاده معمولی برای این معیار برای کاربری است که از قبل با عملکرد مدل در آستانه های داده شده آشنا است. کاربر در مرحله اکتشاف ممکن است ابتدا مدل را با یک زیرمجموعه کوچک از یک مجموعه داده بزرگتر تنظیم کند تا آستانه متریک ارزیابی رضایت بخشی را برای هدف در هنگام آموزش با مجموعه داده کامل شناسایی کند.
نظارت بر بهبود
این معیار بر همگرایی مدلها پس از هر تکرار نظارت میکند و اگر مدلها پس از تعداد مشخصی از کارهای آموزشی بهبود نیافتند، تنظیم را متوقف میکند. پیکربندی زیر را ببینید:
در این مورد ما تنظیم می کنیم MaxNumberOfTrainingJobsNotImproving
به 10، به این معنی که اگر متریک هدف بعد از 10 کار آموزشی از بهبودی متوقف شود، تنظیم متوقف می شود و بهترین مدل و متریک گزارش می شود.
نظارت بر بهبود باید برای تنظیم معاوضه بین کیفیت مدل و مدت زمان کلی گردش کار به نحوی که احتمالاً بین مسائل مختلف بهینهسازی قابل انتقال باشد، استفاده شود.
تشخیص همگرایی
تشخیص همگرایی یک معیار تکمیل است که به تنظیم خودکار مدل اجازه می دهد تصمیم بگیرد که چه زمانی تنظیم را متوقف کند. به طور کلی، تنظیم خودکار مدل زمانی که تخمین می زند که هیچ بهبود قابل توجهی حاصل نمی شود، تنظیم را متوقف می کند. پیکربندی زیر را ببینید:
این معیار زمانی مناسب است که در ابتدا نمی دانید چه تنظیمات توقفی را انتخاب کنید.
همچنین اگر ندانید با توجه به مشکل و مجموعه داده در دست، کدام متریک هدف برای یک پیشبینی خوب معقول است، مفید است و ترجیح میدهید زمانی که دیگر بهبود نمییابد، کار تنظیم کامل شود.
با مقایسه معیارهای تکمیل آزمایش کنید
در این آزمایش، با توجه به یک کار رگرسیون، ما 3 آزمایش تنظیم را برای یافتن مدل بهینه در فضای جستجوی 2 ابرپارامتر با 200 پیکربندی هایپرپارامتر در مجموع با استفاده از مجموعه داده بازاریابی مستقیم.
در حالی که همه چیز برابر است، اولین مدل با آن تنظیم شد BestObjectiveNotImproving
معیارهای تکمیل، مدل دوم با تنظیم شد CompleteOnConvergence
و مدل سوم بدون هیچ معیار تکمیلی تنظیم شد.
هنگام توصیف هر کار، میتوانیم آن تنظیم را مشاهده کنیم BestObjectiveNotImproving
معیارها منجر به بهینه ترین منبع و زمان نسبت به متریک هدف با تعداد مشاغل کمتری شده است.
La CompleteOnConvergence
معیارها همچنین توانستند تنظیم را در نیمه آزمایش متوقف کنند که منجر به مشاغل آموزشی کمتر و زمان آموزشی کوتاهتر در مقایسه با عدم تعیین معیار شد.
در حالی که تعیین نکردن معیارهای تکمیل منجر به یک آزمایش پرهزینه شد، تعریف آن MaxRuntimeInSeconds
به عنوان بخشی از محدودیت منابع یکی از راه های به حداقل رساندن هزینه خواهد بود.
نتایج بالا نشان میدهد که هنگام تعریف معیار تکمیل، آمازون SageMaker میتواند بهطور هوشمند فرآیند تنظیم را متوقف کند، وقتی تشخیص داد که احتمال کمتری بهبود مدل فراتر از نتیجه فعلی وجود دارد.
توجه داشته باشید که معیارهای تکمیل پشتیبانی شده در تنظیم خودکار مدل SageMaker متقابلاً منحصر به فرد نیستند و میتوانند به طور همزمان هنگام تنظیم یک مدل استفاده شوند.
هنگامی که بیش از یک معیار تکمیل تعریف شده است، کار تنظیم زمانی که هر یک از معیارها برآورده شود، تکمیل می شود.
به عنوان مثال، ترکیبی از معیارهای حد منبع مانند حداکثر زمان تنظیم با معیارهای همگرایی، مانند نظارت بهبود یا تشخیص همگرایی، ممکن است یک کنترل هزینه بهینه و یک معیار هدف بهینه ایجاد کند.
نتیجه
در این پست، در مورد اینکه چگونه میتوانید با انتخاب مجموعهای از معیارهای تکمیلی که جدیداً در SageMaker معرفی شدهاند، مانند حداکثر زمان تنظیم، نظارت بر بهبود، یا تشخیص همگرایی، بهطور هوشمندانه کار تنظیم خود را متوقف کنید، بحث کردیم.
ما با آزمایشی نشان دادیم که توقف هوشمند مبتنی بر مشاهده بهبود در سراسر تکرار ممکن است منجر به مدیریت بودجه و زمان قابل توجهی در مقایسه با عدم تعریف معیار تکمیل شود.
ما همچنین نشان دادیم که این معیارها متقابلاً منحصر به فرد نیستند و میتوانند به طور همزمان در هنگام تنظیم یک مدل برای استفاده از کنترل بودجه و همگرایی بهینه استفاده شوند.
برای جزئیات بیشتر در مورد نحوه پیکربندی و اجرای تنظیم خودکار مدل، مراجعه کنید تنظیمات کار تنظیم Hyperparameter را مشخص کنید.
درباره نویسنده
داگ امبایا یک معمار راه حل شریک ارشد با تمرکز بر داده ها و تجزیه و تحلیل است. داگ همکاری نزدیکی با شرکای AWS دارد و به آنها کمک می کند تا داده ها و راه حل های تجزیه و تحلیل را در فضای ابری یکپارچه کنند.
چایترا ماتور یک معمار اصلی راه حل در AWS است. او مشتریان و شرکا را در ساخت راه حل های بسیار مقیاس پذیر، قابل اعتماد، ایمن و مقرون به صرفه در AWS راهنمایی می کند. او علاقه زیادی به یادگیری ماشین دارد و به مشتریان کمک می کند تا نیازهای ML خود را با استفاده از خدمات AWS AI/ML به راه حل هایی تبدیل کنند. او دارای 5 گواهینامه از جمله گواهینامه تخصصی ML است. او در اوقات فراغت خود از مطالعه، یوگا و گذراندن وقت با دخترانش لذت می برد.
یاروسلاو شچرباتی مهندس یادگیری ماشین در AWS است. او عمدتاً روی بهبود پلتفرم Amazon SageMaker و کمک به مشتریان در استفاده بهینه از ویژگیهای آن کار میکند. او دوست دارد در اوقات فراغت خود به باشگاه برود، ورزشهایی در فضای باز مانند اسکیت روی یخ یا پیادهروی انجام دهد و تحقیقات جدید هوش مصنوعی را دنبال کند.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-automatic-model-tuning-now-supports-three-new-completion-criteria-for-hyperparameter-optimization/
- 10
- 100
- 11
- 7
- 9
- a
- قادر
- درباره ما
- بالاتر
- حساب
- دقت
- رسیدن
- دست
- در میان
- اضافه
- اضافی
- مزیت - فایده - سود - منفعت
- پس از
- AI
- تحقیق ai
- AI / ML
- الگوریتم
- معرفی
- قبلا
- آمازون
- آمازون SageMaker
- مقدار
- علم تجزیه و تحلیل
- و
- اعمال می شود
- اتوماتیک
- بطور خودکار
- AWS
- مستقر
- قبل از
- بودن
- سود
- مزایای
- بهترین
- بهتر
- میان
- خارج از
- کران
- به ارمغان بیاورد
- بودجه
- بنا
- نام
- مورد
- کشتی
- معین
- گواهی
- گواهینامه ها
- چالش ها
- را انتخاب کنید
- برگزیده
- نزدیک
- ابر
- ترکیب
- مقایسه
- مقایسه
- کامل
- تکمیل شده
- تکمیل شده
- اتمام
- محاسبه
- پیکر بندی
- کنترل
- همگرایی
- هزینه
- صرفه جویی در هزینه
- مقرون به صرفه
- هزینه
- میتوانست
- ضوابط
- جاری
- مشتریان
- داده ها
- مشخص
- تعریف کردن
- نشان
- مطلوب
- جزئیات
- کشف
- مختلف
- تخفیف
- بحث و تبادل نظر
- بحث کردیم
- نمی کند
- آیا
- هر
- در اوایل
- فعال
- مهندس
- اطمینان حاصل شود
- برآورد
- تخمین می زند
- ارزیابی
- همه چیز
- مثال
- انحصاری
- موجود
- گران
- تجربه
- اکتشاف
- اکتشاف
- آشنا
- ویژگی
- امکانات
- پیدا کردن
- پیدا کردن
- پیدا می کند
- نام خانوادگی
- تمرکز
- پیروی
- فرمول
- کامل
- عموما
- دریافت کنید
- داده
- دادن
- Go
- هدف
- خوب
- راهنما
- باشگاه بدنسازی
- داشتن
- کمک
- کمک می کند
- بالاتر
- خیلی
- دارای
- چگونه
- چگونه
- اما
- HTML
- HTTPS
- بهینه سازی هایپرپارامتر
- تنظیم فراپارامتر
- ICE
- شناسایی
- بهبود
- بهبود
- ارتقاء
- بهبود
- in
- در دیگر
- از جمله
- افزایش
- فرد
- در ابتدا
- ادغام
- هوشمند
- معرفی
- معرفی می کند
- IT
- تکرار
- تکرار
- کار
- شغل ها
- دانستن
- شناخته شده
- بزرگتر
- لایه
- رهبری
- یادگیری
- رهبری
- اجازه می دهد تا
- سطح
- احتمالا
- محدود
- محدود شده
- دیگر
- دستگاه
- فراگیری ماشین
- مدیریت
- بسیاری
- بازار یابی (Marketing)
- حداکثر
- بیشینه ساختن
- بیشترین
- به معنی
- ملاقات
- روش
- متری
- متریک
- به حداقل رساندن
- ML
- مدل
- مدل
- نظارت بر
- مانیتور
- بیش
- اکثر
- چندگانه
- متقابلا
- نیازهای
- جدید
- عدد
- هدف
- اهداف
- مشاهده کردن
- ONE
- عمل می کند
- بهینه
- بهینه سازی
- بهینه
- گزینه
- دیگر
- به طور کلی
- پارامتر
- بخش
- شریک
- شرکای
- احساساتی
- کارایی
- دوره ها
- فاز
- سکو
- افلاطون
- هوش داده افلاطون
- PlatoData
- پست
- دقت
- پیش گویی
- قبلا
- اصلی
- مشکل
- مشکلات
- روند
- تولید کردن
- پیش بینی
- ارائه
- ارائه
- کیفیت
- رسیدن به
- رسیده
- مطالعه
- معقول
- ارتباط
- قابل اعتماد
- گزارش
- تحقیق
- منابع
- منابع
- نتیجه
- نتیجه
- نتایج
- دویدن
- قربانی کردن
- حکیم ساز
- تنظیم خودکار مدل SageMaker
- پس انداز
- مقیاس پذیر
- جستجو
- دوم
- ثانیه
- امن
- انتخاب
- انتخاب
- ارشد
- خدمات
- تنظیم
- محیط
- تنظیمات
- باید
- نشان
- قابل توجه
- به طور قابل توجهی
- کوچک
- کوچکتر
- So
- راه حل
- مزایا
- حل می کند
- برخی از
- فضا
- تخصص
- خاص
- مشخص شده
- هزینه
- می چرخد
- ورزش ها
- توقف
- متوقف شد
- متوقف کردن
- توقف
- چنین
- پشتیبانی
- پشتیبانی
- پشتیبانی از
- گرفتن
- هدف
- کار
- قوانین و مقررات
- La
- شان
- سوم
- سه
- آستانه
- از طریق
- زمان
- بار
- به
- هم
- جمع
- آموزش
- ترجمه کردن
- نوعی
- استفاده کنید
- مورد استفاده
- کاربر
- اعتبار سنجی
- ارزش
- نسخه
- راه
- چی
- که
- WHO
- اراده
- در داخل
- بدون
- کلمات
- با این نسخهها کار
- خواهد بود
- بازده
- ریاضت
- شما
- شما
- زفیرنت