در ماه دسامبر 2020 AWS در دسترس بودن عمومی Amazon SageMaker JumpStart را اعلام کرد، قابلیتی از آمازون SageMaker که به شما کمک می کند تا به سرعت و به راحتی با یادگیری ماشین (ML) شروع کنید. SageMaker JumpStart تنظیم دقیق و استقرار طیف گسترده ای از مدل های از پیش آموزش داده شده را با یک کلیک در وظایف رایج ML و همچنین مجموعه ای از راه حل های سرتاسری که مشکلات رایج تجاری را حل می کند، ارائه می دهد. این ویژگیها بار سنگین را از هر مرحله از فرآیند ML حذف میکنند و توسعه مدلهای با کیفیت بالا را آسانتر میکنند و زمان استقرار را کاهش میدهند.
تمام محتوای JumpStart قبلاً فقط از طریق در دسترس بود Amazon SageMaker Studioکه فراهم می کند رابط گرافیکی کاربر پسند برای تعامل با ویژگی اخیرا ما نیز راه اندازی را اعلام کرد آسان برای استفاده API های JumpStart به عنوان یک توسعه از SageMaker Python SDK، به شما این امکان را می دهد که به صورت برنامه نویسی مجموعه وسیعی از مدل های از پیش آموزش دیده با پشتیبانی از JumpStart را بر روی مجموعه داده های خود استقرار و تنظیم دقیق کنید. این راهاندازی، استفاده از قابلیتهای JumpStart را در جریانهای کاری کد، خطوط لوله MLOps و هر جای دیگری که از طریق SDK با SageMaker تعامل دارید، باز میکند.
در این پست، ما مشتاقیم اعلام کنیم که تمام مدلهای JumpStart قابل آموزش اکنون از آموزش افزایشی پشتیبانی میکنند. آموزش افزایشی به شما امکان میدهد مدلی را که قبلاً تنظیم دقیق کردهاید، با استفاده از یک مجموعه داده توسعهیافته که شامل یک الگوی زیربنایی است که در اجرای تنظیم دقیق قبلی در نظر گرفته نشده است، آموزش دهید، که منجر به عملکرد ضعیف مدل شد. آموزش افزایشی باعث صرفه جویی در زمان و منابع می شود زیرا نیازی به آموزش مجدد مدل از ابتدا ندارید. اگر می خواهید مستقیماً به کد JumpStart API که در این پست توضیح می دهیم بروید، می توانید به نمونه دفترچه یادداشت.
نمای کلی JumpStart
JumpStart یک محصول چند وجهی است که دارای قابلیت های مختلفی است تا به شما کمک کند تا به سرعت با ML در SageMaker شروع کنید. در زمان نوشتن، JumpStart به شما امکان می دهد کارهای زیر را انجام دهید:
- استقرار مدل های از پیش آموزش دیده برای کارهای رایج ML – JumpStart شما را قادر میسازد تا با ارائه استقرار آسان مدلهای از پیش آموزشدیدهشده در مجموعه دادههای بزرگ و در دسترس عموم، به وظایف رایج ML بدون هیچ تلاشی برای توسعه رسیدگی کنید. جامعه تحقیقاتی ML تلاش زیادی را برای در دسترس قرار دادن اکثر مدلهای اخیراً توسعهیافته در دسترس عموم برای استفاده انجام داده است. JumpStart مجموعه ای از بیش از 300 مدل را میزبانی می کند که شامل 15 کار محبوب ML مانند تشخیص اشیا، طبقه بندی متن و تولید متن است و استفاده از آنها را برای مبتدیان آسان می کند. این مدل ها از هاب های مدل محبوب مانند TensorFlow، PyTorch، Hugging Face و MXNet Hub گرفته شده اند.
- مدل های از پیش آموزش دیده را تنظیم کنید - JumpStart به شما امکان می دهد مدل های از پیش آموزش دیده را بدون نیاز به نوشتن الگوریتم آموزشی خود تنظیم کنید. در ML، توانایی انتقال دانش آموخته شده در یک حوزه به حوزه دیگر نامیده می شود انتقال یادگیری. میتوانید از یادگیری انتقالی برای تولید مدلهای دقیق روی مجموعه دادههای کوچکتر خود، با هزینههای آموزشی بسیار پایینتر از مواردی که در آموزش مدل اصلی دخیل هستند، استفاده کنید. JumpStart همچنین شامل الگوریتمهای آموزشی محبوب مبتنی بر LightGBM، CatBoost، XGBoost و Scikit-learn است که میتوانید از ابتدا برای رگرسیون جدولی و طبقهبندی آموزش دهید.
- از راه حل های از پیش ساخته شده استفاده کنید – JumpStart مجموعه ای از 17 راه حل را برای موارد رایج استفاده از ML مانند پیش بینی تقاضا و برنامه های صنعتی و مالی ارائه می دهد که می توانید تنها با چند کلیک آن ها را اجرا کنید. راهحلها برنامههای کاربردی ML سرتاسری هستند که خدمات مختلف AWS را برای حل یک مورد استفاده تجاری خاص با هم ترکیب میکنند. آنها استفاده می کنند AWS CloudFormation قالب ها و معماری های مرجع برای استقرار سریع، به این معنی که آنها کاملا قابل تنظیم هستند.
- از نمونه های نوت بوک برای الگوریتم های SageMaker استفاده کنید – SageMaker مجموعهای از الگوریتمهای داخلی را برای کمک به دانشمندان داده و پزشکان ML ارائه میکند تا با آموزش و استقرار سریع مدلهای ML شروع کنند. JumpStart نمونه نوت بوک هایی را ارائه می دهد که می توانید از آنها برای اعمال سریع این الگوریتم ها استفاده کنید.
- ویدئوهای آموزشی و وبلاگ ها را مرور کنید – JumpStart همچنین پستها و ویدیوهای وبلاگ متعددی را ارائه میکند که به شما میآموزد چگونه از قابلیتهای مختلف در SageMaker استفاده کنید.
JumpStart تنظیمات سفارشی VPC و سرویس مدیریت کلید AWS (AWS KMS) کلیدهای رمزگذاری، بنابراین می توانید از مدل ها و راه حل های موجود به طور ایمن در محیط سازمانی خود استفاده کنید. می توانید تنظیمات امنیتی خود را در استودیو یا از طریق SageMaker Python SDK به JumpStart منتقل کنید.
طبقه بندی تصویر
طبقه بندی تصویر به طبقه بندی یک تصویر در یکی از برچسب های کلاس در مجموعه داده آموزشی اشاره دارد. میتوانید مدل را با هر مجموعه دادهای شامل تصاویر متعلق به هر تعداد کلاس تنظیم کنید. مدل موجود برای تنظیم دقیق در JumpStart یک لایه طبقه بندی را به مدل استخراج کننده ویژگی مربوطه متصل می کند و پارامترهای لایه را به مقادیر تصادفی مقداردهی اولیه می کند. بعد خروجی لایه طبقه بندی بر اساس تعداد کلاس ها در داده های ورودی تعیین می شود. مرحله تنظیم دقیق، پارامترهای لایه طبقهبندی را تنظیم میکند، در حالی که پارامترهای مدل استخراج ویژگی را ثابت نگه میدارد، و مدل دقیق تنظیم شده را برمیگرداند. هدف به حداقل رساندن خطای پیشبینی در دادههای ورودی است.
برای مجموعه داده ما، ورودی یک دایرکتوری است که به تعداد کلاسها، زیر شاخهها دارد. هر زیر شاخه باید دارای تصاویر متعلق به آن کلاس با فرمت jpg باشد. دایرکتوری ورودی باید مانند سلسله مراتب زیر باشد اگر داده های آموزشی حاوی تصاویری از دو کلاس باشد: roses
و dandelion
:
نام پوشه ها، کلاس ها و نام فایل jpg. می تواند هر چیزی باشد.
ما ارائه می دهیم tf_flowers
1 مجموعه داده به عنوان یک مجموعه داده پیش فرض برای تنظیم دقیق مدل. این مجموعه داده شامل تصاویری از پنج نوع گل است. مجموعه داده از دانلود شده است TensorFlow.
مرور کلی
بخشهای زیر یک نسخه نمایشی گام به گام برای انجام طبقهبندی تصاویر با JumpStart، از طریق Studio UI و JumpStart API ارائه میکنند.
مراحل زیر را طی می کنیم:
- از طریق رابط کاربری Studio به JumpStart دسترسی پیدا کنید:
- مدل از پیش آموزش دیده را تنظیم دقیق کنید.
- مدل دقیق تنظیم شده را اجرا کنید.
- مدل تنظیم شده را به صورت تدریجی آموزش دهید و مجدداً مستقر کنید.
- از JumpStart به صورت برنامه نویسی با SageMaker Python SDK استفاده کنید:
- مدل از پیش آموزش دیده را تنظیم دقیق کنید.
- مدل دقیق تنظیم شده را اجرا کنید.
- مدل تنظیم شده را به صورت تدریجی آموزش دهید و مجدداً مستقر کنید.
از طریق رابط کاربری Studio به JumpStart دسترسی پیدا کنید
در این بخش، نحوه تنظیم دقیق و استقرار مدلهای JumpStart را از طریق رابط کاربری Studio نشان میدهیم. علاوه بر این، نحوه آموزش تدریجی مدلی را که قبلاً تنظیم کرده اید، نشان می دهیم.
مدل از پیش آموزش دیده را تنظیم دقیق کنید
ویدئوی زیر به شما نشان می دهد که چگونه یک مدل طبقه بندی تصویر از پیش آموزش دیده را در JumpStart پیدا کنید و آن را به دقت تنظیم کنید. صفحه مدل حاوی اطلاعات ارزشمندی در مورد مدل، نحوه استفاده از آن، قالب داده مورد انتظار و برخی جزئیات تنظیم دقیق است.
برای اهداف نمایشی، ما مدل را با استفاده از مجموعه دادهای که بهطور پیشفرض ارائه شده است، تنظیم میکنیم tf_flowers
مجموعه داده، متشکل از انواع مختلف گل. تنظیم دقیق مجموعه داده های خود شامل قالب بندی صحیح داده ها (همانطور که در صفحه مدل توضیح داده شده است)، بارگذاری آن ها در سرویس ذخیره سازی ساده آمازون (Amazon S3) و تعیین مکان آن در پیکربندی منبع داده.
ما از همان مقادیر فراپارامتر تنظیم شده به طور پیش فرض استفاده می کنیم (تعداد دوره ها، نرخ یادگیری و اندازه دسته). ما همچنین از یک نمونه ml.p3.2xlarge با پشتیبانی GPU به عنوان نمونه آموزشی SageMaker خود استفاده می کنیم.
می توانید کار آموزشی خود را مستقیماً در کنسول استودیو نظارت کنید و پس از اتمام آن به شما اطلاع داده می شود.
مدل دقیق تنظیم شده را اجرا کنید
پس از تکمیل آموزش، میتوانید مدل تنظیمشده را از همان صفحهای که جزئیات کار آموزشی را در خود دارد، اجرا کنید. برای استقرار مدل خود، یک نوع نمونه متفاوت، ml.p2.xlarge را انتخاب می کنیم. هنوز هم شتاب GPU مورد نیاز برای تأخیر استنتاج کم، اما با قیمت پایینتر را فراهم میکند. پس از پیکربندی نمونه میزبانی SageMaker، را انتخاب کنید گسترش. ممکن است 5 تا 10 دقیقه طول بکشد تا نقطه پایان دائمی شما آماده و اجرا شود.
سپس نقطه پایانی شما عملیاتی شده و آماده پاسخگویی به درخواستهای استنتاج است!
برای تسریع زمان شما برای استنتاج، JumpStart یک دفترچه یادداشت نمونه ارائه می دهد که به شما نشان می دهد چگونه استنتاج را در نقطه پایانی تازه مستقر شده خود اجرا کنید. انتخاب کنید نوت بوک را باز کنید زیر از Endpoint استفاده کنید از استودیو
مدل تنظیم شده را به صورت تدریجی آموزش دهید و به کار بگیرید
وقتی تنظیم دقیق کامل شد، میتوانید مدل را بیشتر آموزش دهید تا عملکرد را افزایش دهید. این مرحله بسیار شبیه به فرآیند تنظیم دقیق اولیه است، با این تفاوت که ما از مدلی که قبلاً تنظیم دقیق شده است به عنوان نقطه شروع استفاده می کنیم. ممکن است از داده های جدید استفاده کنید، اما قالب مجموعه داده ها باید یکسان باشد (همان مجموعه ای از کلاس ها).
از JumpStart به صورت برنامه نویسی با SageMaker SDK استفاده کنید
در بخشهای قبل، نشان دادیم که چگونه میتوانید از JumpStart UI برای تنظیم دقیق، استقرار و آموزش تدریجی یک مدل به صورت تعاملی در چند کلیک استفاده کنید. همچنین میتوانید با استفاده از APIهایی که در SageMaker SDK ادغام شدهاند، از مدلهای JumpStart استفاده کنید و به صورت برنامهنویسی تنظیم دقیق آن را آسان کنید. ما اکنون به یک مثال سریع می پردازیم که چگونه می توانید فرآیند قبلی را تکرار کنید. تمامی مراحل این دمو در نوت بوک های همراه موجود است مقدمه ای بر JumpStart – طبقه بندی تصاویر.
مدل از پیش آموزش دیده را تنظیم دقیق کنید
برای تنظیم دقیق یک مدل انتخاب شده، باید URI آن مدل و همچنین اسکریپت آموزشی و تصویر ظرف مورد استفاده برای آموزش را دریافت کنیم. خوشبختانه، این سه ورودی فقط به نام مدل، نسخه بستگی دارد (برای لیست مدل های موجود، نگاه کنید به جدول مدل در دسترس JumpStart) و نوع نمونه ای که می خواهید روی آن آموزش دهید. این در قطعه کد زیر نشان داده شده است:
ما را بازیابی می کنیم model_id
مطابق با همان مدلی که قبلا استفاده کردیم. ic در شناسه مربوط به طبقه بندی تصویر است.
اکنون می توانید این مدل JumpStart را با استفاده از SageMaker SDK روی مجموعه داده های سفارشی خود تنظیم کنید. ما از همان استفاده می کنیم tf_flowers
مجموعه داده ای که به صورت عمومی در آمازون S3 میزبانی می شود، به راحتی بر تجزیه و تحلیل احساسات متمرکز شده است. همانطور که در بخش قبل توضیح داده شد، مجموعه داده شما باید برای تنظیم دقیق ساختاری داشته باشد. کد نمونه زیر را ببینید:
ما همان هایپرپارامترهای پیش فرض را برای مدل انتخابی خود مانند آنچه در بخش قبل دیدیم، با استفاده از آن به دست می آوریم sagemaker.hyperparameters.retrieve_default()
. سپس یک تخمینگر SageMaker را نمونهسازی میکنیم و روش .fit را فراخوانی میکنیم تا تنظیم دقیق مدل خود را آغاز کنیم و آن را از آمازون S3 URI برای دادههای آموزشی خود ارسال کنیم. همانطور که می بینید، entry_point
اسکریپت ارائه شده نامگذاری شده است transfer_learning.py
(برای سایر وظایف و مدلها همینطور است)، و کانال داده ورودی به آن منتقل میشود .fit
باید نام برد training
.
استقرار مدل دقیق تنظیم شده
هنگامی که آموزش کامل شد، می توانید مدل دقیق تنظیم شده خود را مستقر کنید. برای انجام این کار، تنها چیزی که باید به دست آوریم URI اسکریپت استنتاج (کدی که تعیین میکند مدل پس از استقرار چگونه برای استنتاج استفاده میشود) و URI تصویر ظرف استنتاج است که شامل یک سرور مدل مناسب برای میزبانی مدلی است که انتخاب کردیم. کد زیر را ببینید:
پس از چند دقیقه، مدل ما مستقر می شود و می توانیم پیش بینی هایی را در زمان واقعی از آن دریافت کنیم!
در مرحله بعد، نقطه پایانی را فراخوانی می کنیم تا پیش بینی کنیم که چه نوع گلی در تصویر مثال وجود دارد. ما استفاده می کنیم query_endpoint
و parse_response
توابع کمکی، که در همراه تعریف شده است دفتر یادداشت.
مدل تنظیم شده را به صورت تدریجی آموزش دهید و مجدداً مستقر کنید
ما میتوانیم با آموزش بیشتر یک مدل تنظیمشده روی تصاویر جدید، عملکرد آن را افزایش دهیم. برای این کار میتوانید از هر تعداد تصویر جدید یا قدیمی استفاده کنید، اما قالب مجموعه دادهها باید ثابت بماند (همان مجموعه کلاسها). مرحله آموزش افزایشی مشابه فرآیند تنظیم دقیق است، با یک تفاوت مهم: در تنظیم اولیه با یک مدل از قبل آموزش دیده شروع می کنیم، در حالی که در آموزش افزایشی با یک مدل تنظیم دقیق موجود شروع می کنیم. کد زیر را ببینید:
وقتی آموزش کامل شد، میتوانیم از همان مراحلی که در بخش قبل توضیح داده شد برای استقرار مدل استفاده کنیم.
نتیجه
JumpStart یک قابلیت در SageMaker است که به شما اجازه می دهد تا به سرعت با ML شروع کنید. JumpStart از مدلهای از پیش آموزشدیده منبع باز برای حل مشکلات رایج ML مانند طبقهبندی تصویر، تشخیص اشیا، طبقهبندی متن، طبقهبندی جفت جمله و پاسخگویی به سؤال استفاده میکند.
در این پست، ما به شما نشان دادیم که چگونه یک مدل طبقه بندی تصویر از پیش آموزش دیده را تنظیم و به کار ببرید. ما همچنین نحوه آموزش تدریجی یک مدل تنظیم شده برای طبقه بندی تصاویر را نشان دادیم. با JumpStart می توانید به راحتی این فرآیند را بدون نیاز به کدنویسی انجام دهید. راه حل را به تنهایی امتحان کنید و در نظرات به ما اطلاع دهید که چگونه پیش می رود. برای کسب اطلاعات بیشتر در مورد JumpStart، ویدیوی AWS re:Invent 2020 را بررسی کنید با Amazon SageMaker JumpStart در عرض چند دقیقه با ML شروع کنید.
منابع
- تیم تنسورفلو، 2019
درباره نویسنده
دکتر ویوک مدان یک دانشمند کاربردی با تیم آمازون SageMaker JumpStart است. دکترا گرفت. از دانشگاه ایلینویز در Urbana-Champaign و پژوهشگر پست دکتری در جورجیا تک بود. او یک محقق فعال در یادگیری ماشین و طراحی الگوریتم است و مقالاتی در کنفرانس های EMNLP، ICLR، COLT، FOCS و SODA منتشر کرده است.
ژائو مورا یک معمار راه حل های تخصصی AI/ML در خدمات وب آمازون است. او بیشتر بر موارد استفاده از NLP و کمک به مشتریان برای بهینه سازی آموزش و استقرار مدل یادگیری عمیق متمرکز است. او همچنین یکی از حامیان فعال راه حل های ML با کد پایین و سخت افزار تخصصی ML است.
دکتر آشیش ختان دانشمند ارشد کاربردی با Amazon SageMaker JumpStart و الگوریتم های داخلی آمازون SageMaker و به توسعه الگوریتم های یادگیری ماشین کمک می کند. او یک محقق فعال در یادگیری ماشین و استنتاج آماری است و مقالات زیادی در کنفرانس های NeurIPS، ICML، ICLR، JMLR، ACL و EMNLP منتشر کرده است.
- '
- "
- 100
- 2020
- a
- توانایی
- درباره ما
- شتاب دادن
- دقیق
- در میان
- فعال
- نشانی
- الگوریتم
- الگوریتم
- معرفی
- اجازه دادن
- اجازه می دهد تا
- قبلا
- آمازون
- آمازون خدمات وب
- مقدار
- تحلیل
- اعلام
- اعلام کرد
- دیگر
- هر جا
- API
- رابط های برنامه کاربردی
- برنامه های کاربردی
- اعمال می شود
- درخواست
- مناسب
- دسترس پذیری
- در دسترس
- AWS
- زیرا
- بلاگ
- پست های وبلاگ
- ساخته شده در
- کسب و کار
- صدا
- می توانید دریافت کنید
- قابلیت های
- مورد
- موارد
- را انتخاب کنید
- کلاس
- کلاس ها
- طبقه بندی
- رمز
- مجموعه
- نظرات
- مشترک
- انجمن
- کامل
- مرکب
- همایش ها
- پیکر بندی
- کنسول
- ظرف
- شامل
- محتوا
- گروه شاهد
- متناظر
- هزینه
- ایجاد
- سفارشی
- مشتریان
- سفارشی
- داده ها
- عمیق
- تقاضا
- نشان دادن
- نشان
- گسترش
- مستقر
- استقرار
- گسترش
- شرح داده شده
- طرح
- جزئیات
- کشف
- توسعه
- توسعه
- پروژه
- تفاوت
- مختلف
- بعد
- مستقیما
- کارگر بارانداز
- دامنه
- هر
- به آسانی
- آسان برای استفاده
- تلاش
- را قادر می سازد
- رمزگذاری
- پشت سر هم
- نقطه پایانی
- سرمایه گذاری
- محیط
- مثال
- مثال ها
- جز
- برانگیخته
- موجود
- منبسط
- انتظار می رود
- چهره
- ویژگی
- امکانات
- مالی
- مناسب
- متمرکز شده است
- پیروی
- قالب
- از جانب
- توابع
- بیشتر
- سوالات عمومی
- نسل
- گرجستان
- GPU
- سخت افزار
- کمک
- کمک
- کمک می کند
- سلسله مراتب
- با کیفیت بالا
- دارای
- میزبانی
- میزبانی وب
- چگونه
- چگونه
- اما
- HTTPS
- قطب
- ایلینوی
- تصویر
- تصاویر
- مهم
- شامل
- افزایش
- صنعتی
- اطلاعات
- ورودی
- نمونه
- یکپارچه
- تعامل
- گرفتار
- IT
- کار
- پرش
- نگهداری
- کلید
- کلید
- دانستن
- دانش
- برچسب
- برچسب ها
- بزرگ
- راه اندازی
- لایه
- یاد گرفتن
- آموخته
- یادگیری
- بلند کردن اجسام
- فهرست
- محل
- نگاه کنيد
- دستگاه
- فراگیری ماشین
- اکثریت
- ساخت
- مدیریت
- ماده
- به معنی
- ML
- مدل
- مدل
- مانیتور
- بیش
- اکثر
- محبوبترین
- نام
- دفتر یادداشت
- عدد
- متعدد
- بهینه سازی
- دیگر
- خود
- ویژه
- عبور
- الگو
- کارایی
- نقطه
- فقیر
- محبوب
- پست ها
- پیش بینی
- پیش گویی
- پیش بینی
- قبلی
- قیمت
- مشکلات
- روند
- تولید کردن
- محصول
- ارائه
- ارائه
- فراهم می کند
- ارائه
- اهداف
- سوال
- سریع
- به سرعت
- RE
- تازه
- کاهش
- اشاره دارد
- ماندن
- تحقیق
- منابع
- بازده
- دویدن
- در حال اجرا
- همان
- دانشمند
- دانشمندان
- sdk
- ایمن
- تیم امنیت لاتاری
- انتخاب شد
- انتخاب
- احساس
- خدمات
- تنظیم
- مشابه
- ساده
- اندازه
- So
- راه حل
- مزایا
- حل
- برخی از
- متخصص
- شروع
- آغاز شده
- آماری
- هنوز
- ذخیره سازی
- ساخت یافته
- استودیو
- پشتیبانی
- مصرف
- وظایف
- تیم
- فن آوری
- قالب
- La
- سه
- از طریق
- زمان
- با هم
- آموزش
- انتقال
- انواع
- ui
- زیر
- دانشگاه
- باز کردن
- us
- استفاده کنید
- تنوع
- مختلف
- نسخه
- تصویری
- فیلم های
- وب
- خدمات وب
- چی
- در حین
- در داخل
- گردش کار
- نوشته
- شما
- یوتیوب