با ساخت سریع Canvas Amazon SageMaker مدل پیش‌بینی سری زمانی را سریع‌تر آموزش دهید

بازنشر افلاطون

دنبال: 0

امروز، آمازون SageMaker Canvas قابلیت استفاده از ویژگی ساخت سریع با موارد استفاده پیش بینی سری های زمانی را معرفی می کند. این به شما امکان می‌دهد مدل‌ها را آموزش دهید و امتیازات توضیح‌پذیری مرتبط را در کمتر از 20 دقیقه ایجاد کنید، در این مرحله می‌توانید پیش‌بینی‌هایی را روی داده‌های جدید و نادیده ایجاد کنید. آموزش ساخت سریع آزمایش‌های سریع‌تری را برای درک اینکه مدل چقدر با داده‌ها مطابقت دارد و چه ستون‌هایی پیش‌بینی می‌کنند را امکان‌پذیر می‌کند و به تحلیلگران تجاری اجازه می‌دهد آزمایش‌هایی را با مجموعه داده‌های متنوع اجرا کنند تا بتوانند بهترین مدل را انتخاب کنند.

Canvas دسترسی به یادگیری ماشین (ML) را با ارائه یک رابط بصری نقطه و کلیک برای تحلیلگران کسب‌وکار گسترش می‌دهد که به شما امکان می‌دهد پیش‌بینی‌های دقیق ML را خودتان بدون نیاز به تجربه ML یا نیاز به نوشتن یک خط کد ایجاد کنید.

در این پست نحوه آموزش سریعتر مدل پیش‌بینی سری زمانی را با آموزش ساخت سریع در Canvas نشان می‌دهیم.

بررسی اجمالی راه حل

تا به امروز، آموزش یک مدل پیش‌بینی سری زمانی تا 4 ساعت از طریق روش ساخت استاندارد طول می‌کشید. اگرچه این رویکرد از مزیت اولویت دادن به دقت بر زمان آموزش برخوردار است، اما اغلب به زمان‌های آموزشی طولانی منجر می‌شد، که به نوبه خود اجازه آزمایش سریعی را که تحلیلگران تجاری در تمام انواع سازمان‌ها معمولاً به دنبال آن هستند، نمی‌داد. از امروز، Canvas به شما اجازه می دهد تا از ویژگی ساخت سریع برای آموزش یک مدل پیش بینی سری زمانی استفاده کنید، و به موارد استفاده ای که قبلاً در دسترس بود، اضافه کنید.طبقه بندی باینری و چند کلاسه و رگرسیون عددی). اکنون می توانید یک مدل را آموزش دهید و اطلاعات قابل توضیح را در کمتر از 20 دقیقه به دست آورید، با همه چیز برای شروع تولید استنتاج.

برای استفاده از ویژگی ساخت سریع برای موارد استفاده ML پیش بینی سری های زمانی، تنها کاری که باید انجام دهید این است که مجموعه داده خود را در Canvas آپلود کنید، پارامترهای آموزشی (مانند ستون هدف) را پیکربندی کنید و سپس انتخاب کنید. ساخت سریع بجای ساخت استاندارد (که تا قبل از امروز تنها گزینه موجود برای این نوع از موارد استفاده ML بود). توجه داشته باشید که ساخت سریع فقط برای مجموعه داده هایی با کمتر از 50,000 ردیف در دسترس است.

بیایید سناریویی را در مورد استفاده از ویژگی ساخت سریع در یک مورد استفاده از ML در دنیای واقعی که شامل داده‌های سری زمانی و دریافت نتایج عملی است، مرور کنیم.

یک ساخت سریع در Canvas ایجاد کنید

هر کسی که با ML کار کرده است، حتی اگر تجربه یا تخصص مرتبطی نداشته باشد، می‌داند که نتیجه نهایی فقط به خوبی مجموعه داده آموزشی است. مهم نیست که الگوریتمی که برای آموزش مدل استفاده کرده‌اید چقدر مناسب است، نتیجه نهایی کیفیت استنتاج بر روی داده‌های دیده نشده را منعکس می‌کند و اگر داده‌های آموزشی نشان‌دهنده داده‌های داده‌شده نباشد، رضایت‌بخش نخواهد بود. مورد استفاده، مغرضانه است، یا مقادیر مکرر گم شده دارد.

برای اهداف این پست، ما از یک مجموعه داده مصنوعی نمونه استفاده می‌کنیم که حاوی اطلاعات تقاضا و قیمت برای اقلام مختلف در یک بازه زمانی معین است که با مهر زمانی مشخص شده است (یک فیلد تاریخ در فایل CSV). مجموعه داده در دسترس است GitHub. تصویر زیر ده ردیف اول را نشان می دهد.

حل یک مشکل تجاری با استفاده از ML بدون کد با Canvas یک فرآیند چهار مرحله‌ای است: مجموعه داده را وارد کنید، مدل ML را بسازید، عملکرد آن را بررسی کنید، و سپس از مدل برای تولید پیش‌بینی‌ها استفاده کنید. استنتاج در اصطلاحات ML). اگر در Canvas تازه کار هستید، پیامی نمایش داده می‌شود که شما را در این فرآیند راهنمایی می‌کند. در صورت تمایل می توانید چند دقیقه را با آموزش درون برنامه ای بگذرانید، در غیر این صورت می توانید انتخاب کنید حالا بروید. اختصاصی نیز وجود دارد راهنمای شروع اگر می‌خواهید معرفی دقیق‌تری داشته باشید، می‌توانید آن را دنبال کنید تا به طور کامل در سرویس غوطه‌ور شوید.

ما با آپلود مجموعه داده شروع می کنیم. مراحل زیر را کامل کنید:

بر مجموعه داده ها صفحه ، انتخاب کنید واردات داده ها.
آپلود داده ها از دیسک محلی یا منابع دیگر، از جمله سرویس ذخیره سازی ساده آمازون (Amazon S3) آمازون Redshiftو دانه برف، برای بارگیری مجموعه داده نمونه product_demand.csv اکنون در لیست مجموعه داده ها نشان داده می شود.
باز کن product_demand.csv و انتخاب کنید یک مدل ایجاد کنید برای شروع فرآیند ایجاد مدل
شما به مسیر هدایت می شوید ساختن زبانه برنامه Canvas برای شروع مرحله بعدی گردش کار Canvas.
ابتدا متغیر هدف را انتخاب می کنیم، مقداری که می خواهیم به عنوان تابعی از متغیرهای دیگر موجود در مجموعه داده پیش بینی کنیم. در مورد ما، این است demand متغیر.
Canvas به طور خودکار استنباط می کند که این یک مشکل پیش بینی سری زمانی است.
برای اینکه Canvas بتواند مورد استفاده پیش‌بینی سری زمانی را حل کند، باید چند گزینه پیکربندی را تنظیم کنیم.
مشخص کنید کدام ستون به طور منحصر به فرد موارد موجود در مجموعه داده، جایی که مُهرهای زمانی ذخیره می‌شوند و افق پیش‌بینی‌ها (چند ماه آینده را می‌خواهیم ببینیم) شناسایی می‌کند.
علاوه بر این، ما می‌توانیم یک برنامه تعطیلات ارائه دهیم، که می‌تواند در برخی موارد استفاده که از داشتن این اطلاعات سود می‌برند، مانند موارد استفاده از خرده‌فروشی یا زنجیره تامین، مفید باشد.
را انتخاب کنید ذخیره.

انتخاب افق پیش‌بینی مناسب برای یک مورد استفاده پیش‌بینی سری‌های زمانی خوب از اهمیت بالایی برخوردار است. هرچه این مقدار بیشتر باشد، در آینده بیشتر پیش‌بینی را تولید خواهیم کرد – با این حال، به دلیل ماهیت احتمالی پیش‌بینی ایجاد شده، احتمال کمتری وجود دارد که دقیق باشد. ارزش بالاتر همچنین به معنای زمان طولانی تری برای آموزش و همچنین منابع بیشتر مورد نیاز برای آموزش و استنتاج است. در نهایت، بهترین روش این است که نقاط داده از گذشته حداقل 3 تا 5 برابر افق پیش بینی شده باشد. اگر می‌خواهید 6 ماه آینده را پیش‌بینی کنید (مانند مثال ما)، باید حداقل 18 ماه داده تاریخی، حداکثر تا 30 ماه، داشته باشید.
بعد از اینکه این تنظیمات را ایمن کردید، انتخاب کنید ساخت سریع.

Canvas یک فرآیند AutoML در حافظه راه‌اندازی می‌کند که چندین مدل پیش‌بینی سری زمانی را با فراپارامترهای مختلف آموزش می‌دهد. در کمتر از 20 دقیقه (بسته به مجموعه داده)، Canvas بهترین عملکرد مدل را در قالب پنج معیار ارائه می دهد.

بیایید عمیقاً به معیارهای پیشرفته برای پیش‌بینی‌های سری‌های زمانی در Canvas و اینکه چگونه می‌توانیم آنها را معنا کنیم، بپردازیم:

میانگین کاهش وزن وزنی (wQL) - پیش‌بینی را با میانگین‌گیری دقت در چندک‌های P10، P50 و P90 ارزیابی می‌کند. مقدار کمتر نشان دهنده مدل دقیق تر است.
خطای درصد مطلق وزنی (WAPE) - مجموع خطای مطلق نرمال شده توسط مجموع هدف مطلق، که انحراف کلی مقادیر پیش بینی شده از مقادیر مشاهده شده را اندازه گیری می کند. مقدار کمتر نشان‌دهنده یک مدل دقیق‌تر است، که در آن WAPE = 0 مدلی بدون خطا است.
ریشه میانگین مربعات خطا (RMSE) – جذر میانگین مجذور خطاها. RMSE کمتر نشان دهنده یک مدل دقیق تر است، که در آن RMSE = 0 مدلی بدون خطا است.
میانگین درصد مطلق خطا (MAPE) - درصد خطا (درصد اختلاف میانگین مقدار پیش بینی شده در مقابل مقدار واقعی) به طور میانگین در تمام نقاط زمانی. یک مقدار کمتر نشان دهنده یک مدل دقیق تر است، که در آن MAPE = 0 مدلی بدون خطا است.
میانگین خطای مقیاس مطلق (MASE) - میانگین خطای مطلق پیش بینی نرمال شده با میانگین خطای مطلق یک روش پیش بینی ساده پایه. مقدار کمتر نشان‌دهنده یک مدل دقیق‌تر است، که در آن MASE 1 بدتر از خط پایه تخمین زده می‌شود.

برای اطلاعات بیشتر در مورد معیارهای پیشرفته، به از معیارهای پیشرفته در تحلیل های خود استفاده کنید.

توضیح پذیری داخلی بخشی از ارزش پیشنهادی Canvas است، زیرا اطلاعاتی در مورد تأثیر ستون بر روی تجزیه و تحلیل برگه در این مورد می توان دید که قیمت تاثیر زیادی بر ارزش تقاضا دارد. این منطقی است زیرا قیمت بسیار پایین تقاضا را با حاشیه زیادی افزایش می دهد.

پیش بینی ها و سناریوهای چه می شود

بعد از اینکه عملکرد مدل خود را تحلیل کردیم، می‌توانیم از آن برای تولید پیش‌بینی‌ها و آزمایش سناریوهای what-if استفاده کنیم.

بر پیش بینی برگه ، انتخاب کنید مورد واحد.
یک مورد را انتخاب کنید (برای این مثال، item_002).

تصویر زیر پیش بینی را نشان می دهد item_002.

می توان انتظار افزایش تقاضا را در ماه های آینده داشت. Canvas همچنین یک آستانه احتمالی حول پیش‌بینی مورد انتظار را ارائه می‌کند، بنابراین می‌توانیم تصمیم بگیریم که آیا حد بالایی پیش‌بینی (با خطر تخصیص بیش از حد) یا کران پایین (خطر کم‌تخصیص) را بگیریم. از این مقادیر با احتیاط استفاده کنید و دانش دامنه خود را برای تعیین بهترین پیش بینی برای کسب و کار خود به کار ببرید.

Canvas همچنین از سناریوهای what-if پشتیبانی می‌کند، که این امکان را فراهم می‌کند تا ببینیم که چگونه تغییر مقادیر در مجموعه داده می‌تواند بر پیش‌بینی کلی یک آیتم، مستقیماً در نمودار پیش‌بینی تأثیر بگذارد. برای اهداف این پست، ما یک کمپین 2 ماهه را شبیه سازی می کنیم که در آن 50٪ تخفیف ارائه می کنیم و قیمت را از 120 دلار به 60 دلار کاهش می دهیم.

را انتخاب کنید چه می شود اگر سناریو.
مقادیری را که می خواهید تغییر دهید (برای این مثال نوامبر و دسامبر) انتخاب کنید.
را انتخاب کنید ایجاد پیش بینی.

می بینیم که قیمت تغییر یافته باعث افزایش تقاضای محصول برای ماه های تحت تاثیر کمپین تخفیف می شود و سپس به آرامی به مقادیر مورد انتظار از پیش بینی قبلی باز می گردد.
به عنوان آزمایش نهایی، می توانیم تأثیر تغییر قطعی قیمت یک محصول را تعیین کنیم.
را انتخاب کنید سناریوی what-if جدید را امتحان کنید.
انتخاب کنید ویرایش انبوه همه مقادیر.
برای ارزش جدید، 70 را وارد کنید.
را انتخاب کنید ایجاد پیش بینی.

این قیمت کمتر از 100 تا 120 دلار اولیه است، بنابراین ما انتظار افزایش شدید تقاضای محصول را داریم. همانطور که در تصویر زیر نشان داده شده است، این پیش بینی تایید شده است.

پاک کردن

برای جلوگیری از متحمل شدن در آینده هزینه های جلسه، از SageMaker Canvas خارج شوید.

نتیجه

در این پست، شما را با ویژگی ساخت سریع برای مدل‌های پیش‌بینی سری‌های زمانی و نمای تحلیل معیارهای به‌روز شده آشنا کردیم. هر دو از امروز در همه مناطقی که Canvas در دسترس است در دسترس هستند. برای اطلاعات بیشتر مراجعه کنید یک مدل بسازید و از معیارهای پیشرفته در تحلیل های خود استفاده کنید.

برای آشنایی بیشتر با Canvas به این لینک ها مراجعه کنید:

برای کسب اطلاعات بیشتر در مورد موارد استفاده دیگری که می توانید با Canvas حل کنید، پست های زیر را بررسی کنید:

آزمایش Canvas را از امروز شروع کنید و مدل های پیش بینی سری های زمانی خود را در کمتر از 20 دقیقه با استفاده از ردیف رایگان 2 ماهه که Canvas ارائه می دهد.

درباره نویسنده

دیوید گالیتلی یک معمار راه حل های تخصصی برای AI/ML در منطقه EMEA است. او در بروکسل مستقر است و از نزدیک با مشتریان در سرتاسر بنلوکس کار می کند. او از زمانی که خیلی جوان بود یک توسعه دهنده بوده و از سن ۷ سالگی شروع به کدنویسی کرد. او یادگیری AI/ML را در دانشگاه شروع کرد و از آن زمان عاشق آن شد.

نیکیفوروس بوتیس یک معمار راه حل در AWS است که از بخش عمومی یونان و قبرس مراقبت می کند و عضوی از جامعه فنی AWS AI/ML است. او از کار با مشتریان در معماری برنامه های کاربردی آنها به روشی انعطاف پذیر، مقیاس پذیر، ایمن و بهینه سازی شده لذت می برد.

تمبر زمان: اکتبر 18، 2022اکتبر 18، 2022

تمبر زمان: اکتبر 14، 2022

با ساخت سریع Amazon SageMaker Canvas یک مدل پیش‌بینی سری زمانی را سریع‌تر آموزش دهید

بازنشر افلاطون

بررسی اجمالی راه حل

یک ساخت سریع در Canvas ایجاد کنید

پیش بینی ها و سناریوهای چه می شود

پاک کردن

نتیجه

درباره نویسنده

بیشتر از آموزش ماشین AWS

سری های زمانی خاصی را برای پیش بینی با آمازون Forecast انتخاب کنید

چگونه آمپ در آمازون از داده ها برای افزایش تعامل مشتری استفاده کرد، قسمت 2: ساختن یک پلت فرم توصیه نمایش شخصی با استفاده از Amazon SageMaker

شروع کار با کانکتور Amazon Kendra Box

اعمال پوشش ناسزا در آمازون مترجم

تجزیه و تحلیل لحظه ای احساسات مشتری با استفاده از AWS

استنتاج چند مدل را با نقاط پایانی چند مدل Amazon SageMaker اجرا و بهینه کنید

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب