امروز، آمازون SageMaker Canvas قابلیت استفاده از ویژگی ساخت سریع با موارد استفاده پیش بینی سری های زمانی را معرفی می کند. این به شما امکان میدهد مدلها را آموزش دهید و امتیازات توضیحپذیری مرتبط را در کمتر از 20 دقیقه ایجاد کنید، در این مرحله میتوانید پیشبینیهایی را روی دادههای جدید و نادیده ایجاد کنید. آموزش ساخت سریع آزمایشهای سریعتری را برای درک اینکه مدل چقدر با دادهها مطابقت دارد و چه ستونهایی پیشبینی میکنند را امکانپذیر میکند و به تحلیلگران تجاری اجازه میدهد آزمایشهایی را با مجموعه دادههای متنوع اجرا کنند تا بتوانند بهترین مدل را انتخاب کنند.
Canvas دسترسی به یادگیری ماشین (ML) را با ارائه یک رابط بصری نقطه و کلیک برای تحلیلگران کسبوکار گسترش میدهد که به شما امکان میدهد پیشبینیهای دقیق ML را خودتان بدون نیاز به تجربه ML یا نیاز به نوشتن یک خط کد ایجاد کنید.
در این پست نحوه آموزش سریعتر مدل پیشبینی سری زمانی را با آموزش ساخت سریع در Canvas نشان میدهیم.
بررسی اجمالی راه حل
تا به امروز، آموزش یک مدل پیشبینی سری زمانی تا 4 ساعت از طریق روش ساخت استاندارد طول میکشید. اگرچه این رویکرد از مزیت اولویت دادن به دقت بر زمان آموزش برخوردار است، اما اغلب به زمانهای آموزشی طولانی منجر میشد، که به نوبه خود اجازه آزمایش سریعی را که تحلیلگران تجاری در تمام انواع سازمانها معمولاً به دنبال آن هستند، نمیداد. از امروز، Canvas به شما اجازه می دهد تا از ویژگی ساخت سریع برای آموزش یک مدل پیش بینی سری زمانی استفاده کنید، و به موارد استفاده ای که قبلاً در دسترس بود، اضافه کنید.طبقه بندی باینری و چند کلاسه و رگرسیون عددی). اکنون می توانید یک مدل را آموزش دهید و اطلاعات قابل توضیح را در کمتر از 20 دقیقه به دست آورید، با همه چیز برای شروع تولید استنتاج.
برای استفاده از ویژگی ساخت سریع برای موارد استفاده ML پیش بینی سری های زمانی، تنها کاری که باید انجام دهید این است که مجموعه داده خود را در Canvas آپلود کنید، پارامترهای آموزشی (مانند ستون هدف) را پیکربندی کنید و سپس انتخاب کنید. ساخت سریع بجای ساخت استاندارد (که تا قبل از امروز تنها گزینه موجود برای این نوع از موارد استفاده ML بود). توجه داشته باشید که ساخت سریع فقط برای مجموعه داده هایی با کمتر از 50,000 ردیف در دسترس است.
بیایید سناریویی را در مورد استفاده از ویژگی ساخت سریع در یک مورد استفاده از ML در دنیای واقعی که شامل دادههای سری زمانی و دریافت نتایج عملی است، مرور کنیم.
یک ساخت سریع در Canvas ایجاد کنید
هر کسی که با ML کار کرده است، حتی اگر تجربه یا تخصص مرتبطی نداشته باشد، میداند که نتیجه نهایی فقط به خوبی مجموعه داده آموزشی است. مهم نیست که الگوریتمی که برای آموزش مدل استفاده کردهاید چقدر مناسب است، نتیجه نهایی کیفیت استنتاج بر روی دادههای دیده نشده را منعکس میکند و اگر دادههای آموزشی نشاندهنده دادههای دادهشده نباشد، رضایتبخش نخواهد بود. مورد استفاده، مغرضانه است، یا مقادیر مکرر گم شده دارد.
برای اهداف این پست، ما از یک مجموعه داده مصنوعی نمونه استفاده میکنیم که حاوی اطلاعات تقاضا و قیمت برای اقلام مختلف در یک بازه زمانی معین است که با مهر زمانی مشخص شده است (یک فیلد تاریخ در فایل CSV). مجموعه داده در دسترس است GitHub. تصویر زیر ده ردیف اول را نشان می دهد.
حل یک مشکل تجاری با استفاده از ML بدون کد با Canvas یک فرآیند چهار مرحلهای است: مجموعه داده را وارد کنید، مدل ML را بسازید، عملکرد آن را بررسی کنید، و سپس از مدل برای تولید پیشبینیها استفاده کنید. استنتاج در اصطلاحات ML). اگر در Canvas تازه کار هستید، پیامی نمایش داده میشود که شما را در این فرآیند راهنمایی میکند. در صورت تمایل می توانید چند دقیقه را با آموزش درون برنامه ای بگذرانید، در غیر این صورت می توانید انتخاب کنید حالا بروید. اختصاصی نیز وجود دارد راهنمای شروع اگر میخواهید معرفی دقیقتری داشته باشید، میتوانید آن را دنبال کنید تا به طور کامل در سرویس غوطهور شوید.
ما با آپلود مجموعه داده شروع می کنیم. مراحل زیر را کامل کنید:
- بر مجموعه داده ها صفحه ، انتخاب کنید واردات داده ها.
- آپلود داده ها از دیسک محلی یا منابع دیگر، از جمله سرویس ذخیره سازی ساده آمازون (Amazon S3) آمازون Redshiftو دانه برف، برای بارگیری مجموعه داده نمونه
product_demand.csv
اکنون در لیست مجموعه داده ها نشان داده می شود. - باز کن
product_demand.csv
و انتخاب کنید یک مدل ایجاد کنید برای شروع فرآیند ایجاد مدل
شما به مسیر هدایت می شوید ساختن زبانه برنامه Canvas برای شروع مرحله بعدی گردش کار Canvas. - ابتدا متغیر هدف را انتخاب می کنیم، مقداری که می خواهیم به عنوان تابعی از متغیرهای دیگر موجود در مجموعه داده پیش بینی کنیم. در مورد ما، این است
demand
متغیر.
Canvas به طور خودکار استنباط می کند که این یک مشکل پیش بینی سری زمانی است.
برای اینکه Canvas بتواند مورد استفاده پیشبینی سری زمانی را حل کند، باید چند گزینه پیکربندی را تنظیم کنیم. - مشخص کنید کدام ستون به طور منحصر به فرد موارد موجود در مجموعه داده، جایی که مُهرهای زمانی ذخیره میشوند و افق پیشبینیها (چند ماه آینده را میخواهیم ببینیم) شناسایی میکند.
- علاوه بر این، ما میتوانیم یک برنامه تعطیلات ارائه دهیم، که میتواند در برخی موارد استفاده که از داشتن این اطلاعات سود میبرند، مانند موارد استفاده از خردهفروشی یا زنجیره تامین، مفید باشد.
- را انتخاب کنید ذخیره.
انتخاب افق پیشبینی مناسب برای یک مورد استفاده پیشبینی سریهای زمانی خوب از اهمیت بالایی برخوردار است. هرچه این مقدار بیشتر باشد، در آینده بیشتر پیشبینی را تولید خواهیم کرد – با این حال، به دلیل ماهیت احتمالی پیشبینی ایجاد شده، احتمال کمتری وجود دارد که دقیق باشد. ارزش بالاتر همچنین به معنای زمان طولانی تری برای آموزش و همچنین منابع بیشتر مورد نیاز برای آموزش و استنتاج است. در نهایت، بهترین روش این است که نقاط داده از گذشته حداقل 3 تا 5 برابر افق پیش بینی شده باشد. اگر میخواهید 6 ماه آینده را پیشبینی کنید (مانند مثال ما)، باید حداقل 18 ماه داده تاریخی، حداکثر تا 30 ماه، داشته باشید. - بعد از اینکه این تنظیمات را ایمن کردید، انتخاب کنید ساخت سریع.
Canvas یک فرآیند AutoML در حافظه راهاندازی میکند که چندین مدل پیشبینی سری زمانی را با فراپارامترهای مختلف آموزش میدهد. در کمتر از 20 دقیقه (بسته به مجموعه داده)، Canvas بهترین عملکرد مدل را در قالب پنج معیار ارائه می دهد.
بیایید عمیقاً به معیارهای پیشرفته برای پیشبینیهای سریهای زمانی در Canvas و اینکه چگونه میتوانیم آنها را معنا کنیم، بپردازیم:
- میانگین کاهش وزن وزنی (wQL) - پیشبینی را با میانگینگیری دقت در چندکهای P10، P50 و P90 ارزیابی میکند. مقدار کمتر نشان دهنده مدل دقیق تر است.
- خطای درصد مطلق وزنی (WAPE) - مجموع خطای مطلق نرمال شده توسط مجموع هدف مطلق، که انحراف کلی مقادیر پیش بینی شده از مقادیر مشاهده شده را اندازه گیری می کند. مقدار کمتر نشاندهنده یک مدل دقیقتر است، که در آن WAPE = 0 مدلی بدون خطا است.
- ریشه میانگین مربعات خطا (RMSE) – جذر میانگین مجذور خطاها. RMSE کمتر نشان دهنده یک مدل دقیق تر است، که در آن RMSE = 0 مدلی بدون خطا است.
- میانگین درصد مطلق خطا (MAPE) - درصد خطا (درصد اختلاف میانگین مقدار پیش بینی شده در مقابل مقدار واقعی) به طور میانگین در تمام نقاط زمانی. یک مقدار کمتر نشان دهنده یک مدل دقیق تر است، که در آن MAPE = 0 مدلی بدون خطا است.
- میانگین خطای مقیاس مطلق (MASE) - میانگین خطای مطلق پیش بینی نرمال شده با میانگین خطای مطلق یک روش پیش بینی ساده پایه. مقدار کمتر نشاندهنده یک مدل دقیقتر است، که در آن MASE 1 بدتر از خط پایه تخمین زده میشود.
برای اطلاعات بیشتر در مورد معیارهای پیشرفته، به از معیارهای پیشرفته در تحلیل های خود استفاده کنید.
توضیح پذیری داخلی بخشی از ارزش پیشنهادی Canvas است، زیرا اطلاعاتی در مورد تأثیر ستون بر روی تجزیه و تحلیل برگه در این مورد می توان دید که قیمت تاثیر زیادی بر ارزش تقاضا دارد. این منطقی است زیرا قیمت بسیار پایین تقاضا را با حاشیه زیادی افزایش می دهد.
پیش بینی ها و سناریوهای چه می شود
بعد از اینکه عملکرد مدل خود را تحلیل کردیم، میتوانیم از آن برای تولید پیشبینیها و آزمایش سناریوهای what-if استفاده کنیم.
- بر پیش بینی برگه ، انتخاب کنید مورد واحد.
- یک مورد را انتخاب کنید (برای این مثال،
item_002
).
تصویر زیر پیش بینی را نشان می دهد item_002
.
می توان انتظار افزایش تقاضا را در ماه های آینده داشت. Canvas همچنین یک آستانه احتمالی حول پیشبینی مورد انتظار را ارائه میکند، بنابراین میتوانیم تصمیم بگیریم که آیا حد بالایی پیشبینی (با خطر تخصیص بیش از حد) یا کران پایین (خطر کمتخصیص) را بگیریم. از این مقادیر با احتیاط استفاده کنید و دانش دامنه خود را برای تعیین بهترین پیش بینی برای کسب و کار خود به کار ببرید.
Canvas همچنین از سناریوهای what-if پشتیبانی میکند، که این امکان را فراهم میکند تا ببینیم که چگونه تغییر مقادیر در مجموعه داده میتواند بر پیشبینی کلی یک آیتم، مستقیماً در نمودار پیشبینی تأثیر بگذارد. برای اهداف این پست، ما یک کمپین 2 ماهه را شبیه سازی می کنیم که در آن 50٪ تخفیف ارائه می کنیم و قیمت را از 120 دلار به 60 دلار کاهش می دهیم.
- را انتخاب کنید چه می شود اگر سناریو.
- مقادیری را که می خواهید تغییر دهید (برای این مثال نوامبر و دسامبر) انتخاب کنید.
- را انتخاب کنید ایجاد پیش بینی.
می بینیم که قیمت تغییر یافته باعث افزایش تقاضای محصول برای ماه های تحت تاثیر کمپین تخفیف می شود و سپس به آرامی به مقادیر مورد انتظار از پیش بینی قبلی باز می گردد.
به عنوان آزمایش نهایی، می توانیم تأثیر تغییر قطعی قیمت یک محصول را تعیین کنیم. - را انتخاب کنید سناریوی what-if جدید را امتحان کنید.
- انتخاب کنید ویرایش انبوه همه مقادیر.
- برای ارزش جدید، 70 را وارد کنید.
- را انتخاب کنید ایجاد پیش بینی.
این قیمت کمتر از 100 تا 120 دلار اولیه است، بنابراین ما انتظار افزایش شدید تقاضای محصول را داریم. همانطور که در تصویر زیر نشان داده شده است، این پیش بینی تایید شده است.
پاک کردن
برای جلوگیری از متحمل شدن در آینده هزینه های جلسه، از SageMaker Canvas خارج شوید.
نتیجه
در این پست، شما را با ویژگی ساخت سریع برای مدلهای پیشبینی سریهای زمانی و نمای تحلیل معیارهای بهروز شده آشنا کردیم. هر دو از امروز در همه مناطقی که Canvas در دسترس است در دسترس هستند. برای اطلاعات بیشتر مراجعه کنید یک مدل بسازید و از معیارهای پیشرفته در تحلیل های خود استفاده کنید.
برای آشنایی بیشتر با Canvas به این لینک ها مراجعه کنید:
برای کسب اطلاعات بیشتر در مورد موارد استفاده دیگری که می توانید با Canvas حل کنید، پست های زیر را بررسی کنید:
آزمایش Canvas را از امروز شروع کنید و مدل های پیش بینی سری های زمانی خود را در کمتر از 20 دقیقه با استفاده از ردیف رایگان 2 ماهه که Canvas ارائه می دهد.
درباره نویسنده
دیوید گالیتلی یک معمار راه حل های تخصصی برای AI/ML در منطقه EMEA است. او در بروکسل مستقر است و از نزدیک با مشتریان در سرتاسر بنلوکس کار می کند. او از زمانی که خیلی جوان بود یک توسعه دهنده بوده و از سن ۷ سالگی شروع به کدنویسی کرد. او یادگیری AI/ML را در دانشگاه شروع کرد و از آن زمان عاشق آن شد.
نیکیفوروس بوتیس یک معمار راه حل در AWS است که از بخش عمومی یونان و قبرس مراقبت می کند و عضوی از جامعه فنی AWS AI/ML است. او از کار با مشتریان در معماری برنامه های کاربردی آنها به روشی انعطاف پذیر، مقیاس پذیر، ایمن و بهینه سازی شده لذت می برد.
- AI
- آی هنر
- مولد هنر ai
- ربات ai
- آمازون SageMaker
- آمازون SageMaker Canvas
- هوش مصنوعی
- گواهی هوش مصنوعی
- هوش مصنوعی در بانکداری
- ربات هوش مصنوعی
- ربات های هوش مصنوعی
- نرم افزار هوش مصنوعی
- آموزش ماشین AWS
- بلاکچین
- کنفرانس بلاک چین ai
- coingenius
- هوش مصنوعی محاوره ای
- کنفرانس کریپتو ai
- دل-ه
- یادگیری عمیق
- گوگل ai
- متوسط (200)
- فراگیری ماشین
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- بازی افلاطون
- PlatoData
- بازی پلاتو
- مقیاس Ai
- نحو
- زفیرنت