Amazon SageMaker Autopilot به طور خودکار بهترین مدل های یادگیری ماشینی (ML) را بر اساس داده های شما می سازد، آموزش می دهد و تنظیم می کند، در حالی که به شما امکان می دهد کنترل و دید کامل را حفظ کنید. اخیرا اعلام کرده ایم پشتیبانی از داده های سری زمانی در Autopilot. می توانید از Autopilot برای مقابله با وظایف رگرسیون و طبقه بندی در داده های سری زمانی یا به طور کلی داده های توالی استفاده کنید. دادههای سری زمانی نوع خاصی از دادههای دنبالهای هستند که در آن نقاط داده در فواصل زمانی زوج جمعآوری میشوند.
تهیه دستی دادهها، انتخاب مدل ML مناسب و بهینهسازی پارامترهای آن، حتی برای یک متخصص متخصص، کار پیچیدهای است. اگرچه رویکردهای خودکاری وجود دارد که میتواند بهترین مدلها و پارامترهای آنها را پیدا کند، اما معمولاً نمیتوانند دادههایی را که به صورت توالی ارائه میشوند، مانند ترافیک شبکه، مصرف برق، یا هزینههای خانوار ثبتشده در طول زمان، مدیریت کنند. از آنجایی که این داده ها به شکل مشاهداتی هستند که در مقاطع زمانی مختلف به دست می آیند، مشاهدات متوالی را نمی توان مستقل از یکدیگر در نظر گرفت و نیاز به پردازش به عنوان یک کل دارد. شما می توانید از Autopilot برای طیف گسترده ای از مشکلات مربوط به داده های متوالی استفاده کنید. به عنوان مثال، می توانید ترافیک شبکه ثبت شده در طول زمان را برای شناسایی فعالیت های مخرب طبقه بندی کنید، یا تعیین کنید که آیا افراد واجد شرایط وام مسکن بر اساس سابقه اعتباری خود هستند یا خیر. شما یک مجموعه داده حاوی داده های سری زمانی ارائه می دهید و Autopilot بقیه را مدیریت می کند، داده های متوالی را از طریق تبدیل ویژگی های تخصصی پردازش می کند و بهترین مدل را از طرف شما پیدا می کند.
اتوپایلوت سنگینی مدلهای ML را حذف میکند و به شما کمک میکند بهترین مدل ML را بر اساس دادههای خود بهطور خودکار بسازید، آموزش دهید و تنظیم کنید. Autopilot چندین الگوریتم را روی دادههای شما اجرا میکند و فراپارامترهای آنها را روی یک زیرساخت محاسباتی کاملاً مدیریت شده تنظیم میکند. در این پست نشان می دهیم که چگونه می توانید استفاده کنید خلبان اتوماتیک برای حل مسائل طبقه بندی و رگرسیون در داده های سری زمانی. برای دستورالعمل های مربوط به ایجاد و آموزش یک مدل Autopilot، نگاه کنید به پیش بینی ریزش مشتری با آمازون SageMaker Autopilot.
طبقه بندی داده های سری زمانی با استفاده از Autopilot
به عنوان یک مثال در حال اجرا، یک مسئله چند کلاسه را در سری زمانی در نظر می گیریم مجموعه داده UWaveGestureLibraryX، حاوی قرائت مساوی حسگرهای شتاب سنج در حین انجام یکی از هشت حرکت دست از پیش تعریف شده است. برای سادگی، ما فقط بعد X شتاب سنج را در نظر می گیریم. وظیفه ساخت یک مدل طبقه بندی برای نگاشت داده های سری زمانی از خوانش حسگر به حرکات از پیش تعریف شده است. شکل زیر اولین ردیف های مجموعه داده را با فرمت CSV نشان می دهد. کل جدول از 896 ردیف و دو ستون تشکیل شده است: ستون اول یک برچسب اشاره و ستون دوم یک سری زمانی از خوانش حسگر است.
با Amazon SageMaker Data Wrangler داده ها را به فرمت مناسب تبدیل کنید
علاوه بر پذیرش ستونهای متنی عددی، طبقهبندی و استاندارد، Autopilot اکنون یک ستون ورودی دنباله را نیز میپذیرد. اگر دادههای سری زمانی شما از این قالب پیروی نمیکنند، میتوانید به راحتی آن را از طریق تبدیل کنید Amazon SageMaker Data Rangler. Data Wrangler زمان جمعآوری و آمادهسازی دادهها برای ML را از هفتهها به دقیقه کاهش میدهد. با Data Wrangler، میتوانید فرآیند آمادهسازی دادهها و مهندسی ویژگیها را ساده کنید و هر مرحله از گردش کار آمادهسازی دادهها، از جمله انتخاب داده، پاکسازی، کاوش، و تجسم را از یک رابط بصری کامل کنید. به عنوان مثال، یک مجموعه داده را در نظر بگیرید اما در قالب ورودی متفاوت: هر حرکت (که توسط ID مشخص شده است) دنباله ای از اندازه گیری های مساوی شتاب سنج است. هنگامی که به صورت عمودی ذخیره می شود، هر ردیف حاوی یک مهر زمانی و یک مقدار است. شکل زیر این داده ها را در قالب اصلی و یک فرمت توالی مقایسه می کند.
برای تبدیل این مجموعه داده به قالبی که قبلاً با استفاده از Data Wrangler توضیح داده شد، مجموعه داده را از آن بارگیری کنید سرویس ذخیره سازی ساده آمازون (Amazon S3). سپس از سری زمانی گروه با تبدیلهمانطور که در تصویر زیر نشان داده شده است، و داده ها را در قالب CSV به Amazon S3 برگردانید.
هنگامی که مجموعه داده در قالب تعیین شده خود است، می توانید با Autopilot ادامه دهید. برای بررسی سایر ترانسفورماتورهای سری زمانی Data Wrangler مراجعه کنید داده های سری زمانی را با Amazon SageMaker Data Wrangler آماده کنید.
یک کار AutoML را راه اندازی کنید
مانند سایر انواع ورودی که توسط Autopilot پشتیبانی می شوند، هر ردیف از مجموعه داده یک مشاهده متفاوت است و هر ستون یک ویژگی است. در این مثال، ما یک ستون داریم که حاوی داده های سری زمانی است، اما شما می توانید چندین ستون سری زمانی داشته باشید. همچنین می توانید چندین ستون با انواع ورودی های مختلف مانند سری های زمانی، متنی و عددی داشته باشید.
به یک آزمایش خلبان خودکار ایجاد کنید، مجموعه داده را در یک سطل S3 قرار دهید و یک آزمایش جدید در آن ایجاد کنید Amazon SageMaker Studio. همانطور که در تصویر زیر نشان داده شده است، باید نام آزمایش، مکان S3 مجموعه داده، مکان S3 برای مصنوعات خروجی و نام ستون را برای پیش بینی مشخص کنید.
خلبان خودکار داده ها را تجزیه و تحلیل می کند، خطوط لوله ML را تولید می کند، و 250 تکرار پیش فرض از بهینه سازی هایپرپارامتر را در این کار طبقه بندی اجرا می کند. همانطور که در جدول امتیازات مدل زیر نشان داده شده است، Autopilot به دقت 0.821 می رسد و شما می توانید بهترین مدل را تنها با یک کلیک اجرا کنید.
علاوه بر این، Autopilot یک a را تولید می کند گزارش اکتشاف داده، جایی که می توانید داده های خود را تجسم و کاوش کنید.
شفافیت برای Autopilot اساسی است. می توانید خطوط لوله ML تولید شده را در دفترچه یادداشت تعریف کاندید بررسی و اصلاح کنید. تصویر زیر نشان می دهد که چگونه Autopilot طیف وسیعی از خطوط لوله را با ترکیب ترانسفورماتور سری زمانی توصیه می کند TSFeatureExtractor
با الگوریتمهای مختلف ML، مانند درختهای تصمیم تقویتشده با گرادیان و مدلهای خطی. را TSFeatureExtractor
صدها ویژگی سری زمانی را برای شما استخراج می کند، که سپس برای پیش بینی به الگوریتم های پایین دستی داده می شود. برای لیست کامل ویژگی های سری زمانی، به مروری بر ویژگی های استخراج شده.
نتیجه
در این پست، نحوه استفاده از SageMaker Autopilot را برای حل مشکلات طبقهبندی سری زمانی و رگرسیون تنها با چند کلیک نشان دادیم.
برای اطلاعات بیشتر در مورد Autopilot، نگاه کنید Amazon SageMaker Autopilot. برای کشف ویژگی های مرتبط SageMaker، رجوع کنید به Amazon SageMaker Data Rangler.
درباره نویسنده
نیکیتا ایوکین یک دانشمند کاربردی، Amazon SageMaker Data Wrangler است.
آن میلبرت یک مهندس توسعه نرم افزار است که در Amazon SageMaker Automatic Model Tuning کار می کند.
والریو پرونه یک مدیر علوم کاربردی است که روی تنظیم خودکار مدل و خلبان خودکار Amazon SageMaker کار می کند.
مگانا ساتیش یک مهندس توسعه نرم افزار است که در Amazon SageMaker Automatic Model Tuning کار می کند.
علی تکبیری یک معمار راه حل متخصص AI/ML است و با استفاده از یادگیری ماشینی به مشتریان کمک می کند تا چالش های تجاری خود را در AWS Cloud حل کنند.
- "
- 100
- درباره ما
- به دست آورد
- فعالیت ها
- الگوریتم
- اجازه دادن
- هر چند
- آمازون
- اعلام کرد
- خودکار
- AWS
- بهترین
- تقویت شده
- ساختن
- بنا
- می سازد
- کسب و کار
- چالش ها
- طبقه بندی
- ابر
- ستون
- پیچیده
- محاسبه
- متوالی
- مصرف
- شامل
- کنترل
- ایجاد
- اعتبار
- مشتریان
- داده ها
- معامله
- گسترش
- پروژه
- مختلف
- بعد
- نمی کند
- به آسانی
- برق
- مهندس
- مهندسی
- مثال
- مخارج
- تجربه
- اکتشاف
- عصاره ها
- ویژگی
- امکانات
- تغذیه
- شکل
- نام خانوادگی
- به دنبال
- پیروی
- فرم
- قالب
- کامل
- سوالات عمومی
- گروه
- کمک می کند
- تاریخ
- خانواده
- چگونه
- چگونه
- HTTPS
- صدها نفر
- شناسایی
- از جمله
- اطلاعات
- شالوده
- رابط
- IT
- یادگیری
- لینک
- فهرست
- بار
- محل
- دستگاه
- فراگیری ماشین
- مدیر
- نقشه
- ML
- مدل
- مدل
- شبکه
- ترافیک شبکه
- دفتر یادداشت
- بهینه سازی
- دیگر
- پیش گویی
- پیش بینی
- مشکل
- مشکلات
- روند
- ارائه
- محدوده
- توصیه می کند
- REST
- در حال اجرا
- علم
- دانشمند
- سلسله
- ساده
- نرم افزار
- توسعه نرم افزار
- مزایا
- حل
- تخصصی
- ذخیره سازی
- پشتیبانی
- پشتیبانی از
- وظایف
- از طریق
- زمان
- بالا
- ترافیک
- آموزش
- قطار
- استفاده کنید
- ارزش
- دید
- تجسم
- در داخل
- کارگر
- X