با آمازون SageMaker Canvas، داده‌ها را از بیش از 40 منبع داده برای یادگیری ماشینی بدون کد وارد کنید

با آمازون SageMaker Canvas، داده‌ها را از بیش از 40 منبع داده برای یادگیری ماشینی بدون کد وارد کنید

داده ها در قلب یادگیری ماشینی (ML) قرار دارند. گنجاندن داده‌های مرتبط برای نشان دادن همه‌جانبه مشکل کسب‌وکارتان، تضمین می‌کند که شما به‌طور مؤثر روندها و روابط را به‌دست می‌آورید تا بتوانید بینش‌های مورد نیاز برای هدایت تصمیم‌های تجاری را استخراج کنید. با آمازون SageMaker Canvas، اکنون می توانید داده ها را وارد کنید بیش از 40 منبع داده برای ML بدون کد استفاده می شود. Canvas دسترسی به ML را با ارائه یک رابط بصری به تحلیلگران تجاری گسترش می دهد که به آنها امکان می دهد پیش بینی های دقیق ML را به تنهایی ایجاد کنند - بدون نیاز به تجربه ML یا نیاز به نوشتن یک خط کد. اکنون، می‌توانید داده‌های درون برنامه‌ای را از فروشگاه‌های داده‌های رابطه‌ای محبوب مانند آمازون آتنا و همچنین نرم افزار شخص ثالث به عنوان یک سرویس (SaaS) پلت فرم های پشتیبانی شده توسط آمازون AppFlow مانند Salesforce، SAP OData و Google Analytics.

فرآیند جمع‌آوری داده‌های با کیفیت بالا برای ML می‌تواند پیچیده و زمان‌بر باشد، زیرا گسترش برنامه‌های کاربردی SaaS و سرویس‌های ذخیره‌سازی داده باعث گسترش داده‌ها در بسیاری از سیستم‌ها شده است. برای مثال، ممکن است لازم باشد با استفاده از داده‌های مشتری Salesforce، داده‌های مالی SAP و داده‌های لجستیکی Snowflake، تجزیه و تحلیل ریزش مشتری را انجام دهید. برای ایجاد یک مجموعه داده در این منابع، باید به هر برنامه به صورت جداگانه وارد شوید، داده های مورد نظر را انتخاب کنید، و آن را به صورت محلی صادر کنید، جایی که می توان با استفاده از یک ابزار دیگر آن ها را جمع آوری کرد. سپس این مجموعه داده باید به یک برنامه جداگانه برای ML وارد شود.

با این راه‌اندازی، Canvas به شما این امکان را می‌دهد که از داده‌های ذخیره‌شده در منابع متفاوت با پشتیبانی از واردات و تجمیع داده‌های درون‌برنامه از بیش از ۴۰ منبع داده، سرمایه‌گذاری کنید. این ویژگی از طریق اتصال دهنده های بومی جدید به Athena و Amazon AppFlow از طریق امکان پذیر شده است چسب AWS کاتالوگ داده ها Amazon AppFlow یک سرویس مدیریت شده است که به شما امکان می دهد داده ها را از برنامه های SaaS شخص ثالث به صورت ایمن انتقال دهید. سرویس ذخیره سازی ساده آمازون (Amazon S3) و تنها با چند کلیک، داده ها را با کاتالوگ داده فهرست بندی کنید. پس از انتقال داده‌های شما، می‌توانید به سادگی به منبع داده در Canvas دسترسی داشته باشید، جایی که می‌توانید طرح‌واره‌های جدول را مشاهده کنید، جداول را در منابع داده یا بین آنها بپیوندید، درخواست‌های Athena را بنویسید، و داده‌های خود را پیش‌نمایش و وارد کنید. پس از وارد شدن داده‌های شما، می‌توانید از قابلیت‌های Canvas موجود مانند ساخت یک مدل ML، مشاهده داده‌های ضربه ستون یا ایجاد پیش‌بینی استفاده کنید. می‌توانید فرآیند انتقال داده‌ها را در Amazon AppFlow به‌طور خودکار انجام دهید تا بر اساس یک زمان‌بندی فعال شود تا اطمینان حاصل شود که همیشه به آخرین داده‌ها در Canvas دسترسی دارید.

بررسی اجمالی راه حل

مراحل ذکر شده در این پست دو مثال از نحوه وارد کردن داده به Canvas برای ML بدون کد ارائه می دهد. در مثال اول، نحوه وارد کردن داده ها از طریق Athena را نشان می دهیم. در مثال دوم، نحوه وارد کردن داده ها از یک برنامه SaaS شخص ثالث از طریق Amazon AppFlow را نشان می دهیم.

وارد کردن داده ها از آتنا

در این بخش، نمونه‌ای از وارد کردن داده‌ها در Canvas از Athena برای انجام تجزیه و تحلیل بخش‌بندی مشتری را نشان می‌دهیم. ما یک مدل طبقه بندی ML ایجاد می کنیم تا پایگاه مشتریان خود را به چهار کلاس مختلف طبقه بندی کنیم، با هدف نهایی استفاده از مدل برای پیش بینی اینکه یک مشتری جدید در کدام طبقه قرار می گیرد. ما سه مرحله اصلی را دنبال می کنیم: وارد کردن داده ها، آموزش یک مدل و تولید پیش بینی. بیا شروع کنیم.

داده ها را وارد کنید

برای وارد کردن داده ها از Athena، مراحل زیر را انجام دهید:

  1. در کنسول Canvas، را انتخاب کنید مجموعه داده ها در صفحه پیمایش، سپس انتخاب کنید وارد كردن.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. گسترش منبع اطلاعات را انتخاب کنید و انتخاب کنید الههء عقل و زیبایی.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  3. پایگاه داده و جدول صحیحی را که می خواهید از آن وارد کنید، انتخاب کنید. با انتخاب نماد پیش‌نمایش، می‌توانید به صورت اختیاری جدول را پیش‌نمایش کنید.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

تصویر زیر نمونه ای از جدول پیش نمایش را نشان می دهد.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

در مثال ما، مشتریان را بر اساس کانال بازاریابی که از طریق آن خدمات ما را درگیر کرده اند، تقسیم بندی می کنیم. این توسط ستون مشخص شده است segmentation، جایی که A رسانه چاپی، B تلفن همراه، C تبلیغات در فروشگاه و D تلویزیون است.

  1. وقتی از اینکه جدول مناسبی دارید راضی شدید، جدول مورد نظر را به داخل بکشید برای پیوستن، مجموعه داده‌ها را بکشید و رها کنید بخش.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. اکنون می‌توانید به‌صورت اختیاری ستون‌ها را انتخاب یا از حالت انتخاب خارج کنید، با کشیدن جدول دیگری به جدول‌ها به آن‌ها بپیوندید برای پیوستن، مجموعه داده‌ها را بکشید و رها کنید بخش، یا پرس و جوهای SQL را بنویسید تا برش داده خود را مشخص کنید. برای این پست از تمام داده های جدول استفاده می کنیم.
  3. برای وارد کردن داده ها، را انتخاب کنید داده ها را وارد کنید
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

داده‌های شما به‌عنوان مجموعه داده‌ای از جدول خاص در Athena به Canvas وارد می‌شود.

یک مدل تربیت کنید

پس از وارد شدن داده های شما، روی صفحه نمایش داده می شود مجموعه داده ها صفحه در این مرحله می توانید یک مدل بسازید. برای این کار مراحل زیر را انجام دهید:

  1. مجموعه داده خود را انتخاب کرده و انتخاب کنید یک مدل ایجاد کنید.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. برای نام مدل، نام مدل خود را وارد کنید (برای این پست، my_first_model).
  3. Canvas شما را قادر می سازد تا مدل هایی برای تجزیه و تحلیل پیش بینی، تجزیه و تحلیل تصویر و تجزیه و تحلیل متن ایجاد کنید. چون می خواهیم مشتریان را دسته بندی کنیم، انتخاب کنید تحلیل پیش بینی برای نوع مشکل.
  4. برای ادامه، انتخاب کنید ساختن.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

بر ساختن در صفحه، می توانید آمار مربوط به مجموعه داده های خود را مشاهده کنید، مانند درصد مقادیر از دست رفته و میانگین داده ها.

  1. برای ستون هدف، یک ستون را انتخاب کنید (برای این پست، segmentation).
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Canvas دو نوع مدل ارائه می دهد که می توانند پیش بینی ایجاد کنند. ساخت سریع سرعت را بر دقت اولویت قرار می دهد و مدلی را در 2 تا 15 دقیقه ارائه می دهد. ساخت استاندارد دقت را بر سرعت اولویت می‌دهد و یک مدل را در 2 تا 4 ساعت ارائه می‌کند.

  1. برای این پست، انتخاب کنید ساخت سریع.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. پس از آموزش مدل، می توانید دقت مدل را تجزیه و تحلیل کنید.

مدل زیر در 94.67 درصد مواقع مشتریان را به درستی دسته بندی می کند.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. همچنین می توانید به صورت اختیاری مشاهده کنید که هر ستون چگونه بر طبقه بندی تأثیر می گذارد. در این مثال، با افزایش سن مشتری، ستون تأثیر کمتری بر طبقه بندی دارد. برای ایجاد پیش بینی با مدل جدید خود، انتخاب کنید پیش بینی.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

پیش بینی ایجاد کنید

بر پیش بینی تب، می‌توانید هم پیش‌بینی‌های دسته‌ای و هم پیش‌بینی‌های تکی ایجاد کنید. مراحل زیر را کامل کنید:

  1. برای این پست، انتخاب کنید پیش بینی واحد برای درک اینکه تقسیم بندی مشتری چه نتیجه ای برای یک مشتری جدید خواهد داشت.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

برای پیش‌بینی‌مان، می‌خواهیم بفهمیم که یک مشتری اگر 32 سال سن داشته باشد و یک وکیل حرفه‌ای باشد، چه بخش‌بندی خواهد شد.

  1. مقادیر مربوطه را با این ورودی ها جایگزین کنید.
  2. را انتخاب کنید بروزرسانی.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

پیش بینی به روز شده در پنجره پیش بینی نمایش داده می شود. در این مثال، یک وکیل 32 ساله در بخش D طبقه بندی می شود.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

داده ها را از یک برنامه SaaS شخص ثالث به AWS وارد کنید

برای وارد کردن داده‌ها از برنامه‌های SaaS شخص ثالث به Canvas برای ML بدون کد، ابتدا باید داده‌ها را از طریق Amazon AppFlow به Amazon S3 منتقل کنید. در این مثال، ما داده های تولید را از SAP OData انتقال می دهیم.

برای انتقال اطلاعات خود مراحل زیر را انجام دهید:

  1. در کنسول AppFlow آمازون، را انتخاب کنید جریان ایجاد کنید.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. برای نام جریان، یک نام وارد کنید.
  3. را انتخاب کنید بعدی.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  4. برای نام منبع، برنامه SaaS شخص ثالث مورد نظر خود را انتخاب کنید (برای این پست، SAP OData).
  5. را انتخاب کنید اتصال جدید ایجاد کنید.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  6. در به SAP OData متصل شوید پنجره پاپ آپ، جزئیات احراز هویت را پر کنید و انتخاب کنید اتصال.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  7. برای شیء SAP OData، شیء حاوی داده های شما را در SAP OData انتخاب کنید.
  8. برای نام مقصد، انتخاب کنید آمازون S3.
  9. برای جزئیات سطل، جزئیات سطل S3 خود را مشخص کنید.
  10. انتخاب کنید داده های خود را در کاتالوگ داده چسب AWS فهرست کنید.
  11. برای نقش کاربر، انتخاب هویت AWS و مدیریت دسترسی نقش (IAM) که کاربر Canvas برای دسترسی به داده ها از آن استفاده می کند.
  12. برای ماشه جریان، انتخاب کنید اجرا بر اساس تقاضا.

همچنین، می‌توانید با انتخاب کردن، انتقال جریان را خودکار کنید جریان را طبق برنامه اجرا کنید.

  1. را انتخاب کنید بعدی.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. نحوه نگاشت فیلدها را انتخاب کنید و نقشه برداری فیلد را تکمیل کنید. برای این پست، چون پایگاه داده مقصد مربوطه برای نقشه برداری وجود ندارد، نیازی به تعیین نقشه نیست.
  3. را انتخاب کنید بعدی.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  4. به صورت اختیاری، در صورت لزوم فیلترهایی را برای محدود کردن انتقال داده اضافه کنید.
  5. را انتخاب کنید بعدی.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  6. جزئیات خود را بررسی کرده و انتخاب کنید جریان ایجاد کنید.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

هنگامی که جریان ایجاد می شود، یک روبان سبز رنگ در بالای صفحه پر می شود که نشان می دهد با موفقیت به روز شده است.

  1. را انتخاب کنید جریان را اجرا کنید.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

در این مرحله شما با موفقیت اطلاعات خود را از SAP OData به Amazon S3 منتقل کرده اید.

اکنون می توانید داده ها را از داخل برنامه Canvas وارد کنید. برای وارد کردن داده‌های خود از Canvas، همان مجموعه مراحلی را که در توضیح داده شده است دنبال کنید وارد کردن اطلاعات بخش قبلی در این پست برای این مثال، در منبع اطلاعات منوی کشویی در وارد کردن اطلاعات صفحه، می توانید ببینید SAP OData ذکر شده.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

اکنون می‌توانید از تمام قابلیت‌های Canvas موجود، مانند تمیز کردن داده‌های خود، ساختن یک مدل ML، مشاهده داده‌های ضربه ستون و ایجاد پیش‌بینی استفاده کنید.

پاک کردن

برای پاک کردن منابع ارائه شده، با انتخاب از برنامه Canvas خارج شوید ورود به در صفحه ناوبری

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

نتیجه

با Canvas، اکنون می توانید داده ها را برای ML بدون کد از 47 منبع داده از طریق اتصال دهنده های بومی با Athena و Amazon AppFlow از طریق کاتالوگ داده چسب AWS وارد کنید. این فرآیند به شما امکان می‌دهد پس از انتقال داده‌ها از طریق Amazon AppFlow، مستقیماً به داده‌ها در منابع داده در Canvas دسترسی داشته باشید و آنها را جمع آوری کنید. می‌توانید انتقال داده‌ها را به‌طور خودکار انجام دهید تا براساس یک زمان‌بندی فعال شود، به این معنی که لازم نیست دوباره این فرآیند را برای به‌روزرسانی داده‌های خود انجام دهید. با این فرآیند، می توانید مجموعه داده های جدیدی را با آخرین داده های خود بدون نیاز به ترک برنامه Canvas ایجاد کنید. این ویژگی اکنون در همه مناطق AWS که Canvas در دسترس است در دسترس است. برای شروع وارد کردن داده های خود، به کنسول Canvas بروید و مراحل ذکر شده در این پست را دنبال کنید. برای کسب اطلاعات بیشتر به ادامه مطلب مراجعه نمایید به منابع داده متصل شوید.


درباره نویسندگان

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.براندون نیر مدیر محصول ارشد آمازون SageMaker Canvas است. علاقه حرفه ای او در ایجاد خدمات و برنامه های کاربردی یادگیری ماشین مقیاس پذیر است. خارج از محل کار او را می توان در حال کاوش در پارک های ملی، تکمیل تاب گلف خود یا برنامه ریزی یک سفر ماجراجویی یافت.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.سانجانا کامبالاپالی یک مدیر توسعه نرم افزار برای AWS Sagemaker Canvas است که هدف آن دموکراتیزه کردن یادگیری ماشین با ایجاد برنامه های کاربردی بدون کد ML است.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.شین خو یک مهندس توسعه نرم‌افزار در تیم Canvas است، جایی که او بر روی آماده‌سازی داده‌ها، از جمله جنبه‌های دیگر در محصولات یادگیری ماشین بدون کد کار می‌کند. او در اوقات فراغت خود از دویدن، مطالعه و تماشای فیلم لذت می برد.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.ولکان اونسال یک مهندس فرانت اند پدر در تیم Canvas است، جایی که او محصولاتی بدون کد می سازد تا هوش مصنوعی را در دسترس انسان قرار دهد. او در اوقات فراغت خود از دویدن، مطالعه، تماشای ورزش های الکترونیکی و هنرهای رزمی لذت می برد.

تمبر زمان:

بیشتر از آموزش ماشین AWS