استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون

ما هیجان زده هستیم که راه اندازی را اعلام کنیم Amazon DocumentDB (با سازگاری MongoDB) ادغام با آمازون SageMaker Canvas، به مشتریان DocumentDB آمازون اجازه می دهد تا راه حل های مولد هوش مصنوعی و یادگیری ماشین (ML) را بدون نوشتن کد بسازند و استفاده کنند. Amazon DocumentDB یک پایگاه داده بومی JSON کاملاً مدیریت شده است که اجرای بارهای کاری اسناد مهم را در هر مقیاسی بدون مدیریت زیرساخت ساده و مقرون به صرفه می کند. آمازون SageMaker Canvas یک فضای کاری ML بدون کد است که مدل‌های آماده استفاده از جمله مدل‌های پایه و توانایی تهیه داده‌ها و ساخت و استقرار مدل‌های سفارشی را ارائه می‌دهد.

در این پست، نحوه وارد کردن داده‌های ذخیره شده در Amazon DocumentDB به بوم SageMaker و استفاده از آن داده‌ها برای ساخت مدل‌های ML برای تجزیه و تحلیل پیش‌بینی‌کننده بحث می‌کنیم. بدون ایجاد و حفظ خطوط لوله داده، می‌توانید مدل‌های ML را با داده‌های بدون ساختار ذخیره‌شده در Amazon DocumentDB قدرت دهید.

بررسی اجمالی راه حل

بیایید نقش یک تحلیلگر تجاری را برای یک شرکت تحویل غذا فرض کنیم. برنامه تلفن همراه شما به دلیل مقیاس پذیری و قابلیت های طرحواره انعطاف پذیر، اطلاعات رستوران ها را در Amazon DocumentDB ذخیره می کند. شما می‌خواهید بینش‌هایی درباره این داده‌ها جمع‌آوری کنید و یک مدل ML بسازید تا پیش‌بینی کنید که رستوران‌های جدید چگونه رتبه‌بندی می‌شوند، اما انجام تجزیه و تحلیل بر روی داده‌های بدون ساختار را به چالش می‌کشید. شما با تنگناهایی روبرو می شوید زیرا برای دستیابی به این اهداف باید به تیم های مهندسی داده و علم داده تکیه کنید.

این ادغام جدید با ساده‌سازی داده‌های Amazon DocumentDB به بوم SageMaker و بلافاصله شروع به آماده‌سازی و تجزیه و تحلیل داده‌ها برای ML، این مشکلات را حل می‌کند. علاوه بر این، SageMaker Canvas وابستگی به تخصص ML را برای ساخت مدل‌های با کیفیت بالا و ایجاد پیش‌بینی حذف می‌کند.

ما نحوه استفاده از داده‌های Amazon DocumentDB برای ساخت مدل‌های ML در SageMaker Canvas را در مراحل زیر نشان می‌دهیم:

  1. یک رابط آمازون DocumentDB در SageMaker Canvas ایجاد کنید.
  2. تجزیه و تحلیل داده ها با استفاده از هوش مصنوعی.
  3. داده ها را برای یادگیری ماشین آماده کنید.
  4. یک مدل بسازید و پیش بینی ایجاد کنید.

پیش نیازها

برای اجرای این راه حل، پیش نیازهای زیر را تکمیل کنید:

  1. دسترسی سرپرست AWS Cloud را با یک هویت AWS و مدیریت دسترسی (من هستم) کاربر با مجوزهای لازم برای تکمیل ادغام.
  2. با استفاده از تنظیمات محیط را کامل کنید AWS CloudFormation از طریق یکی از گزینه های زیر:
    1. یک الگوی CloudFormation را در یک VPC جدید مستقر کنید – این گزینه یک محیط AWS جدید می سازد که شامل VPC، زیرشبکه های خصوصی، گروه های امنیتی، نقش های اجرایی IAM است، آمازون کلود 9, نقاط پایانی VPC مورد نیازو دامنه SageMaker. سپس Amazon DocumentDB را در این VPC جدید مستقر می کند. دانلود کنید قالب یا با انتخاب سریع، پشته CloudFormation را راه اندازی کنید Stack را راه اندازی کنید:
      پشته CloudFormation را راه اندازی کنید
    2. یک الگوی CloudFormation را در VPC موجود مستقر کنید – این گزینه نقاط پایانی VPC، نقش های اجرای IAM و دامنه SageMaker را در یک VPC موجود با زیرشبکه های خصوصی ایجاد می کند. دانلود کنید قالب یا با انتخاب سریع، پشته CloudFormation را راه اندازی کنید Stack را راه اندازی کنید:
      پشته CloudFormation را راه اندازی کنید

توجه داشته باشید که اگر یک دامنه جدید SageMaker ایجاد می‌کنید، باید دامنه را طوری پیکربندی کنید که در VPC خصوصی بدون دسترسی به اینترنت باشد تا بتوانید کانکتور را به Amazon DocumentDB اضافه کنید. برای کسب اطلاعات بیشتر به ادامه مطلب مراجعه نمایید Amazon SageMaker Canvas را در VPC بدون دسترسی به اینترنت پیکربندی کنید.

  1. دنبال آموزش برای بارگیری داده های نمونه رستوران در Amazon DocumentDB.
  2. دسترسی به Amazon Bedrock و مدل Anthropic Claude را در آن اضافه کنید. برای اطلاعات بیشتر ببین دسترسی مدل را اضافه کنید.

یک رابط آمازون DocumentDB در SageMaker Canvas ایجاد کنید

پس از ایجاد دامنه SageMaker، مراحل زیر را انجام دهید:

  1. در کنسول DocumentDB آمازون، را انتخاب کنید یادگیری ماشین بدون کد در صفحه ناوبری
  2. تحت دامنه و نمایه را انتخاب کنید¸ دامنه SageMaker و نمایه کاربری خود را انتخاب کنید.
  3. را انتخاب کنید Canvas را اجرا کنید برای راه اندازی SageMaker Canvas در یک برگه جدید.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

وقتی بارگیری SageMaker Canvas به پایان رسید، روی آن فرود خواهید آمد جریان اطلاعات تب.

  1. را انتخاب کنید ساختن برای ایجاد یک جریان داده جدید
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.
  2. یک نام برای جریان داده خود وارد کنید و انتخاب کنید ساختن.
  3. با انتخاب یک اتصال جدید Amazon DocumentDB اضافه کنید وارد کردن داده، پس از آن را انتخاب کنید جدولی برای نوع مجموعه داده.
  4. بر وارد کردن داده صفحه، برای منبع اطلاعات، انتخاب کنید DocumentDB و افزودن اتصال.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.
  5. یک نام اتصال مانند نسخه آزمایشی وارد کنید و خوشه آمازون DocumentDB مورد نظر خود را انتخاب کنید.

توجه داشته باشید که SageMaker Canvas منوی کشویی را با کلاسترهایی در همان VPC دامنه SageMaker شما پر می کند.

  1. نام کاربری، رمز عبور و نام پایگاه داده را وارد کنید.
  2. در نهایت، اولویت خواندن خود را انتخاب کنید.

برای محافظت از عملکرد نمونه های اولیه، SageMaker Canvas به طور پیش فرض روی دوم، به این معنی که فقط از نمونه های ثانویه خوانده می شود. وقتی خواندن ترجیح داده می شود ثانویه ترجیح داده می شودSageMaker Canvas از نمونه های ثانویه موجود می خواند، اما اگر نمونه ثانویه در دسترس نباشد، از نمونه اولیه می خواند. برای اطلاعات بیشتر در مورد نحوه پیکربندی اتصال DocumentDB آمازون، به بخش مراجعه کنید به یک پایگاه داده ذخیره شده در AWS متصل شوید.

  1. را انتخاب کنید اتصال را اضافه کنید.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

اگر اتصال موفقیت آمیز باشد، مجموعه هایی را در پایگاه داده DocumentDB آمازون خود خواهید دید که به صورت جداول نشان داده شده اند.

  1. جدول انتخابی خود را روی بوم خالی بکشید. برای این پست، داده‌های رستوران خود را اضافه می‌کنیم.

100 ردیف اول به عنوان پیش نمایش نمایش داده می شود.

  1. برای شروع تجزیه و تحلیل و آماده سازی داده های خود، را انتخاب کنید وارد کردن داده.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.
  2. نام مجموعه داده را وارد کرده و انتخاب کنید وارد کردن داده.

تجزیه و تحلیل داده ها با استفاده از هوش مصنوعی

در مرحله بعد، می‌خواهیم اطلاعاتی در مورد داده‌های خود به دست آوریم و به دنبال الگوها باشیم. SageMaker Canvas یک رابط زبان طبیعی برای تجزیه و تحلیل و آماده سازی داده ها فراهم می کند. وقتی که داده ها برگه بارگیری می شود، می توانید با مراحل زیر چت را با داده های خود شروع کنید:

  1. را انتخاب کنید چت برای آماده سازی داده.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.
  2. با پرسیدن سوالاتی مانند نمونه هایی که در اسکرین شات های زیر نشان داده شده اند، اطلاعاتی درباره داده های خود جمع آوری کنید.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

برای کسب اطلاعات بیشتر در مورد نحوه استفاده از زبان طبیعی برای کاوش و تهیه داده ها، مراجعه کنید با قابلیت جدید Amazon SageMaker Canvas از زبان طبیعی برای کاوش و آماده سازی داده ها استفاده کنید.

بیایید با استفاده از گزارش کیفیت داده‌ها و Insights Canvas SageMaker که به‌طور خودکار کیفیت داده‌ها را ارزیابی می‌کند و ناهنجاری‌ها را شناسایی می‌کند، درک عمیق‌تری از کیفیت داده‌های خود به دست آوریم.

  1. بر تجزیه و تحلیل برگه ، انتخاب کنید گزارش کیفیت داده و بینش.
  2. را انتخاب کنید rating به عنوان ستون هدف و رگرسیون به عنوان نوع مشکل، سپس انتخاب کنید ساختن.

این آموزش مدل‌سازی را شبیه‌سازی می‌کند و بینش‌هایی در مورد اینکه چگونه می‌توانیم داده‌هایمان را برای یادگیری ماشین بهبود دهیم، ارائه می‌کند. گزارش کامل در چند دقیقه تولید می شود.

گزارش ما نشان می‌دهد که 2.47 درصد از ردیف‌های هدف ما دارای مقادیر گم شده‌اند — در مرحله بعد به آن خواهیم پرداخت. علاوه بر این، تجزیه و تحلیل نشان می دهد که address line 2, nameو type_of_food ویژگی ها بیشترین قدرت پیش بینی را در داده های ما دارند. این نشان می دهد که اطلاعات اولیه رستوران مانند مکان و غذا ممکن است تأثیر زیادی بر رتبه بندی داشته باشد.

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

داده ها را برای یادگیری ماشین آماده کنید

SageMaker Canvas بیش از 300 تبدیل داخلی را برای آماده سازی داده های وارد شده شما ارائه می دهد. برای کسب اطلاعات بیشتر در مورد ویژگی های تبدیل SageMaker Canvas، مراجعه کنید داده ها را با تبدیل های پیشرفته آماده کنید. بیایید برخی از تبدیل ها را اضافه کنیم تا داده های خود را برای آموزش یک مدل ML آماده کنیم.

  1. به عقب برگردید گردش داده ها با انتخاب نام جریان داده خود در بالای صفحه، صفحه را انتخاب کنید.
  2. علامت مثبت کناری را انتخاب کنید انواع داده ها و انتخاب کنید تبدیل را اضافه کنید.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.
  3. را انتخاب کنید مرحله اضافه کنید.
  4. بیایید نام را تغییر دهیم address line 2 ستون به cities.
    1. را انتخاب کنید ستون ها را مدیریت کنید.
    2. را انتخاب کنید تغییر نام ستون برای دگرگون کردن.
    3. را انتخاب کنید address line 2 برای ستون ورودی، وارد cities برای نام جدید، و انتخاب کنید اضافه کردن.
      استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.
  5. علاوه بر این، اجازه می دهد تعدادی از ستون های غیر ضروری را رها کنیم.
    1. یک تبدیل جدید اضافه کنید.
    2. برای دگرگون کردن، انتخاب کنید رها کردن ستون.
    3. برای ستون هایی برای رها کردن، انتخاب کنید URL و restaurant_id.
    4. را انتخاب کنید اضافه کردن.
      استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.[
  6. rating ستون ویژگی مقداری از دست رفته دارد، بنابراین بیایید آن سطرها را با مقدار متوسط ​​این ستون پر کنیم.
    1. یک تبدیل جدید اضافه کنید.
    2. برای دگرگون کردن، انتخاب کنید نسبت دادن.
    3. برای نوع ستون، انتخاب کنید عددی.
    4. برای ستون های ورودی، انتخاب rating ستون.
    5. برای استراتژی استناد، انتخاب کنید منظور داشتن.
    6. برای ستون خروجی، وارد rating_avg_filled.
    7. را انتخاب کنید اضافه کردن.
      استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.
  7. ما می توانیم رها کنیم rating ستون چون یک ستون جدید با مقادیر پر شده داریم.
  8. زیرا type_of_food ماهیت مقوله ای دارد، ما می خواهیم آن را به صورت عددی رمزگذاری کنیم. بیایید این ویژگی را با استفاده از تکنیک رمزگذاری یک داغ رمزگذاری کنیم.
    1. یک تبدیل جدید اضافه کنید.
    2. برای دگرگون کردن، انتخاب کنید یک کدگذاری داغ.
    3. برای ستون های ورودی، را انتخاب کنید type_of_food.
    4. برای استراتژی مدیریت نامعتبرانتخاب کنید نگاه داشتن.
    5. برای سبک خروجیانتخاب کنید ستون ها.
    6. برای ستون خروجی، وارد encoded.
    7. را انتخاب کنید اضافه کردن.
      استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

یک مدل بسازید و پیش بینی ایجاد کنید

اکنون که داده‌های خود را تغییر داده‌ایم، بیایید یک مدل ML عددی برای پیش‌بینی رتبه‌بندی رستوران‌ها آموزش دهیم.

  1. را انتخاب کنید مدل ایجاد کنید.
  2. برای نام مجموعه داده، یک نام برای صادرات مجموعه داده وارد کنید.
  3. را انتخاب کنید صادرات و صبر کنید تا داده های تبدیل شده صادر شوند.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.
  4. انتخاب مدل ایجاد کنید لینک در گوشه سمت چپ پایین صفحه

همچنین می توانید مجموعه داده را از ویژگی Data Wrangler در سمت چپ صفحه انتخاب کنید.

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

  1. نام مدل را وارد کنید
  2. را انتخاب کنید تحلیل پیش بینی، پس از آن را انتخاب کنید ساختن.
  3. را انتخاب کنید rating_avg_filled به عنوان ستون هدف

SageMaker Canvas به طور خودکار یک نوع مدل مناسب را انتخاب می کند.

  1. را انتخاب کنید مدل پیش نمایش برای اطمینان از اینکه مشکلی در کیفیت داده وجود ندارد.
  2. را انتخاب کنید ساخت سریع برای ساختن مدل.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

ایجاد مدل تقریباً 2 تا 15 دقیقه طول خواهد کشید.

می توانید وضعیت مدل را پس از پایان آموزش مدل مشاهده کنید. مدل ما دارای RSME 0.422 است، به این معنی که مدل اغلب رتبه‌بندی یک رستوران را در محدوده +/- 0.422 از مقدار واقعی پیش‌بینی می‌کند، که یک تقریب کامل برای مقیاس رتبه‌بندی 1-6 است.

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

  1. در نهایت، می‌توانید با پیمایش به پیش‌بینی‌های نمونه تولید کنید پیش بینی تب.
    استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

پاک کردن

برای جلوگیری از تحمیل هزینه‌های بعدی، منابعی را که هنگام دنبال کردن این پست ایجاد کرده‌اید حذف کنید. SageMaker Canvas برای مدت جلسه صورتحساب شما را دریافت می کند، و توصیه می کنیم زمانی که از SageMaker Canvas استفاده نمی کنید از سیستم خارج شوید. رجوع شود به خروج از Amazon SageMaker Canvas برای جزئیات بیشتر.

نتیجه

در این پست، نحوه استفاده از SageMaker Canvas برای هوش مصنوعی و ML را با داده های ذخیره شده در Amazon DocumentDB مورد بحث قرار دادیم. در مثال خود، نشان دادیم که چگونه یک تحلیلگر می تواند به سرعت یک مدل ML با کیفیت بالا با استفاده از مجموعه داده های رستوران نمونه بسازد.

ما مراحل اجرای راه حل را نشان دادیم، از وارد کردن داده ها از Amazon DocumentDB تا ساخت یک مدل ML در SageMaker Canvas. کل فرآیند از طریق یک رابط بصری بدون نوشتن یک خط کد تکمیل شد.

برای شروع سفر ML کم‌کد/بدون کد، به آمازون SageMaker Canvas.


درباره نویسندگان

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.آدلکه کوکر یک معمار راه حل های جهانی با AWS است. او با مشتریان در سطح جهانی کار می کند تا راهنمایی و کمک فنی در به کارگیری بارهای کاری تولید در مقیاس در AWS ارائه دهد. او در اوقات فراغت خود از یادگیری، مطالعه، بازی و تماشای رویدادهای ورزشی لذت می برد.

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai. گورورج س بایاری یک معمار ارشد راه حل های تخصصی DocumentDB در AWS است. او از کمک به مشتریان برای استفاده از پایگاه های داده هدفمند آمازون لذت می برد. او به مشتریان در طراحی، ارزیابی و بهینه‌سازی مقیاس اینترنت و حجم کاری با کارایی بالا که توسط NoSQL و/یا پایگاه‌های داده رابطه‌ای ارائه می‌شود، کمک می‌کند.

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.تیم پوساتری مدیر محصول ارشد در AWS است که در Amazon SageMaker Canvas کار می کند. هدف او این است که به مشتریان کمک کند تا به سرعت از AI/ML ارزش بگیرند. خارج از محل کار، او دوست دارد در فضای باز باشد، گیتار بزند، موسیقی زنده ببیند، و وقت خود را با خانواده و دوستان بگذراند.

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.پراتیک داس مدیر محصول در AWS است. او از کار با مشتریانی که به دنبال ایجاد حجم کاری انعطاف‌پذیر و پایه‌های داده قوی در فضای ابری هستند، لذت می‌برد. او تخصص کار با شرکت ها را در زمینه نوسازی، ابتکارات تحلیلی و تبدیل داده به ارمغان می آورد.

استفاده از Amazon DocumentDB برای ساخت راه حل های یادگیری ماشین بدون کد در Amazon SageMaker Canvas | خدمات وب آمازون هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.وارما گوتوموکالا یک معمار ارشد راه حل متخصص پایگاه داده در AWS مستقر در دالاس فورت ورث است. Varma با مشتریان در استراتژی پایگاه داده آنها کار می کند و حجم کاری آنها را با استفاده از پایگاه داده های ساخته شده AWS معمار می کند. قبل از پیوستن به AWS، او در 22 سال گذشته به طور گسترده با پایگاه های داده رابطه ای، پایگاه های داده NOSQL و چندین زبان برنامه نویسی کار کرده است.

تمبر زمان:

بیشتر از آموزش ماشین AWS