بسیاری از برنامههای کاربردی برای نگهداری تجهیزات صنعتی، نظارت بر تجارت، مدیریت ناوگان و بهینهسازی مسیر با استفاده از APIهای منبع باز Cassandra و درایورها برای پردازش دادهها با سرعت بالا و تأخیر کم ساخته شدهاند. مدیریت جداول کاساندرا می تواند زمان بر و پرهزینه باشد. Amazon Keyspaces (برای آپاچی کاساندرا) به شما امکان می دهد جداول Cassandra را در AWS Cloud بدون مدیریت زیرساخت اضافی تنظیم، ایمن و مقیاس بندی کنید.
در این پست، خدمات AWS مربوط به آموزش مدلهای یادگیری ماشین (ML) را با استفاده از Amazon Keyspaces در سطح بالا راهنمایی میکنیم و دستورالعملهای گام به گام برای دریافت دادهها از Amazon Keyspaces به آن ارائه میکنیم. آمازون SageMaker و آموزش مدلی که می تواند برای یک مورد استفاده از تقسیم بندی مشتری خاص استفاده شود.
AWS خدمات متعددی برای کمک به کسب و کارها در پیاده سازی فرآیندهای ML در فضای ابری دارد.
AWS ML Stack دارای سه لایه است. در لایه میانی قرار دارد SageMakerکه به توسعه دهندگان، دانشمندان داده و مهندسان ML توانایی ساخت، آموزش و استقرار مدل های ML در مقیاس را می دهد. این پیچیدگی را از هر مرحله از گردش کار ML حذف می کند تا بتوانید موارد استفاده ML خود را راحت تر اجرا کنید. این شامل هر چیزی از تعمیر و نگهداری پیشبینیکننده گرفته تا بینایی کامپیوتری و پیشبینی رفتارهای مشتری است. مشتریان با SageMaker تا 10 برابر در بهره وری دانشمندان داده بهبود یافته اند.
آپاچی کاساندرا یک انتخاب محبوب برای موارد استفاده سنگین خواندنی با دادههای بدون ساختار یا نیمه ساختار یافته است. به عنوان مثال، یک تجارت محبوب تحویل غذا زمان تحویل را تخمین می زند، و یک مشتری خرده فروشی می تواند مرتباً از اطلاعات کاتالوگ محصول در پایگاه داده آپاچی کاساندرا استفاده کند. Amazon Keyspaces یک سرویس پایگاه داده سازگار با آپاچی کاساندرا بدون سرور، مقیاس پذیر، بسیار در دسترس و مدیریت شده است. شما نیازی به تهیه، وصله یا مدیریت سرورها ندارید، و نیازی به نصب، نگهداری یا اجرای نرم افزار ندارید. جداول می توانند به صورت خودکار بزرگ و کم شوند و شما فقط برای منابعی که استفاده می کنید پرداخت می کنید. Amazon Keyspaces به شما امکان می دهد بارهای کاری Cassandra خود را در AWS با استفاده از همان کد برنامه Cassandra و ابزارهای توسعه دهنده ای که امروز استفاده می کنید اجرا کنید.
SageMaker مجموعه ای از الگوریتم های داخلی برای کمک به دانشمندان داده و پزشکان ML برای شروع سریع آموزش و استقرار مدل های ML. در این پست، ما به شما نشان خواهیم داد که چگونه یک مشتری خردهفروش میتواند از تاریخچه خرید مشتری در پایگاه داده Keyspaces استفاده کند و بخشهای مختلف مشتریان را برای کمپینهای بازاریابی هدف قرار دهد.
ک-یعنی یک الگوریتم یادگیری بدون نظارت است. تلاش میکند تا گروههای مجزا را در دادهها بیابد، جایی که اعضای یک گروه تا حد امکان شبیه به یکدیگر و تا حد امکان از اعضای گروههای دیگر متفاوت هستند. شما ویژگی هایی را تعریف می کنید که می خواهید الگوریتم از آنها برای تعیین شباهت استفاده کند. SageMaker از نسخه اصلاح شده استفاده می کند الگوریتم خوشه بندی در مقیاس وب k-means. در مقایسه با نسخه اصلی الگوریتم، نسخه استفاده شده توسط SageMaker دقیق تر است. با این حال، مانند الگوریتم اصلی، آن را به مجموعه داده های عظیم مقیاس می دهد و بهبودهایی را در زمان آموزش ارائه می دهد.
بررسی اجمالی راه حل
دستورالعمل ها فرض می کنند که از SageMaker Studio برای اجرای کد استفاده می کنید. کد مرتبط در به اشتراک گذاشته شده است AWS نمونه GitHub. با پیروی از دستورالعمل های آزمایشگاه، می توانید موارد زیر را انجام دهید:
- وابستگی های لازم را نصب کنید.
- به Amazon Keyspaces متصل شوید، یک جدول ایجاد کنید و داده های نمونه را دریافت کنید.
- یک مدل طبقهبندی ML با استفاده از دادههای Amazon Keyspaces بسازید.
- نتایج مدل را کاوش کنید
- منابع تازه ایجاد شده را پاک کنید.
پس از تکمیل، SageMaker را با Amazon Keyspaces ادغام خواهید کرد تا مدلهای ML را همانطور که در تصویر زیر نشان داده شده است آموزش دهید.
حالا شما می توانید از دستورالعمل های گام به گام در این پست دادههای خام ذخیرهشده در Amazon Keyspaces را با استفاده از SageMaker و دادههایی که برای پردازش ML بازیابی میشوند، دریافت کنید.
پیش نیازها
ابتدا به SageMaker بروید.
در مرحله بعد، اگر این اولین باری است که از SageMaker استفاده می کنید، انتخاب کنید شروع کنید.
بعد، انتخاب کنید دامنه SageMaker را راه اندازی کنید.
بعد، یک نمایه کاربری جدید با نام ایجاد کنید - حکیم ساز، و انتخاب کنید ایجاد نقش جدید در نقش اجرای پیش فرض بخش فرعی
بعد، در صفحه ای که ظاهر می شود، هر کدام را انتخاب کنید سرویس ذخیره سازی ساده آمازون (Amazon S3) سطل، و ایجاد نقش را انتخاب کنید.
این نقش در مراحل زیر استفاده میشود تا به SageMaker اجازه داده شود تا با استفاده از اعتبارنامههای موقت از نقش به جدول Keyspace دسترسی داشته باشد. با این کار نیازی به ذخیره نام کاربری و رمز عبور در نوت بوک نیست.
بعد، نقش مرتبط با را بازیابی کنید حکیم ساز که در مرحله قبل از قسمت خلاصه ایجاد شد.
سپس ، به کنسول AWS و به بالا نگاه کن مدیریت هویت و دسترسی AWS (IAM). در IAM، به Roles بروید. در Roles، نقش اجرایی مشخص شده در مرحله قبل را جستجو کنید.
در مرحله بعد نقش مشخص شده در مرحله قبل را انتخاب کرده و گزینه Add Permissions را انتخاب کنید. در منوی باز شده، Create Inline Policy را انتخاب کنید. SageMaker به شما این امکان را می دهد که یک سطح دقیق از دسترسی را فراهم کنید که اعمالی را که کاربر/برنامه کاربردی می تواند بر اساس الزامات تجاری انجام دهد، محدود می کند.
سپس، زبانه JSON را انتخاب کنید و خط مشی را از بخش Note Github کپی کنید با ما. این خطمشی به نوتبوک SageMaker اجازه میدهد به Keyspaceها متصل شود و دادهها را برای پردازش بیشتر بازیابی کند.
سپس مجدداً و از منوی بازشو گزینه Add permissions را انتخاب کرده و Attach Policy را انتخاب کنید.
خط مشی AmazonKeyspacesFullAccess را جستجو کنید و کادر کنار نتیجه مطابق را انتخاب کنید و گزینه Attach Policies را انتخاب کنید.
بررسی کنید که بخش خطمشیهای مجوزها شامل باشد AmazonS3FullAccess
, AmazonSageMakerFullAccess
, AmazonKeyspacesFullAccess
و همچنین خط مشی جدید اضافه شده است.
سپس با استفاده از کنسول AWS به SageMaker Studio بروید و SageMaker Studio را انتخاب کنید. پس از آن، Launch App را انتخاب کنید و Studio را انتخاب کنید.
راهنمای نوت بوک
روش ترجیحی برای اتصال به Keyspace از SageMaker Notebook استفاده از آن است فرآیند امضای AWS نسخه 4 (SigV4) مستقر اعتبارنامه موقت برای احراز هویت در این سناریو، ما نیازی به تولید یا ذخیره اعتبارات Keyspace نداریم و میتوانیم از اعتبارنامهها برای احراز هویت با افزونه SigV4 استفاده کنیم. اعتبارنامه امنیتی موقت از یک شناسه کلید دسترسی و یک کلید دسترسی مخفی تشکیل شده است. با این حال، آنها همچنین شامل یک نشانه امنیتی هستند که نشان می دهد که اعتبارنامه ها چه زمانی منقضی می شوند. در این پست، نقش IAM ایجاد می کنیم و اعتبارنامه امنیتی موقت ایجاد می کنیم.
ابتدا یک درایور (cassandra-sigv4) نصب می کنیم. این درایور شما را قادر می سازد تا با استفاده از فرآیند امضای نسخه 4 AWS (SigV4) اطلاعات احراز هویت را به درخواست های API خود اضافه کنید. با استفاده از این افزونه، می توانید به کاربران و برنامه ها اعتبارنامه های کوتاه مدت برای دسترسی به Amazon Keyspaces (برای آپاچی کاساندرا) با استفاده از کاربران و نقش های IAM ارائه دهید. پس از این، گواهی لازم را به همراه وابستگی های بسته اضافی وارد خواهید کرد. در پایان، به نوتبوک اجازه میدهید تا نقش صحبت با Keyspace را بر عهده بگیرد.
سپس به Amazon Keyspace متصل شوید و داده های سیستم را از Keyspace در Pandas DataFrame بخوانید تا اتصال را تأیید کنید.
سپس داده ها را برای آموزش روی مجموعه داده های خام آماده کنید. در نوت بوک پایتون مرتبط با این پست، از مجموعه داده های خرده فروشی دانلود شده از آن استفاده کنید اینجا کلیک نمایید، و آن را پردازش کنید. هدف کسبوکار ما با توجه به مجموعه داده، خوشهبندی مشتریان با استفاده از RFM تماس متریک خاص است. مدل RFM بر اساس سه عامل کمی است:
- تازگی: چند وقت پیش مشتری خریدی انجام داده است.
- فرکانس: هر چند وقت یکبار مشتری خرید می کند.
- ارزش پولی: مشتری چقدر برای خرید خرج می کند.
تجزیه و تحلیل RFM به صورت عددی یک مشتری را در هر یک از این سه دسته، به طور کلی در مقیاس 1 تا 5 رتبه بندی می کند (هر چه این عدد بیشتر باشد، نتیجه بهتر است). "بهترین" مشتری در هر دسته امتیاز برتر را دریافت می کند. ما از تابع گسسته سازی مبتنی بر Quantile (qcut) پانداها استفاده خواهیم کرد. این به گسسته کردن مقادیر در سطل های هم اندازه بر اساس یا بر اساس چندک های نمونه کمک می کند.
در این مثال، ما از CQL برای خواندن رکوردها از جدول Keyspace استفاده می کنیم. در برخی موارد استفاده از ML، ممکن است لازم باشد چندین بار همان دادهها را از یک جدول Keyspace بخوانید. در این مورد، توصیه می کنیم که داده های خود را در یک سطل آمازون S3 ذخیره کنید تا از متحمل شدن موارد اضافی جلوگیری کنید هزینهدر حال خواندن از Amazon Keyspace. بسته به سناریوی خود، می توانید از آن نیز استفاده کنید آمازون EMR به مصرف یک فایل بسیار بزرگ آمازون S3 در SageMaker.
در مرحله بعد، یک مدل ML را با استفاده از الگوریتم KMeans آموزش می دهیم و مطمئن می شویم که خوشه ها ایجاد شده اند. در این سناریوی خاص، میبینید که خوشههای ایجاد شده چاپ میشوند و نشان میدهند که مشتریان در مجموعه دادههای خام بر اساس ویژگیهای مختلف در مجموعه داده با هم گروهبندی شدهاند. این اطلاعات خوشه ای را می توان برای کمپین های بازاریابی هدفمند استفاده کرد.
(اختیاری) سپس، بخشهای مشتری را که توسط مدل ML شناسایی شدهاند، برای بازاریابی هدفمند در جدول Amazon Keyspaces ذخیره میکنیم. یک کار دستهای میتواند این دادهها را بخواند و کمپینهای هدفمند را برای مشتریان در بخشهای خاص اجرا کند.
سرانجام، ما منابع را پاکسازی کنید ایجاد شده در طول این آموزش برای جلوگیری از تحمیل هزینه های اضافی.
ممکن است چند ثانیه تا یک دقیقه طول بکشد تا حذف فضای کلید و جداول کامل شود. وقتی فضای کلیدی را حذف میکنید، فضای کلید و تمام جداول آن حذف میشود و دیگر هزینههایی را از آنها دریافت نمیکنید.
نتیجه
این پست به شما نشان داد که چگونه داده های مشتری را از Amazon Keyspace در SageMaker وارد کنید و یک مدل خوشه بندی را آموزش دهید که به شما امکان می دهد مشتریان را تقسیم بندی کنید. شما می توانید از این اطلاعات برای بازاریابی هدفمند استفاده کنید، بنابراین KPI کسب و کار خود را تا حد زیادی بهبود می بخشید. برای کسب اطلاعات بیشتر در مورد Amazon Keyspaces، منابع زیر را مرور کنید:
- آموزش مدل های یادگیری ماشین با استفاده از Amazon Keyspaces به عنوان منبع داده (نوت بوک SageMaker)
- با استفاده از IntelliJ، PyCharm یا DataGrip IDE از دسکتاپ خود به Amazon Keyspaces متصل شوید.
- مرجع زبان CQL برای Amazon Keyspaces (برای Apache Cassandra)
- نحوه تنظیم دسترسی خط فرمان به Amazon Keyspaces (برای Apache Cassandra) با استفاده از جعبه ابزار توسعه دهنده جدید Docker image
- مدیریت هویت و دسترسی برای Amazon Keyspaces (برای Apache Cassandra)
- اتصال به Amazon Keyspace از SageMaker با اعتبار خدمات خاص
- تازگی، فرکانس، ارزش پولی (RFM)
- مرجع کد Kaggle
درباره نویسنده
وادیم لیاخوویچ یک معمار ارشد راه حل در AWS در منطقه خلیج سانفرانسیسکو است که به مشتریان کمک می کند تا به AWS مهاجرت کنند. او با سازمان هایی از شرکت های بزرگ گرفته تا استارت آپ های کوچک کار می کند تا از نوآوری های آنها حمایت کند. او همچنین به مشتریان کمک می کند تا راه حل های مقیاس پذیر، ایمن و مقرون به صرفه را در AWS معمار کنند.
پارت پاتل یک معمار راه حل در AWS در منطقه خلیج سانفرانسیسکو است. Parth مشتریان را راهنمایی می کند تا سفر خود به ابر را سرعت بخشند و به آنها کمک می کند تا با موفقیت AWS cloud را اتخاذ کنند. او بر ML و نوسازی اپلیکیشن تمرکز دارد.
رام پاتانگی یک معمار راه حل در AWS در منطقه خلیج سانفرانسیسکو است. او به مشتریان در بخش های کشاورزی، بیمه، بانکداری، خرده فروشی، مراقبت های بهداشتی و علوم زندگی، مهمان نوازی، و بخش های فناوری پیشرفته کمک کرده است تا کسب و کار خود را با موفقیت در ابر AWS اجرا کنند. او در پایگاه های داده، تجزیه و تحلیل و ML تخصص دارد.
- '
- "
- &
- 10
- 100
- 9
- توانایی
- درباره ما
- شتاب دادن
- دسترسی
- دقیق
- رسیدن
- اقدامات
- اضافی
- کشاورزی
- پیش
- الگوریتم
- معرفی
- آمازون
- تحلیل
- علم تجزیه و تحلیل
- دیگر
- API
- رابط های برنامه کاربردی
- نرم افزار
- کاربرد
- برنامه های کاربردی
- محدوده
- توجه
- خواص
- تصدیق
- بطور خودکار
- در دسترس
- AWS
- بانکداری
- سرخ مایل به قرمز
- بلاگ
- مرز
- ساختن
- کسب و کار
- کسب و کار
- صدا
- مبارزات
- اهميت دادن
- موارد
- دسته بندی
- گواهی نامه
- بار
- انتخاب
- طبقه بندی
- ابر
- رمز
- مقایسه
- کامپیوتر
- اتصال
- ارتباط
- کنسول
- مقرون به صرفه
- میتوانست
- کشور
- ایجاد
- ایجاد شده
- مجوزها و اعتبارات
- مشتری
- مشتریان
- داده ها
- مجموعه داده ها
- پایگاه داده
- پایگاه های داده
- ارائه
- تحویل
- بستگی دارد
- گسترش
- استقرار
- دسکتاپ
- مشخص کردن
- توسعه دهنده
- توسعه دهندگان
- مختلف
- کارگر بارانداز
- پایین
- راننده
- قطره
- در طی
- به آسانی
- مورد تأیید
- شرکت
- تجهیزات
- تخمین می زند
- مثال
- اعدام
- عوامل
- نام خانوادگی
- بار اول
- ناوگان
- تمرکز
- به دنبال
- پیروی
- غذا
- فرانسیسکو
- تابع
- بیشتر
- عموما
- تولید می کنند
- گرفتن
- GitHub
- تا حد زیادی
- گروه
- گروه ها
- راهنما
- سلامتی
- مراقبت های بهداشتی
- کمک
- کمک
- زیاد
- بالاتر
- خیلی
- تاریخ
- چگونه
- چگونه
- اما
- HTTPS
- هویت
- تصویر
- انجام
- بهبود
- بهبود
- شامل
- شامل
- شاخص
- صنعتی
- اطلاعات
- شالوده
- نوآوری
- نصب
- بیمه
- یکپارچه
- IT
- کار
- سفر
- کلید
- آزمایشگاه
- زبان
- بزرگ
- راه اندازی
- لایه
- یاد گرفتن
- یادگیری
- سطح
- علوم زندگی
- لینک
- نگاه کنيد
- وفادار
- دستگاه
- فراگیری ماشین
- ساخته
- حفظ
- باعث می شود
- مدیریت
- اداره می شود
- مدیریت
- مدیریت
- بازار یابی (Marketing)
- عظیم
- مطابق
- اعضا
- ML
- مدل
- مدل
- پولی
- پول
- نظارت بر
- بیش
- اکثر
- چندگانه
- لازم
- دفتر یادداشت
- عدد
- کار
- بهینه سازی
- سازمان های
- دیگر
- بسته
- ویژه
- کلمه عبور
- وصله
- پرداخت
- پلاگین
- سیاست
- سیاست
- محبوب
- ممکن
- پتانسیل
- پیش بینی
- آماده
- قبلی
- قیمت
- اصلی
- روند
- فرآیندهای
- در حال پردازش
- محصول
- بهره وری
- مشخصات
- امید بخش
- ارائه
- فراهم می کند
- خرید
- خرید
- کمی
- به سرعت
- اعم
- خام
- مطالعه
- گرفتن
- تازه
- توصیه
- سوابق
- درخواست
- ضروری
- مورد نیاز
- منابع
- نتایج
- خرده فروشی
- این فایل نقد می نویسید:
- خطر
- نقش
- مسیر
- دویدن
- سان
- سان فرانسیسکو
- SC
- مقیاس پذیر
- مقیاس
- علوم
- دانشمندان
- پرده
- جستجو
- ثانیه
- امن
- تیم امنیت لاتاری
- رمز امنیتی
- بخش
- تقسیم بندی
- بخش ها
- بدون سرور
- سرویس
- خدمات
- تنظیم
- به اشتراک گذاشته شده
- کوتاه مدت
- نشان داده شده
- مشابه
- ساده
- خواب
- کوچک
- So
- نرم افزار
- جامد
- مزایا
- برخی از
- تخصص دارد
- پشته
- آغاز شده
- نوپا
- ذخیره سازی
- opbevare
- استودیو
- موفقیت
- پشتیبانی
- سیستم
- سیستم های
- صحبت
- هدف
- هدف قرار
- موقت
- La
- از طریق
- زمان
- بار
- امروز
- با هم
- رمز
- ابزار
- ابزار
- بالا
- تجارت
- آموزش
- استفاده کنید
- موارد استفاده
- کاربران
- ارزش
- مختلف
- نسخه
- عمودی
- دید
- چی
- در داخل
- بدون
- کارگر
- خواهد بود
- شما