Predict Customer Churn With No-code Machine Learning Using Amazon SageMaker Canvas

بازنشر افلاطون

دنبال: 0

درک رفتار مشتری امروز برای هر کسب و کاری مهم است. به دست آوردن بینش در مورد چرایی و نحوه خرید مشتریان می تواند به افزایش درآمد کمک کند. اما از دست دادن مشتریان (که به آن ریزش مشتری نیز گفته می شود) همیشه یک خطر است و بینش در مورد اینکه چرا مشتریان را ترک می کنند می تواند به همان اندازه برای حفظ درآمد و سود مهم باشد. یادگیری ماشینی (ML) می‌تواند به اطلاعات بینش کمک کند، اما تاکنون به متخصصان ML برای ساخت مدل‌هایی برای پیش‌بینی ریزش نیاز داشتید، که فقدان آن‌ها می‌تواند اقدامات بینش‌محور کسب‌وکارها برای حفظ مشتریان را به تأخیر بیندازد.

در این پست، به شما نشان می‌دهیم که چگونه تحلیلگران کسب‌وکار می‌توانند یک مدل ML انحرافی مشتری بسازند آمازون SageMaker Canvas، بدون نیاز به کد Canvas یک رابط بصری نقطه و کلیک را در اختیار تحلیلگران تجاری قرار می دهد که به شما امکان می دهد مدل هایی بسازید و پیش بینی های دقیق ML را به تنهایی ایجاد کنید - بدون نیاز به تجربه ML یا نیاز به نوشتن یک خط کد.

بررسی اجمالی راه حل

برای این پست، ما نقش یک تحلیلگر بازاریابی در بخش بازاریابی یک اپراتور تلفن همراه را فرض می کنیم. ما وظیفه داریم مشتریانی را شناسایی کنیم که به طور بالقوه در معرض خطر سرگردانی هستند. ما به استفاده از خدمات و سایر داده‌های رفتار مشتری دسترسی داریم و می‌خواهیم بدانیم که آیا این داده‌ها می‌تواند به توضیح اینکه چرا مشتری می‌رود کمک کند. اگر بتوانیم عواملی را که ریزش را توضیح می‌دهند شناسایی کنیم، می‌توانیم اقدامات اصلاحی را برای تغییر رفتار پیش‌بینی‌شده انجام دهیم، مانند اجرای کمپین‌های حفظ هدفمند.

برای این کار از داده هایی که در یک فایل CSV در اختیار داریم استفاده می کنیم که حاوی اطلاعاتی در مورد استفاده و ریزش مشتری است. برای انجام مراحل زیر از Canvas استفاده می کنیم:

وارد کردن مجموعه داده های churn از سرویس ذخیره سازی ساده آمازون (Amazon S3).
آموزش و ساخت مدل چرخش.
نتایج مدل را تجزیه و تحلیل کنید.
پیش بینی های آزمایشی در برابر مدل

برای مجموعه داده خود، از a استفاده می کنیم مجموعه داده مصنوعی از یک شرکت مخابراتی تلفن همراه. این مجموعه داده نمونه شامل 5,000 رکورد است که هر رکورد از 21 ویژگی برای توصیف نمایه مشتری استفاده می کند. صفات به شرح زیر است:

دولت - ایالت ایالات متحده که مشتری در آن اقامت دارد که با علامت اختصاری دو حرفی مشخص شده است. به عنوان مثال، OH یا NJ
طول حساب – تعداد روزهایی که این حساب فعال بوده است
کد منطقه – کد منطقه سه رقمی شماره تلفن مشتری
تلفن – شماره تلفن هفت رقمی باقیمانده
برنامه بین المللی - آیا مشتری طرح تماس بین المللی دارد (بله/خیر)
طرح VMail - آیا مشتری دارای ویژگی پست صوتی است (بله/خیر)
پیام VMail – میانگین تعداد پیام های پست صوتی در ماه
دقیقه روز - تعداد کل دقیقه های تماس استفاده شده در طول روز
تماس های روز - تعداد کل تماس های انجام شده در طول روز
شارژ روز - هزینه صورتحساب تماس های روزانه
حوا مین, حوا تماس می گیرد, شارژ حوا - هزینه صورتحساب برای تماس های عصر
دقیقه شب, تماس های شبانه, شارژ شبانه - هزینه صورتحساب برای تماس های شبانه
دقایق بین المللی, تماس های بین المللی, شارژ بین المللی - هزینه صورتحساب برای تماس های بین المللی
CustServ تماس می گیرد - تعداد تماس هایی که با خدمات مشتری انجام شده است
ول کردن؟ - اینکه آیا مشتری سرویس را ترک کرده است (درست/نادرست)

آخرین ویژگی، Churn?، مشخصه ای است که می خواهیم مدل ML آن را پیش بینی کند. ویژگی هدف باینری است، به این معنی که مدل ما خروجی را به عنوان یکی از دو دسته پیش بینی می کند (True or False).

پیش نیازها

یک مدیر ابری با یک حساب AWS با مجوزهای مناسب برای تکمیل پیش نیازهای زیر لازم است:

استقرار یک آمازون SageMaker برای راهنمایی ها ، مراجعه کنید به ورود به دامنه Amazon SageMaker.
استقرار Canvas. برای دستورالعمل، نگاه کنید راه اندازی و مدیریت Amazon SageMaker Canvas (برای مدیران فناوری اطلاعات).
خط‌مشی‌های اشتراک‌گذاری منابع متقاطع (CORS) را برای Canvas پیکربندی کنید. برای دستورالعمل، نگاه کنید به کاربران خود توانایی آپلود فایل های محلی را بدهید.

یک مدل ریزش مشتری ایجاد کنید

ابتدا بیایید دانلود کنیم داده های برگرداندن و فایل را بررسی کنید تا مطمئن شوید همه داده ها وجود دارد. سپس مراحل زیر را انجام دهید:

ورود به سیستم کنسول مدیریت AWS، با استفاده از یک حساب کاربری با مجوزهای مناسب برای دسترسی به Canvas.
وارد کنسول Canvas شوید.

اینجاست که می‌توانیم مجموعه داده‌های خود را مدیریت کرده و مدل‌هایی ایجاد کنیم.

را انتخاب کنید وارد كردن.

دکمه واردات بوم را انتخاب کنید

را انتخاب کنید بارگذاری و انتخاب کنید churn.csv فایل.
را انتخاب کنید وارد کردن داده برای آپلود آن در بوم.

بوم انتخاب داده از s3

فرآیند وارد کردن تقریباً 10 ثانیه طول می کشد (این می تواند بسته به اندازه مجموعه داده متفاوت باشد). وقتی کامل شد، می‌توانیم ببینیم که مجموعه داده داخل است Ready وضعیت.

مجموعه داده Canvas Ready

برای پیش نمایش 100 ردیف اول مجموعه داده، ماوس خود را روی نماد چشم ببرید.

مجموعه داده نمایش بوم

پیش نمایش مجموعه داده ظاهر می شود. در اینجا می توانیم تأیید کنیم که داده های ما درست است.

Canvas Verify Data

پس از اینکه تأیید کردیم که مجموعه داده وارد شده آماده است، مدل خود را ایجاد می کنیم.

را انتخاب کنید مدل جدید.

مدل های جدید بوم

مجموعه داده churn.csv را انتخاب کرده و انتخاب کنید مجموعه داده را انتخاب کنید.

بوم مجموعه داده را انتخاب کنید

اکنون فرآیند ساخت مدل را پیکربندی می کنیم.

برای ستون های هدف، انتخاب Churn? ستون.

برای نوع مدل، Canvas به طور خودکار نوع مدل را در این مورد توصیه می کند پیش بینی دسته 2 (چیزی که یک دانشمند داده آن را طبقه بندی باینری می نامد). این برای مورد استفاده ما مناسب است زیرا ما فقط دو مقدار پیش‌بینی ممکن داریم: True or False، بنابراین ما با توصیه Canvas پیش می رویم.

مدل ساخت بوم

اکنون برخی فرضیات را تأیید می کنیم. ما می‌خواهیم دید سریعی درباره اینکه آیا ستون هدف ما توسط ستون‌های دیگر قابل پیش‌بینی است یا خیر، داشته باشیم. ما می‌توانیم دید سریعی از دقت تخمینی مدل و تأثیر ستون داشته باشیم (اهمیت تخمینی هر ستون در پیش‌بینی ستون هدف).

تمام 21 ستون را انتخاب کنید و انتخاب کنید مدل پیش نمایش.

این ویژگی از زیرمجموعه ای از مجموعه داده ما و تنها یک پاس در مدل سازی استفاده می کند. برای مورد استفاده ما، ساخت مدل پیش‌نمایش تقریباً 2 دقیقه طول می‌کشد.

مدل پیش نمایش بوم

همانطور که در تصویر زیر نشان داده شده است، Phone و State ستون ها تاثیر بسیار کمتری بر پیش بینی ما دارند. ما می‌خواهیم هنگام حذف ورودی متن مراقب باشیم، زیرا می‌تواند حاوی ویژگی‌های گسسته و دسته‌بندی مهمی باشد که به پیش‌بینی ما کمک می‌کند. در اینجا، شماره تلفن فقط معادل یک شماره حساب است - برای پیش‌بینی احتمال ریزش حساب‌های دیگر ارزشی ندارد و وضعیت مشتری تأثیر زیادی روی مدل ما ندارد.

ما این ستون‌ها را حذف می‌کنیم، زیرا هیچ اهمیت خاصی ندارند.
بعد از اینکه حذف کردیم Phone و State ستون‌ها، بیایید دوباره پیش‌نمایش را اجرا کنیم.

همانطور که در تصویر زیر نشان داده شده است، دقت مدل 0.1٪ افزایش یافته است. مدل پیش‌نمایش ما دقت تخمینی 95.9 درصدی دارد و ستون‌هایی که بیشترین تأثیر را دارند Night Calls, Eve Minsو Night Charge. این به ما بینشی می‌دهد که چه ستون‌هایی بیشترین تأثیر را بر عملکرد مدل ما دارند. در اینجا ما باید هنگام انتخاب ویژگی مراقب باشیم، زیرا اگر یک ویژگی واحد به شدت بر نتیجه یک مدل تأثیرگذار باشد، یک شاخص اولیه از نشت هدف، و این ویژگی در زمان پیش بینی در دسترس نخواهد بود. در این مورد، چند ستون تاثیر بسیار مشابهی را نشان دادند، بنابراین ما به ساخت مدل خود ادامه می دهیم.

مهندسی ویژگی بوم پس از

Canvas دو گزینه ساخت را ارائه می دهد:

ساخت استاندارد - بهترین مدل را از یک فرآیند بهینه سازی شده ایجاد می کند خودکار کردن; سرعت با بیشترین دقت عوض می شود
ساخت سریع - یک مدل را در کسری از زمان در مقایسه با یک ساخت استاندارد می سازد. دقت بالقوه با سرعت مبادله می شود.

برای این پست، ما را انتخاب می کنیم ساخت استاندارد گزینه ای است زیرا ما می خواهیم بهترین مدل را داشته باشیم و مایلیم زمان بیشتری را در انتظار نتیجه صرف کنیم.

ساخت استاندارد بوم

فرآیند ساخت می تواند 2 تا 4 ساعت طول بکشد. در این مدت، Canvas صدها خط لوله نامزد را آزمایش می کند و بهترین مدل را برای ارائه به ما انتخاب می کند. در اسکرین شات زیر می توان زمان ساخت و پیشرفت مورد انتظار را مشاهده کرد.

مدل آنالیز بوم

ارزیابی عملکرد مدل

هنگامی که فرآیند ساخت مدل کامل شد، مدل در 97.9٪ مواقع ریزش را پیش‌بینی کرد. این خوب به نظر می رسد، اما به عنوان تحلیلگر می خواهیم عمیق تر غوطه ور شویم و ببینیم آیا می توانیم به مدل اعتماد کنیم تا بر اساس آن تصمیم گیری کنیم. در نمره دهی در برگه، می‌توانیم نمودار بصری پیش‌بینی‌هایمان را که با نتایج آنها نگاشت شده است، مرور کنیم. این به ما امکان می دهد بینش عمیق تری نسبت به مدل خود داشته باشیم.

Canvas مجموعه داده را به مجموعه های آموزشی و آزمایشی جدا می کند. مجموعه داده آموزشی داده هایی است که Canvas برای ساخت مدل استفاده می کند. مجموعه تست برای دیدن اینکه آیا مدل با داده های جدید به خوبی عمل می کند یا خیر استفاده می شود. نمودار Sankey در اسکرین شات زیر نحوه عملکرد مدل را در مجموعه آزمایشی نشان می دهد. برای کسب اطلاعات بیشتر به ادامه مطلب مراجعه نمایید ارزیابی عملکرد مدل شما در بوم آمازون SageMaker.

برای به دست آوردن بینش دقیق تر فراتر از آنچه در نمودار Sankey نشان داده شده است، تحلیلگران تجاری می توانند از یک ماتریس سردرگمی تجزیه و تحلیل راه حل های تجاری آنها برای مثال، می‌خواهیم احتمال پیش‌بینی‌های نادرست مدل را بهتر درک کنیم. ما می توانیم این را در نمودار Sankey ببینیم، اما بینش بیشتری می خواهیم، بنابراین ما انتخاب می کنیم معیارهای پیشرفته. ما با یک ماتریس سردرگمی ارائه شده‌ایم که عملکرد یک مدل را در قالب بصری با مقادیر زیر، مخصوص کلاس مثبت نشان می‌دهد - ما بر اساس اینکه آیا آنها واقعاً تغییر خواهند کرد یا خیر، اندازه‌گیری می‌کنیم، بنابراین کلاس مثبت ما True در این مثال:

مثبت واقعی (TP) - تعداد True نتایجی که به درستی پیش‌بینی شده بودند True
منفی واقعی (TN) - تعداد False نتایجی که به درستی پیش‌بینی شده بودند False
مثبت کاذب (FP) - تعداد False نتایجی که به اشتباه پیش‌بینی شده بودند True
منفی کاذب (FN) - تعداد True نتایجی که به اشتباه پیش‌بینی شده بودند False

ما می‌توانیم از این نمودار ماتریسی استفاده کنیم تا نه‌تنها دقت کنیم که مدلمان چقدر درست است، بلکه زمانی که اشتباه است، چند وقت یک‌بار ممکن است و چقدر اشتباه است.

ماتریس بوم F1

معیارهای پیشرفته خوب به نظر می رسند. ما می توانیم به نتیجه مدل اعتماد کنیم. ما مثبت های کاذب بسیار کم و منفی های کاذب را می بینیم. اینها در صورتی است که مدل فکر می‌کند یک مشتری در مجموعه داده منحرف می‌شود و آنها در واقع این کار را نمی‌کنند (مثبت کاذب)، یا اگر مدل فکر می‌کند که مشتری منحرف می‌شود و آنها در واقع این کار را انجام می‌دهند (منفی کاذب). اعداد بالا برای هر کدام ممکن است ما را وادار کند که بیشتر در مورد اینکه آیا می توانیم از مدل برای تصمیم گیری استفاده کنیم، فکر کنیم.

برگردیم به بررسی اجمالی برگه، برای بررسی تاثیر هر ستون. این اطلاعات می تواند به تیم بازاریابی کمک کند تا بینشی را به دست آورد که منجر به انجام اقداماتی برای کاهش ریزش مشتری می شود. به عنوان مثال، ما می توانیم هم کم و هم زیاد را ببینیم CustServ Calls افزایش احتمال ریزش تیم بازاریابی می تواند بر اساس این آموخته ها اقداماتی را برای جلوگیری از ریزش مشتری انجام دهد. به عنوان مثال می‌توان به ایجاد پرسش‌های متداول دقیق در وب‌سایت‌ها برای کاهش تماس‌های خدمات مشتری، و اجرای کمپین‌های آموزشی با مشتریان در مورد سؤالات متداول اشاره کرد که می‌تواند تعامل را حفظ کند.

مدل ما بسیار دقیق به نظر می رسد. ما می‌توانیم مستقیماً یک پیش‌بینی تعاملی روی آن انجام دهیم پیش بینی تب، به صورت دسته ای یا تک (زمان واقعی) پیش بینی. در این مثال، ما چند تغییر در مقادیر مشخصی از ستون ها ایجاد کردیم و یک پیش بینی بلادرنگ انجام دادیم. Canvas نتیجه پیش بینی را همراه با سطح اطمینان به ما نشان می دهد.

استنتاج پیش بینی بوم

فرض کنید یک مشتری فعلی داریم که استفاده زیر را دارد: Night Mins 40 است و Eve Mins 40 است. ما می‌توانیم یک پیش‌بینی انجام دهیم، و مدل ما امتیاز اطمینان 93.2% را به دست می‌دهد که این مشتری از بین خواهد رفت (True). اکنون ممکن است برای حفظ این مشتری، تخفیف های تبلیغاتی ارائه دهیم.

فرض کنید یک مشتری فعلی داریم که کاربرد زیر را دارد: Night Mins 40 است و Eve Mins 40 است. ما می‌توانیم یک پیش‌بینی انجام دهیم، و مدل ما امتیاز اطمینان 93.2% را به دست می‌دهد که این مشتری از بین خواهد رفت (True). اکنون ممکن است برای حفظ این مشتری، تخفیف های تبلیغاتی ارائه دهیم.

اجرای یک پیش‌بینی برای تجزیه و تحلیل فردی چه-اگر عالی است، اما ما همچنین باید پیش‌بینی‌ها را روی بسیاری از رکوردها به طور همزمان اجرا کنیم. بوم قادر است اجرای پیش بینی های دسته ای، که به شما امکان می دهد پیش بینی ها را در مقیاس اجرا کنید.

نتیجه

در این پست نشان دادیم که چگونه یک تحلیلگر کسب و کار می تواند با استفاده از داده های نمونه SageMaker Canvas یک مدل کاهش مشتری ایجاد کند. Canvas به تحلیلگران کسب‌وکار شما اجازه می‌دهد تا مدل‌های ML دقیق ایجاد کنند و با استفاده از یک رابط بدون کد، بصری، نقطه و کلیک، پیش‌بینی‌هایی ایجاد کنند. یک تحلیلگر بازاریابی اکنون می‌تواند از این اطلاعات برای اجرای کمپین‌های حفظ هدفمند و آزمایش سریع‌تر استراتژی‌های کمپین جدید استفاده کند که منجر به کاهش ریزش مشتری می‌شود.

تحلیلگران می توانند با به اشتراک گذاشتن مدل های خود با همکاران دانشمند داده، این را به سطح بعدی برسانند. دانشمندان داده می توانند مدل Canvas را در آن مشاهده کنند Amazon SageMaker Studio، جایی که آنها می توانند انتخاب های Canvas AutoML را بررسی کنند، نتایج مدل را تأیید کنند، و حتی مدل را با چند کلیک تولید کنند. این می تواند ایجاد ارزش مبتنی بر ML را تسریع کند و به مقیاس سریعتر نتایج بهبود یافته کمک کند.

برای کسب اطلاعات بیشتر در مورد استفاده از Canvas، مراجعه کنید ساخت، اشتراک گذاری، استقرار: چگونه تحلیلگران کسب و کار و دانشمندان داده با استفاده از ML بدون کد و آمازون SageMaker Canvas به زمان سریع تری به بازار می رسند. برای اطلاعات بیشتر در مورد ایجاد مدل‌های ML با راه‌حل بدون کد، رجوع کنید اعلام آمازون SageMaker Canvas – قابلیت یادگیری ماشینی بصری و بدون کد برای تحلیلگران کسب و کار.

درباره نویسنده

هنری روبالینو یک معمار راه حل در AWS، مستقر در نیوجرسی است. او به یادگیری ابری و ماشینی و نقشی که می توانند در جامعه ایفا کنند، علاقه دارد. او با همکاری با مشتریان برای کمک به آنها در دستیابی به اهداف تجاری خود با استفاده از AWS Cloud به این امر دست می یابد. در خارج از محل کار، می توانید هنری را در حال سفر یا کاوش در فضای باز با دختر خزدارش آرلی بیابید.

ریزش مشتری را با یادگیری ماشینی بدون کد با استفاده از هوش داده‌ای آمازون SageMaker Canvas PlatoBlockchain پیش‌بینی کنید. جستجوی عمودی Ai. چائوران وانگ یک معمار راه حل در AWS، مستقر در دالاس، TX است. او از زمان فارغ التحصیلی از دانشگاه تگزاس در دالاس در سال 2016 با مدرک کارشناسی ارشد در علوم کامپیوتر در AWS کار می کند. Chaoran به مشتریان کمک می کند تا برنامه های کاربردی مقیاس پذیر، ایمن و مقرون به صرفه بسازند و راه حل هایی برای حل چالش های تجاری خود در AWS Cloud بیابند. چائوران در خارج از محل کار، عاشق گذراندن وقت با خانواده و دو سگ، بیوبیو و کوکو است.

تمبر زمان: ممکن است 5، 2022

تمبر زمان: ژان 12، 2023

بازنشر افلاطون

مقیاس آموزش هوش مصنوعی و استنتاج برای کشف دارو از طریق Amazon EKS و Karpenter | خدمات وب آمازون

از اسکریپت های آموزشی خود استفاده کنید و به طور خودکار بهترین مدل را با استفاده از بهینه سازی هایپرپارامتر در Amazon SageMaker انتخاب کنید

اعلام کانکتور Salesforce به روز شده (V2) برای Amazon Kendra

آموزش ساخت و استقرار عوامل LLM با استفاده از ابزار با استفاده از مدل‌های بنیادی JumpStart AWS SageMaker | خدمات وب آمازون

راندمان باز کردن قفل: استفاده از قدرت اجرای انتخابی در خطوط لوله آمازون SageMaker | خدمات وب آمازون

ترجمه چند زبانه پشتیبانی مشتری در Salesforce Service Cloud با استفاده از مترجم آمازون آسان شد

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب