درک رفتار مشتری امروز برای هر کسب و کاری مهم است. به دست آوردن بینش در مورد چرایی و نحوه خرید مشتریان می تواند به افزایش درآمد کمک کند. اما از دست دادن مشتریان (که به آن ریزش مشتری نیز گفته می شود) همیشه یک خطر است و بینش در مورد اینکه چرا مشتریان را ترک می کنند می تواند به همان اندازه برای حفظ درآمد و سود مهم باشد. یادگیری ماشینی (ML) میتواند به اطلاعات بینش کمک کند، اما تاکنون به متخصصان ML برای ساخت مدلهایی برای پیشبینی ریزش نیاز داشتید، که فقدان آنها میتواند اقدامات بینشمحور کسبوکارها برای حفظ مشتریان را به تأخیر بیندازد.
در این پست، به شما نشان میدهیم که چگونه تحلیلگران کسبوکار میتوانند یک مدل ML انحرافی مشتری بسازند آمازون SageMaker Canvas، بدون نیاز به کد Canvas یک رابط بصری نقطه و کلیک را در اختیار تحلیلگران تجاری قرار می دهد که به شما امکان می دهد مدل هایی بسازید و پیش بینی های دقیق ML را به تنهایی ایجاد کنید - بدون نیاز به تجربه ML یا نیاز به نوشتن یک خط کد.
بررسی اجمالی راه حل
برای این پست، ما نقش یک تحلیلگر بازاریابی در بخش بازاریابی یک اپراتور تلفن همراه را فرض می کنیم. ما وظیفه داریم مشتریانی را شناسایی کنیم که به طور بالقوه در معرض خطر سرگردانی هستند. ما به استفاده از خدمات و سایر دادههای رفتار مشتری دسترسی داریم و میخواهیم بدانیم که آیا این دادهها میتواند به توضیح اینکه چرا مشتری میرود کمک کند. اگر بتوانیم عواملی را که ریزش را توضیح میدهند شناسایی کنیم، میتوانیم اقدامات اصلاحی را برای تغییر رفتار پیشبینیشده انجام دهیم، مانند اجرای کمپینهای حفظ هدفمند.
برای این کار از داده هایی که در یک فایل CSV در اختیار داریم استفاده می کنیم که حاوی اطلاعاتی در مورد استفاده و ریزش مشتری است. برای انجام مراحل زیر از Canvas استفاده می کنیم:
- وارد کردن مجموعه داده های churn از سرویس ذخیره سازی ساده آمازون (Amazon S3).
- آموزش و ساخت مدل چرخش.
- نتایج مدل را تجزیه و تحلیل کنید.
- پیش بینی های آزمایشی در برابر مدل
برای مجموعه داده خود، از a استفاده می کنیم مجموعه داده مصنوعی از یک شرکت مخابراتی تلفن همراه. این مجموعه داده نمونه شامل 5,000 رکورد است که هر رکورد از 21 ویژگی برای توصیف نمایه مشتری استفاده می کند. صفات به شرح زیر است:
- دولت - ایالت ایالات متحده که مشتری در آن اقامت دارد که با علامت اختصاری دو حرفی مشخص شده است. به عنوان مثال، OH یا NJ
- طول حساب – تعداد روزهایی که این حساب فعال بوده است
- کد منطقه – کد منطقه سه رقمی شماره تلفن مشتری
- تلفن – شماره تلفن هفت رقمی باقیمانده
- برنامه بین المللی - آیا مشتری طرح تماس بین المللی دارد (بله/خیر)
- طرح VMail - آیا مشتری دارای ویژگی پست صوتی است (بله/خیر)
- پیام VMail – میانگین تعداد پیام های پست صوتی در ماه
- دقیقه روز - تعداد کل دقیقه های تماس استفاده شده در طول روز
- تماس های روز - تعداد کل تماس های انجام شده در طول روز
- شارژ روز - هزینه صورتحساب تماس های روزانه
- حوا مین, حوا تماس می گیرد, شارژ حوا - هزینه صورتحساب برای تماس های عصر
- دقیقه شب, تماس های شبانه, شارژ شبانه - هزینه صورتحساب برای تماس های شبانه
- دقایق بین المللی, تماس های بین المللی, شارژ بین المللی - هزینه صورتحساب برای تماس های بین المللی
- CustServ تماس می گیرد - تعداد تماس هایی که با خدمات مشتری انجام شده است
- ول کردن؟ - اینکه آیا مشتری سرویس را ترک کرده است (درست/نادرست)
آخرین ویژگی، Churn?
، مشخصه ای است که می خواهیم مدل ML آن را پیش بینی کند. ویژگی هدف باینری است، به این معنی که مدل ما خروجی را به عنوان یکی از دو دسته پیش بینی می کند (True
or False
).
پیش نیازها
یک مدیر ابری با یک حساب AWS با مجوزهای مناسب برای تکمیل پیش نیازهای زیر لازم است:
- استقرار یک آمازون SageMaker برای راهنمایی ها ، مراجعه کنید به ورود به دامنه Amazon SageMaker.
- استقرار Canvas. برای دستورالعمل، نگاه کنید راه اندازی و مدیریت Amazon SageMaker Canvas (برای مدیران فناوری اطلاعات).
- خطمشیهای اشتراکگذاری منابع متقاطع (CORS) را برای Canvas پیکربندی کنید. برای دستورالعمل، نگاه کنید به کاربران خود توانایی آپلود فایل های محلی را بدهید.
یک مدل ریزش مشتری ایجاد کنید
ابتدا بیایید دانلود کنیم داده های برگرداندن و فایل را بررسی کنید تا مطمئن شوید همه داده ها وجود دارد. سپس مراحل زیر را انجام دهید:
- ورود به سیستم کنسول مدیریت AWS، با استفاده از یک حساب کاربری با مجوزهای مناسب برای دسترسی به Canvas.
- وارد کنسول Canvas شوید.
اینجاست که میتوانیم مجموعه دادههای خود را مدیریت کرده و مدلهایی ایجاد کنیم.
- را انتخاب کنید وارد كردن.
- را انتخاب کنید بارگذاری و انتخاب کنید
churn.csv
فایل. - را انتخاب کنید وارد کردن داده برای آپلود آن در بوم.
فرآیند وارد کردن تقریباً 10 ثانیه طول می کشد (این می تواند بسته به اندازه مجموعه داده متفاوت باشد). وقتی کامل شد، میتوانیم ببینیم که مجموعه داده داخل است Ready
وضعیت.
- برای پیش نمایش 100 ردیف اول مجموعه داده، ماوس خود را روی نماد چشم ببرید.
پیش نمایش مجموعه داده ظاهر می شود. در اینجا می توانیم تأیید کنیم که داده های ما درست است.
پس از اینکه تأیید کردیم که مجموعه داده وارد شده آماده است، مدل خود را ایجاد می کنیم.
- را انتخاب کنید مدل جدید.
- مجموعه داده churn.csv را انتخاب کرده و انتخاب کنید مجموعه داده را انتخاب کنید.
اکنون فرآیند ساخت مدل را پیکربندی می کنیم.
- برای ستون های هدف، انتخاب
Churn?
ستون.
برای نوع مدل، Canvas به طور خودکار نوع مدل را در این مورد توصیه می کند پیش بینی دسته 2 (چیزی که یک دانشمند داده آن را طبقه بندی باینری می نامد). این برای مورد استفاده ما مناسب است زیرا ما فقط دو مقدار پیشبینی ممکن داریم: True
or False
، بنابراین ما با توصیه Canvas پیش می رویم.
اکنون برخی فرضیات را تأیید می کنیم. ما میخواهیم دید سریعی درباره اینکه آیا ستون هدف ما توسط ستونهای دیگر قابل پیشبینی است یا خیر، داشته باشیم. ما میتوانیم دید سریعی از دقت تخمینی مدل و تأثیر ستون داشته باشیم (اهمیت تخمینی هر ستون در پیشبینی ستون هدف).
- تمام 21 ستون را انتخاب کنید و انتخاب کنید مدل پیش نمایش.
این ویژگی از زیرمجموعه ای از مجموعه داده ما و تنها یک پاس در مدل سازی استفاده می کند. برای مورد استفاده ما، ساخت مدل پیشنمایش تقریباً 2 دقیقه طول میکشد.
همانطور که در تصویر زیر نشان داده شده است، Phone
و State
ستون ها تاثیر بسیار کمتری بر پیش بینی ما دارند. ما میخواهیم هنگام حذف ورودی متن مراقب باشیم، زیرا میتواند حاوی ویژگیهای گسسته و دستهبندی مهمی باشد که به پیشبینی ما کمک میکند. در اینجا، شماره تلفن فقط معادل یک شماره حساب است - برای پیشبینی احتمال ریزش حسابهای دیگر ارزشی ندارد و وضعیت مشتری تأثیر زیادی روی مدل ما ندارد.
- ما این ستونها را حذف میکنیم، زیرا هیچ اهمیت خاصی ندارند.
- بعد از اینکه حذف کردیم
Phone
وState
ستونها، بیایید دوباره پیشنمایش را اجرا کنیم.
همانطور که در تصویر زیر نشان داده شده است، دقت مدل 0.1٪ افزایش یافته است. مدل پیشنمایش ما دقت تخمینی 95.9 درصدی دارد و ستونهایی که بیشترین تأثیر را دارند Night Calls
, Eve Mins
و Night Charge
. این به ما بینشی میدهد که چه ستونهایی بیشترین تأثیر را بر عملکرد مدل ما دارند. در اینجا ما باید هنگام انتخاب ویژگی مراقب باشیم، زیرا اگر یک ویژگی واحد به شدت بر نتیجه یک مدل تأثیرگذار باشد، یک شاخص اولیه از نشت هدف، و این ویژگی در زمان پیش بینی در دسترس نخواهد بود. در این مورد، چند ستون تاثیر بسیار مشابهی را نشان دادند، بنابراین ما به ساخت مدل خود ادامه می دهیم.
Canvas دو گزینه ساخت را ارائه می دهد:
- ساخت استاندارد - بهترین مدل را از یک فرآیند بهینه سازی شده ایجاد می کند خودکار کردن; سرعت با بیشترین دقت عوض می شود
- ساخت سریع - یک مدل را در کسری از زمان در مقایسه با یک ساخت استاندارد می سازد. دقت بالقوه با سرعت مبادله می شود.
- برای این پست، ما را انتخاب می کنیم ساخت استاندارد گزینه ای است زیرا ما می خواهیم بهترین مدل را داشته باشیم و مایلیم زمان بیشتری را در انتظار نتیجه صرف کنیم.
فرآیند ساخت می تواند 2 تا 4 ساعت طول بکشد. در این مدت، Canvas صدها خط لوله نامزد را آزمایش می کند و بهترین مدل را برای ارائه به ما انتخاب می کند. در اسکرین شات زیر می توان زمان ساخت و پیشرفت مورد انتظار را مشاهده کرد.
ارزیابی عملکرد مدل
هنگامی که فرآیند ساخت مدل کامل شد، مدل در 97.9٪ مواقع ریزش را پیشبینی کرد. این خوب به نظر می رسد، اما به عنوان تحلیلگر می خواهیم عمیق تر غوطه ور شویم و ببینیم آیا می توانیم به مدل اعتماد کنیم تا بر اساس آن تصمیم گیری کنیم. در نمره دهی در برگه، میتوانیم نمودار بصری پیشبینیهایمان را که با نتایج آنها نگاشت شده است، مرور کنیم. این به ما امکان می دهد بینش عمیق تری نسبت به مدل خود داشته باشیم.
Canvas مجموعه داده را به مجموعه های آموزشی و آزمایشی جدا می کند. مجموعه داده آموزشی داده هایی است که Canvas برای ساخت مدل استفاده می کند. مجموعه تست برای دیدن اینکه آیا مدل با داده های جدید به خوبی عمل می کند یا خیر استفاده می شود. نمودار Sankey در اسکرین شات زیر نحوه عملکرد مدل را در مجموعه آزمایشی نشان می دهد. برای کسب اطلاعات بیشتر به ادامه مطلب مراجعه نمایید ارزیابی عملکرد مدل شما در بوم آمازون SageMaker.
برای به دست آوردن بینش دقیق تر فراتر از آنچه در نمودار Sankey نشان داده شده است، تحلیلگران تجاری می توانند از یک ماتریس سردرگمی تجزیه و تحلیل راه حل های تجاری آنها برای مثال، میخواهیم احتمال پیشبینیهای نادرست مدل را بهتر درک کنیم. ما می توانیم این را در نمودار Sankey ببینیم، اما بینش بیشتری می خواهیم، بنابراین ما انتخاب می کنیم معیارهای پیشرفته. ما با یک ماتریس سردرگمی ارائه شدهایم که عملکرد یک مدل را در قالب بصری با مقادیر زیر، مخصوص کلاس مثبت نشان میدهد - ما بر اساس اینکه آیا آنها واقعاً تغییر خواهند کرد یا خیر، اندازهگیری میکنیم، بنابراین کلاس مثبت ما True
در این مثال:
- مثبت واقعی (TP) - تعداد
True
نتایجی که به درستی پیشبینی شده بودندTrue
- منفی واقعی (TN) - تعداد
False
نتایجی که به درستی پیشبینی شده بودندFalse
- مثبت کاذب (FP) - تعداد
False
نتایجی که به اشتباه پیشبینی شده بودندTrue
- منفی کاذب (FN) - تعداد
True
نتایجی که به اشتباه پیشبینی شده بودندFalse
ما میتوانیم از این نمودار ماتریسی استفاده کنیم تا نهتنها دقت کنیم که مدلمان چقدر درست است، بلکه زمانی که اشتباه است، چند وقت یکبار ممکن است و چقدر اشتباه است.
معیارهای پیشرفته خوب به نظر می رسند. ما می توانیم به نتیجه مدل اعتماد کنیم. ما مثبت های کاذب بسیار کم و منفی های کاذب را می بینیم. اینها در صورتی است که مدل فکر میکند یک مشتری در مجموعه داده منحرف میشود و آنها در واقع این کار را نمیکنند (مثبت کاذب)، یا اگر مدل فکر میکند که مشتری منحرف میشود و آنها در واقع این کار را انجام میدهند (منفی کاذب). اعداد بالا برای هر کدام ممکن است ما را وادار کند که بیشتر در مورد اینکه آیا می توانیم از مدل برای تصمیم گیری استفاده کنیم، فکر کنیم.
برگردیم به بررسی اجمالی برگه، برای بررسی تاثیر هر ستون. این اطلاعات می تواند به تیم بازاریابی کمک کند تا بینشی را به دست آورد که منجر به انجام اقداماتی برای کاهش ریزش مشتری می شود. به عنوان مثال، ما می توانیم هم کم و هم زیاد را ببینیم CustServ Calls
افزایش احتمال ریزش تیم بازاریابی می تواند بر اساس این آموخته ها اقداماتی را برای جلوگیری از ریزش مشتری انجام دهد. به عنوان مثال میتوان به ایجاد پرسشهای متداول دقیق در وبسایتها برای کاهش تماسهای خدمات مشتری، و اجرای کمپینهای آموزشی با مشتریان در مورد سؤالات متداول اشاره کرد که میتواند تعامل را حفظ کند.
مدل ما بسیار دقیق به نظر می رسد. ما میتوانیم مستقیماً یک پیشبینی تعاملی روی آن انجام دهیم پیش بینی تب، به صورت دسته ای یا تک (زمان واقعی) پیش بینی. در این مثال، ما چند تغییر در مقادیر مشخصی از ستون ها ایجاد کردیم و یک پیش بینی بلادرنگ انجام دادیم. Canvas نتیجه پیش بینی را همراه با سطح اطمینان به ما نشان می دهد.
فرض کنید یک مشتری فعلی داریم که استفاده زیر را دارد: Night Mins
40 است و Eve Mins
40 است. ما میتوانیم یک پیشبینی انجام دهیم، و مدل ما امتیاز اطمینان 93.2% را به دست میدهد که این مشتری از بین خواهد رفت (True
). اکنون ممکن است برای حفظ این مشتری، تخفیف های تبلیغاتی ارائه دهیم.
فرض کنید یک مشتری فعلی داریم که کاربرد زیر را دارد: Night Mins
40 است و Eve Mins
40 است. ما میتوانیم یک پیشبینی انجام دهیم، و مدل ما امتیاز اطمینان 93.2% را به دست میدهد که این مشتری از بین خواهد رفت (True
). اکنون ممکن است برای حفظ این مشتری، تخفیف های تبلیغاتی ارائه دهیم.
اجرای یک پیشبینی برای تجزیه و تحلیل فردی چه-اگر عالی است، اما ما همچنین باید پیشبینیها را روی بسیاری از رکوردها به طور همزمان اجرا کنیم. بوم قادر است اجرای پیش بینی های دسته ای، که به شما امکان می دهد پیش بینی ها را در مقیاس اجرا کنید.
نتیجه
در این پست نشان دادیم که چگونه یک تحلیلگر کسب و کار می تواند با استفاده از داده های نمونه SageMaker Canvas یک مدل کاهش مشتری ایجاد کند. Canvas به تحلیلگران کسبوکار شما اجازه میدهد تا مدلهای ML دقیق ایجاد کنند و با استفاده از یک رابط بدون کد، بصری، نقطه و کلیک، پیشبینیهایی ایجاد کنند. یک تحلیلگر بازاریابی اکنون میتواند از این اطلاعات برای اجرای کمپینهای حفظ هدفمند و آزمایش سریعتر استراتژیهای کمپین جدید استفاده کند که منجر به کاهش ریزش مشتری میشود.
تحلیلگران می توانند با به اشتراک گذاشتن مدل های خود با همکاران دانشمند داده، این را به سطح بعدی برسانند. دانشمندان داده می توانند مدل Canvas را در آن مشاهده کنند Amazon SageMaker Studio، جایی که آنها می توانند انتخاب های Canvas AutoML را بررسی کنند، نتایج مدل را تأیید کنند، و حتی مدل را با چند کلیک تولید کنند. این می تواند ایجاد ارزش مبتنی بر ML را تسریع کند و به مقیاس سریعتر نتایج بهبود یافته کمک کند.
برای کسب اطلاعات بیشتر در مورد استفاده از Canvas، مراجعه کنید ساخت، اشتراک گذاری، استقرار: چگونه تحلیلگران کسب و کار و دانشمندان داده با استفاده از ML بدون کد و آمازون SageMaker Canvas به زمان سریع تری به بازار می رسند. برای اطلاعات بیشتر در مورد ایجاد مدلهای ML با راهحل بدون کد، رجوع کنید اعلام آمازون SageMaker Canvas – قابلیت یادگیری ماشینی بصری و بدون کد برای تحلیلگران کسب و کار.
درباره نویسنده
هنری روبالینو یک معمار راه حل در AWS، مستقر در نیوجرسی است. او به یادگیری ابری و ماشینی و نقشی که می توانند در جامعه ایفا کنند، علاقه دارد. او با همکاری با مشتریان برای کمک به آنها در دستیابی به اهداف تجاری خود با استفاده از AWS Cloud به این امر دست می یابد. در خارج از محل کار، می توانید هنری را در حال سفر یا کاوش در فضای باز با دختر خزدارش آرلی بیابید.
چائوران وانگ یک معمار راه حل در AWS، مستقر در دالاس، TX است. او از زمان فارغ التحصیلی از دانشگاه تگزاس در دالاس در سال 2016 با مدرک کارشناسی ارشد در علوم کامپیوتر در AWS کار می کند. Chaoran به مشتریان کمک می کند تا برنامه های کاربردی مقیاس پذیر، ایمن و مقرون به صرفه بسازند و راه حل هایی برای حل چالش های تجاری خود در AWS Cloud بیابند. چائوران در خارج از محل کار، عاشق گذراندن وقت با خانواده و دو سگ، بیوبیو و کوکو است.
- Coinsmart. بهترین صرافی بیت کوین و کریپتو اروپا.
- پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی رایگان.
- CryptoHawk. رادار آلت کوین امتحان رایگان.
- منبع: https://aws.amazon.com/blogs/machine-learning/predicting-customer-churn-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- درباره ما
- شتاب دادن
- دسترسی
- حساب
- دقیق
- اقدامات
- اضافی
- مدیر سایت
- مدیران
- پیشرفته
- معرفی
- آمازون
- تحلیل
- روانکاو
- برنامه های کاربردی
- مناسب
- تقریبا
- محدوده
- خواص
- در دسترس
- میانگین
- AWS
- بهترین
- خارج از
- بزرگترین
- مرز
- ساختن
- بنا
- می سازد
- کسب و کار
- کسب و کار
- خرید
- صدا
- کمپین بین المللی حقوق بشر
- مبارزات
- می توانید دریافت کنید
- نامزد
- نقاشی
- دسته بندی
- معین
- چالش ها
- تغییر دادن
- بار
- انتخاب
- را انتخاب کنید
- کلاس
- طبقه بندی
- ابر
- رمز
- همکاران
- ستون
- مقایسه
- کامپیوتر
- علم کامپیوتر
- اعتماد به نفس
- گیجی
- کنسول
- شامل
- ادامه دادن
- مقرون به صرفه
- میتوانست
- ایجاد
- ایجاد
- ایجاد
- مشتری
- خدمات مشتری
- مشتریان
- دالاس
- داده ها
- دانشمند داده
- عمیق تر
- تاخیر
- بستگی دارد
- گسترش
- دقیق
- مشخص کردن
- مستقیما
- صفحه نمایش
- نمی کند
- آموزش
- نامزدی
- مهندسی
- برآورد
- مثال
- موجود
- انتظار می رود
- تجربه
- کارشناسان
- اکتشاف
- چشم
- عوامل
- خانواده
- پاسخ به برخی سوالات مهم
- FAST
- سریعتر
- ویژگی
- امکانات
- پایان
- نام خانوادگی
- پیروی
- قالب
- تولید می کنند
- اهداف
- خوب
- بزرگ
- بزرگترین
- شدن
- داشتن
- کمک
- کمک می کند
- اینجا کلیک نمایید
- زیاد
- چگونه
- HTTPS
- صدها نفر
- ICON
- شناسایی
- شناسایی
- تأثیر
- تأثیرگذار
- اهمیت
- مهم
- بهبود یافته
- شامل
- افزایش
- افزایش
- فرد
- اطلاعات
- ورودی
- بینش
- تعاملی
- رابط
- بین المللی
- IT
- رهبری
- برجسته
- یاد گرفتن
- یادگیری
- ترک کردن
- سطح
- لاین
- محلی
- دستگاه
- فراگیری ماشین
- ساخته
- عمده
- ساخت
- مدیریت
- مدیریت
- مدیریت
- بازار یابی (Marketing)
- کارشناسی ارشد
- ماتریس
- معنی
- متریک
- ذهن
- ML
- موبایل
- تلفن همراه
- مدل
- مدل
- بیش
- اکثر
- منفی
- عدد
- تعداد
- پیشنهادات
- بهینه
- گزینه
- گزینه
- دیگر
- خارج از منزل
- احساساتی
- کارایی
- بازی
- سیاست
- مثبت
- ممکن
- پتانسیل
- پیش بینی
- پیش گویی
- پیش بینی
- در حال حاضر
- زیبا
- پیش نمایش
- اصلی
- روند
- مشخصات
- منافع
- ترویج
- تبلیغاتی
- ارائه
- فراهم می کند
- سریع
- زمان واقعی
- توصیه می کند
- رکورد
- سوابق
- كاهش دادن
- باقی مانده
- از بین بردن
- ضروری
- منابع
- نتایج
- بازده
- درامد
- این فایل نقد می نویسید:
- خطر
- دویدن
- در حال اجرا
- مقیاس پذیر
- مقیاس
- علم
- دانشمند
- دانشمندان
- ثانیه
- امن
- سرویس
- تنظیم
- اشتراک گذاری
- اشتراک
- مشابه
- ساده
- اندازه
- So
- جامعه
- جامد
- راه حل
- مزایا
- حل
- برخی از
- سرعت
- خرج کردن
- هزینه
- استاندارد
- دولت
- وضعیت
- ذخیره سازی
- استراتژی ها
- مصرف
- هدف
- تیم
- ارتباط از راه دور
- آزمون
- تست
- وابسته به تکزاس
- زمان
- امروز
- بالا
- آموزش
- سفر
- اعتماد
- TX
- فهمیدن
- دانشگاه
- us
- استفاده کنید
- کاربران
- ارزش
- بررسی
- چشم انداز
- صدا
- وب سایت
- چی
- چه شده است
- چه
- WHO
- ویکیپدیا
- مهاجرت کاری
- کارگر
- خواهد بود