Understanding customer behavior is top of mind for every business today. Gaining insights into why and how customers buy can help grow revenue. But losing customers (also called customer churn) is always a risk, and insights into why customers leave can be just as important for maintaining revenues and profits. Machine learning (ML) can help with insights, but up until now you needed ML experts to build models to predict churn, the lack of which could delay insight-driven actions by businesses to retain customers.
In this post, we show you how business analysts can build a customer churn ML model with আমাজন সেজমেকার ক্যানভাস, no code required. Canvas provides business analysts with a visual point-and-click interface that allows you to build models and generate accurate ML predictions on your own—without requiring any ML experience or having to write a single line of code.
সমাধান ওভারভিউ
For this post, we assume the role of a marketing analyst in the marketing department of a mobile phone operator. We have been tasked with identifying customers that are potentially at risk of churning. We have access to service usage and other customer behavior data, and want to know if this data can help explain why a customer would leave. If we can identify factors that explain churn, then we can take corrective actions to change predicted behavior, such as running targeted retention campaigns.
To do this, we use the data we have in a CSV file, which contains information about customer usage and churn. We use Canvas to perform the following steps:
- Import the churn dataset from আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3)।
- Train and build the churn model.
- মডেল ফলাফল বিশ্লেষণ.
- মডেলের বিরুদ্ধে পরীক্ষা ভবিষ্যদ্বাণী।
আমাদের ডেটাসেটের জন্য, আমরা একটি ব্যবহার করি সিন্থেটিক ডেটাসেট from a telecommunications mobile phone carrier. This sample dataset contains 5,000 records, where each record uses 21 attributes to describe the customer profile. The attributes are as follows:
- রাষ্ট্র – The US state in which the customer resides, indicated by a two-letter abbreviation; for example, OH or NJ
- অ্যাকাউন্টের দৈর্ঘ্য – The number of days that this account has been active
- এরিয়া কোড – The three-digit area code of the customer’s phone number
- মোবাইল নাম্বার – The remaining seven-digit phone number
- আন্তর্জাতিক পরিকল্পনা – Whether the customer has an international calling plan (yes/no)
- VMail পরিকল্পনা – Whether the customer has a voice mail feature (yes/no)
- VMail বার্তা – The average number of voice mail messages per month
- দিন মিনিট – The total number of calling minutes used during the day
- ডে কল – The total number of calls placed during the day
- ডে চার্জ – The billed cost of daytime calls
- Eve Mins, Eve Calls, ইভ চার্জ – The billed cost for evening calls
- Night Mins, নাইট কল, নাইট চার্জ – The billed cost for nighttime calls
- Intl Mins, Intl Calls, ইন্টাল চার্জ – The billed cost for international calls
- CustServ কল – The number of calls placed to customer service
- মন্থন? – Whether the customer left the service (true/false)
The last attribute, Churn?
, is the attribute that we want the ML model to predict. The target attribute is binary, meaning our model predicts the output as one of two categories (True
or False
).
পূর্বশর্ত
একজন ক্লাউড অ্যাডমিনের সাথে এডাব্লুএস অ্যাকাউন্ট নিম্নলিখিত পূর্বশর্তগুলি সম্পূর্ণ করার জন্য উপযুক্ত অনুমতির প্রয়োজন হয়:
- স্থাপন করা an আমাজন সেজমেকার নির্দেশাবলীর জন্য দেখুন Amazon SageMaker ডোমেনে অনবোর্ড.
- Deploy Canvas. For instructions, see অ্যামাজন সেজমেকার ক্যানভাস সেট আপ এবং পরিচালনা করা (আইটি প্রশাসকদের জন্য).
- ক্যানভাসের জন্য ক্রস-অরিজিন রিসোর্স শেয়ারিং (CORS) নীতি কনফিগার করুন। নির্দেশাবলীর জন্য, দেখুন আপনার ব্যবহারকারীদের স্থানীয় ফাইল আপলোড করার ক্ষমতা দিন.
একটি গ্রাহক মন্থন মডেল তৈরি করুন
First, let’s download the মন্থন ডেটাসেট and review the file to make sure all the data is there. Then complete the following steps:
- সাইন ইন করুন এডাব্লুএস ম্যানেজমেন্ট কনসোল, ক্যানভাস অ্যাক্সেস করার জন্য উপযুক্ত অনুমতি সহ একটি অ্যাকাউন্ট ব্যবহার করে।
- ক্যানভাস কনসোলে লগ ইন করুন।
This is where we can manage our datasets and create models.
- বেছে নিন আমদানি.
- বেছে নিন আপলোড এবং নির্বাচন করুন
churn.csv
ফাইল. - বেছে নিন তথ্য আমদানি ক্যানভাসে আপলোড করতে।
The import process takes approximately 10 seconds (this can vary depending on dataset size). When it’s complete, we can see the dataset is in Ready
অবস্থা।
- To preview the first 100 rows of the dataset, hover your mouse over the eye icon.
A preview of the dataset appears. Here we can verify that our data is correct.
After we confirm that the imported dataset is ready, we create our model.
- বেছে নিন নতুন মডেল.
- Select the churn.csv dataset and choose ডেটাসেট নির্বাচন করুন.
Now we configure the build model process.
- জন্য Target columns, পছন্দ করা
Churn?
কলাম।
জন্য মডেলের ধরন, Canvas automatically recommends the model type, in this case 2 বিভাগের পূর্বাভাস (what a data scientist would call binary classification). This is suitable for our use case because we have only two possible prediction values: True
or False
, so we go with the recommendation Canvas made.
We now validate some assumptions. We want to get a quick view into whether our target column can be predicted by the other columns. We can get a fast view into the model’s estimated accuracy and column impact (the estimated importance of each column in predicting the target column).
- Select all 21 columns and choose প্রিভিউ মডেল.
This feature uses a subset of our dataset and only a single pass at modeling. For our use case, the preview model takes approximately 2 minutes to build.
নিম্নলিখিত স্ক্রিনশট হিসাবে দেখানো হয়েছে, Phone
এবং State
columns have much less impact on our prediction. We want to be careful when removing text input because it can contain important discrete, categorical features contributing to our prediction. Here, the phone number is just the equivalent of an account number—not of value in predicting other accounts’ likelihood of churn, and the customer’s state doesn’t impact our model much.
- We remove these columns because they have no major feature importance.
- After we remove the
Phone
এবংState
columns, let’s run the preview again.
As shown in the following screenshot, the model accuracy increased by 0.1%. Our preview model has a 95.9% estimated accuracy, and the columns with the biggest impact are Night Calls
, Eve Mins
, এবং Night Charge
. This gives us an insight into what columns impact the performance of our model the most. Here we need to be careful when doing feature selection because if a single feature is extremely impactful on a model’s outcome, it’s a primary indicator of target leakage, and the feature won’t be available at the time of prediction. In this case, few columns showed very similar impact, so we continue to build our model.
Canvas offers two build options:
- স্ট্যান্ডার্ড বিল্ড – Builds the best model from an optimized process powered by অটোমেল; speed is exchanged for greatest accuracy
- দ্রুত বিল্ড – Builds a model in a fraction of the time compared to a standard build; potential accuracy is exchanged for speed.
- For this post, we choose the স্ট্যান্ডার্ড বিল্ড option because we want to have the very best model and we are willing to spend additional time waiting the result.
The build process can take 2–4 hours. During this time, Canvas tests hundreds of candidate pipelines, selecting the best model to present to us. In the following screenshot, we can see the expected build time and progress.
মডেল কর্মক্ষমতা মূল্যায়ন
When the model building process is complete, the model predicted churn 97.9% of the time. This seems fine, but as analysts we want to dive deeper and see if we can trust the model to make decisions based on it. On the স্কোরিং tab, we can review a visual plot of our predictions mapped to their outcomes. This allows us a deeper insight into our model.
Canvas separates the dataset into training and test sets. The training dataset is the data Canvas uses to build the model. The test set is used to see if the model performs well with new data. The Sankey diagram in the following screenshot shows how the model performed on the test set. To learn more, refer to অ্যামাজন সেজমেকার ক্যানভাসে আপনার মডেলের কর্মক্ষমতা মূল্যায়ন করা হচ্ছে.
To get more detailed insights beyond what is displayed in the Sankey diagram, business analysts can use a বিভ্রান্তি ম্যাট্রিক্স analysis for their business solutions. For example, we want to better understand the likelihood of the model making false predictions. We can see this in the Sankey diagram, but want more insights, so we choose উন্নত মেট্রিক্স. We’re presented with a confusion matrix, which displays the performance of a model in a visual format with the following values, specific to the positive class—we’re measuring based on whether they will in fact churn, so our positive class is True
এই উদাহরণে:
- ট্রু পজিটিভ (টিপি) - সংখ্যা
True
results that were correctly predicted asTrue
- True Negative (TN) - সংখ্যা
False
results that were correctly predicted asFalse
- ফলস পজিটিভ (FP) - সংখ্যা
False
results that were wrongly predicted asTrue
- মিথ্যা নেতিবাচক (FN) - সংখ্যা
True
results that were wrongly predicted asFalse
We can use this matrix chart to determine not only how accurate our model is, but when it is wrong, how often that might be and how it’s wrong.
The advanced metrics look good. We can trust the model result. We see very low false positives and false negatives. These are if the model thinks a customer in the dataset will churn and they actually don’t (false positive), or if the model thinks the customer will churn and they actually do (false negative). High numbers for either might make us think more on if we can use the model to make decisions.
এর ফিরে যাওয়া যাক সংক্ষিপ্ত বিবরণ tab, to review the impact of each column. This information can help the marketing team gain insights that lead to taking actions to reduce customer churn. For example, we can see that both low and high CustServ Calls
increase the likelihood of churn. The marketing team can take actions to prevent customer churn based on these learnings. Examples include creating a detailed FAQ on websites to reduce customer service calls, and running education campaigns with customers on the FAQ that can keep engagement up.
Our model looks pretty accurate. We can directly perform an interactive prediction on the ভবিষ্যদ্বাণী করা tab, either in batch or single (real-time) prediction. In this example, we made a few changes to certain column values and performed a real-time prediction. Canvas shows us the prediction result along with the confidence level.
Let’s say we have an existing customer who has the following usage: Night Mins
40 এবং Eve Mins
is 40. We can run a prediction, and our model returns a confidence score of 93.2% that this customer will churn (True
). We might now choose to provide promotional discounts to retain this customer.
Let’s say we have an existing customer who has the following the usage: Night Mins
40 এবং Eve Mins
is 40. We can run a prediction, and our model returns a confidence score of 93.2% that this customer will churn (True
). We might now choose to provide promotion discounts to retain this customer.
Running one prediction is great for individual what-if analysis, but we also need to run predictions on many records at once. Canvas is able to run batch predictions, which allows you to run predictions at scale.
উপসংহার
In this post, we showed how a business analyst can create a customer churn model with SageMaker Canvas using sample data. Canvas allows your business analysts to create accurate ML models and generate predictions using a no-code, visual, point-and-click interface. A marketing analysist can now use this information to run targeted retention campaigns and test new campaign strategies faster, leading to a reduction in customer churn.
Analysts can take this to the next level by sharing their models with data scientist colleagues. The data scientists can view the Canvas model in অ্যামাজন সেজমেকার স্টুডিও, where they can explore the choices Canvas AutoML made, validate model results, and even productionalize the model with a few clicks. This can accelerate ML-based value creation and help scale improved outcomes faster.
ক্যানভাস ব্যবহার সম্পর্কে আরও জানতে, দেখুন তৈরি করুন, ভাগ করুন, স্থাপন করুন: কীভাবে ব্যবসায় বিশ্লেষক এবং ডেটা বিজ্ঞানীরা নো-কোড এমএল এবং অ্যামাজন সেজমেকার ক্যানভাস ব্যবহার করে দ্রুত সময়ে বাজার অর্জন করেন. নো-কোড সমাধান সহ এমএল মডেল তৈরি করার বিষয়ে আরও তথ্যের জন্য, দেখুন অ্যামাজন সেজমেকার ক্যানভাস ঘোষণা করা হচ্ছে – ব্যবসায়িক বিশ্লেষকদের জন্য একটি ভিজ্যুয়াল, নো কোড মেশিন লার্নিং ক্ষমতা.
লেখক সম্পর্কে
Henry Robalino is a Solutions Architect at AWS, based out of NJ. He is passionate about cloud and machine learning, and the role they can play in society. He achieves this by working with customers to help them achieve their business goals using the AWS Cloud. Outside of work, you can find Henry traveling or exploring the outdoors with his fur daughter Arly.
Chaoran Wang is a Solution Architect at AWS, based in Dallas, TX. He has been working at AWS since graduating from the University of Texas at Dallas in 2016 with a master’s in Computer Science. Chaoran helps customers build scalable, secure, and cost-effective applications and find solutions to solve their business challenges on the AWS Cloud. Outside work, Chaoran loves spending time with his family and two dogs, Biubiu and Coco.
- Coinsmart. ইউরোপের সেরা বিটকয়েন এবং ক্রিপ্টো এক্সচেঞ্জ।
- প্লেটোব্লকচেন। Web3 মেটাভার্স ইন্টেলিজেন্স। জ্ঞান প্রসারিত. বিনামূল্যে এক্সেস.
- ক্রিপ্টোহক। Altcoin রাডার। বিনামূল্যে ট্রায়াল.
- Source: https://aws.amazon.com/blogs/machine-learning/predicting-customer-churn-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- সম্পর্কে
- দ্রুততর করা
- প্রবেশ
- হিসাব
- সঠিক
- স্টক
- অতিরিক্ত
- অ্যাডমিন
- অ্যাডমিনিস্ট্রেটররা
- অগ্রসর
- সব
- মর্দানী স্ত্রীলোক
- বিশ্লেষণ
- বিশ্লেষক
- অ্যাপ্লিকেশন
- যথাযথ
- আন্দাজ
- এলাকায়
- বৈশিষ্ট্যাবলী
- সহজলভ্য
- গড়
- ডেস্কটপ AWS
- সর্বোত্তম
- তার পরেও
- বৃহত্তম
- সীমান্ত
- নির্মাণ করা
- ভবন
- তৈরী করে
- ব্যবসায়
- ব্যবসা
- কেনা
- কল
- ক্যাম্পেইন
- প্রচারাভিযান
- পেতে পারি
- প্রার্থী
- ক্যানভাস
- বিভাগ
- কিছু
- চ্যালেঞ্জ
- পরিবর্তন
- অভিযোগ
- পছন্দ
- বেছে নিন
- শ্রেণী
- শ্রেণীবিন্যাস
- মেঘ
- কোড
- সহকর্মীদের
- স্তম্ভ
- তুলনা
- কম্পিউটার
- কম্পিউটার বিজ্ঞান
- বিশ্বাস
- বিশৃঙ্খলা
- কনসোল
- ধারণ
- অবিরত
- সাশ্রয়ের
- পারা
- সৃষ্টি
- তৈরি করা হচ্ছে
- সৃষ্টি
- ক্রেতা
- গ্রাহক সেবা
- গ্রাহকদের
- ডালাস
- উপাত্ত
- তথ্য বিজ্ঞানী
- গভীর
- বিলম্ব
- নির্ভর করে
- স্থাপন
- বিশদ
- নির্ধারণ
- সরাসরি
- প্রদর্শন
- না
- প্রশিক্ষণ
- প্রবৃত্তি
- প্রকৌশল
- আনুমানিক
- উদাহরণ
- বিদ্যমান
- প্রত্যাশিত
- অভিজ্ঞতা
- বিশেষজ্ঞদের
- অন্বেষণ করুণ
- চোখ
- কারণের
- পরিবার
- FAQ
- দ্রুত
- দ্রুত
- বৈশিষ্ট্য
- বৈশিষ্ট্য
- জরিমানা
- প্রথম
- অনুসরণ
- বিন্যাস
- উত্পাদন করা
- গোল
- ভাল
- মহান
- সর্বাধিক
- হত্তয়া
- জমিদারি
- সাহায্য
- সাহায্য
- এখানে
- উচ্চ
- কিভাবে
- HTTPS দ্বারা
- শত শত
- আইকন
- সনাক্ত করা
- চিহ্নিতকরণের
- প্রভাব
- প্রভাবী
- গুরুত্ব
- গুরুত্বপূর্ণ
- উন্নত
- অন্তর্ভুক্ত করা
- বৃদ্ধি
- বর্ধিত
- স্বতন্ত্র
- তথ্য
- ইনপুট
- অর্ন্তদৃষ্টি
- ইন্টারেক্টিভ
- ইন্টারফেস
- আন্তর্জাতিক
- IT
- নেতৃত্ব
- নেতৃত্ব
- শিখতে
- শিক্ষা
- ত্যাগ
- উচ্চতা
- লাইন
- স্থানীয়
- মেশিন
- মেশিন লার্নিং
- প্রণীত
- মুখ্য
- মেকিং
- পরিচালনা করা
- ব্যবস্থাপনা
- পরিচালক
- Marketing
- মাস্টার্স
- জরায়ু
- অর্থ
- ছন্দোবিজ্ঞান
- মন
- ML
- মোবাইল
- মোবাইল ফোন
- মডেল
- মডেল
- অধিক
- সেতু
- নেতিবাচক
- সংখ্যা
- সংখ্যার
- অফার
- অপ্টিমাইজ
- পছন্দ
- অপশন সমূহ
- অন্যান্য
- বিদেশে
- কামুক
- কর্মক্ষমতা
- খেলা
- নীতি
- ধনাত্মক
- সম্ভব
- সম্ভাব্য
- ভবিষ্যদ্বাণী করা
- ভবিষ্যদ্বাণী
- ভবিষ্যতবাণী
- বর্তমান
- চমত্কার
- প্রি
- প্রাথমিক
- প্রক্রিয়া
- প্রোফাইল
- লাভ
- পদোন্নতি
- প্রচারমূলক
- প্রদান
- উপলব্ধ
- দ্রুত
- প্রকৃত সময়
- বিশেষ পরামর্শ দেওয়া হচ্ছে
- নথি
- রেকর্ড
- হ্রাস করা
- অবশিষ্ট
- সরানোর
- প্রয়োজনীয়
- সংস্থান
- ফলাফল
- আয়
- রাজস্ব
- এখানে ক্লিক করুন
- ঝুঁকি
- চালান
- দৌড়
- মাপযোগ্য
- স্কেল
- বিজ্ঞান
- বিজ্ঞানী
- বিজ্ঞানীরা
- সেকেন্ড
- নিরাপদ
- সেবা
- সেট
- শেয়ার
- শেয়ারিং
- অনুরূপ
- সহজ
- আয়তন
- So
- সমাজ
- কঠিন
- সমাধান
- সলিউশন
- সমাধান
- কিছু
- স্পীড
- ব্যয় করা
- খরচ
- মান
- রাষ্ট্র
- অবস্থা
- স্টোরেজ
- কৌশল
- গ্রহণ
- লক্ষ্য
- টীম
- টেলিযোগাযোগ
- পরীক্ষা
- পরীক্ষা
- টেক্সাস
- সময়
- আজ
- শীর্ষ
- প্রশিক্ষণ
- ভ্রমণ
- আস্থা
- TX
- বোঝা
- বিশ্ববিদ্যালয়
- us
- ব্যবহার
- ব্যবহারকারী
- মূল্য
- যাচাই
- চেক
- কণ্ঠস্বর
- ওয়েবসাইট
- কি
- কিনা
- হু
- উইকিপিডিয়া
- হয়া যাই ?
- কাজ
- would