חזה נטישה של לקוחות עם למידת מכונה ללא קוד באמצעות Amazon SageMaker Canvas

הועלה מחדש על ידי אפלטון

עוקב: 0

הבנת התנהגות הלקוחות היא בראש מעייניו של כל עסק כיום. השגת תובנות לגבי מדוע וכיצד לקוחות קונים יכולים לעזור להגדיל את ההכנסות. אבל אובדן לקוחות (נקרא גם נטישת לקוחות) הוא תמיד סיכון, ותובנות לגבי הסיבה שלקוחות עוזבים יכולות להיות חשובות לא פחות לשמירה על הכנסות ורווחים. למידת מכונה (ML) יכולה לעזור עם תובנות, אבל עד עכשיו היית צריך מומחי ML כדי לבנות מודלים לחזות נטישה, שהיעדרם עלול לעכב פעולות מונעות תובנות של עסקים כדי לשמר לקוחות.

בפוסט זה, אנו מראים לכם כיצד אנליסטים עסקיים יכולים לבנות מודל ML של נטישת לקוחות אמזון SageMaker Canvas, אין צורך בקוד. Canvas מספקת לאנליסטים עסקיים ממשק חזותי של הצבע והקלקה המאפשר לך לבנות מודלים וליצור תחזיות ML מדויקות בעצמך - מבלי לדרוש ניסיון ב-ML או צורך לכתוב שורת קוד אחת.

סקירה כללית של הפיתרון

עבור פוסט זה, אנו מקבלים את התפקיד של אנליסט שיווקי במחלקת השיווק של מפעיל טלפונים סלולריים. הוטלה עלינו משימה לזהות לקוחות שעלולים להיות בסיכון לנטישה. יש לנו גישה לשימוש בשירות ונתוני התנהגות אחרים של לקוחות, ורוצים לדעת אם נתונים אלה יכולים לעזור להסביר מדוע לקוח יעזוב. אם נוכל לזהות גורמים המסבירים נטישה, נוכל לנקוט בפעולות מתקנות לשינוי התנהגות חזויה, כגון הפעלת מסעות פרסום ממוקדים לשמירה.

לשם כך, אנו משתמשים בנתונים שיש לנו בקובץ CSV, המכיל מידע על שימוש ו-churn של לקוחות. אנו משתמשים ב-Canvas כדי לבצע את השלבים הבאים:

ייבא את מערך הנתונים של הנטישה מ שירות אחסון פשוט של אמזון (אמזון S3).
אימון ובנה את מודל הנטישה.
נתח את תוצאות המודל.
בדוק תחזיות מול המודל.

עבור מערך הנתונים שלנו, אנו משתמשים ב-a מערך נתונים סינתטי מחברת טלפונים ניידים. מערך נתונים לדוגמה זה מכיל 5,000 רשומות, כאשר כל רשומה משתמשת ב-21 תכונות לתיאור פרופיל הלקוח. התכונות הן כדלקמן:

מדינה – המדינה בארה"ב בה מתגורר הלקוח, המצוינת בקיצור בן שתי אותיות; לדוגמה, OH או NJ
אורך החשבון – מספר הימים שבהם חשבון זה היה פעיל
קידומת - אזור החיוג בן שלוש הספרות של מספר הטלפון של הלקוח
טלפון – מספר הטלפון הנותר בן שבע הספרות
תוכנית בינלאומית - האם ללקוח יש תוכנית שיחות בינלאומיות (כן/לא)
תוכנית VMail - האם ללקוח יש תכונת דואר קולי (כן/לא)
הודעת VMail – המספר הממוצע של הודעות תא קולי בחודש
דקות יום – המספר הכולל של דקות שיחה בשימוש במהלך היום
שיחות יום – המספר הכולל של שיחות שבוצעו במהלך היום
חיוב יום – העלות החיובית של שיחות בשעות היום
איב מינס, איב מתקשרת, חיוב חווה – העלות החיובית עבור שיחות ערב
דקות לילה, שיחות לילה, חיוב לילה – העלות החיובית עבור שיחות לילה
דקות בינלאומיות, שיחות בינלאומיות, חיוב בינלאומי – העלות החיובית עבור שיחות בינלאומיות
שיחות CustServ – מספר השיחות שבוצעו לשירות הלקוחות
מַחבֵּצָה? - האם הלקוח עזב את השירות (נכון/לא נכון)

התכונה האחרונה, Churn?, היא התכונה שאנו רוצים שמודל ה-ML יחזה. תכונת המטרה היא בינארית, כלומר המודל שלנו חוזה את הפלט כאחת משתי קטגוריות (True or False).

תנאים מוקדמים

מנהל ענן עם חשבון AWS נדרשים הרשאות מתאימות כדי להשלים את התנאים המוקדמים הבאים:

פרוס an אמזון SageMaker להוראות ראה נכלל ב-Amazon SageMaker Domain.
פרוס קנבס. להנחיות, ראה הגדרה וניהול של Amazon SageMaker Canvas (עבור מנהלי IT).
הגדר מדיניות שיתוף משאבים חוצי מוצא (CORS) עבור Canvas. להנחיות, ראה תן למשתמשים שלך את היכולת להעלות קבצים מקומיים.

צור מודל של נטישת לקוחות

ראשית, בואו נוריד את ה מערך נתונים של נטישה ועיין בקובץ כדי לוודא שכל הנתונים נמצאים שם. לאחר מכן השלם את השלבים הבאים:

היכנס ל- קונסולת הניהול של AWS, באמצעות חשבון עם ההרשאות המתאימות לגישה ל-Canvas.
היכנס לקונסולת Canvas.

זה המקום שבו אנחנו יכולים לנהל את מערכי הנתונים שלנו וליצור מודלים.

לבחור תבואו.

בחר לחצן ייבוא קנבס

לבחור העלה ובחר את churn.csv קובץ.
לבחור ייבא נתונים כדי להעלות אותו לקנבס.

קנבס בחר נתונים מ-s3

תהליך הייבוא אורך כ-10 שניות (זה יכול להשתנות בהתאם לגודל מערך הנתונים). כשזה יושלם, נוכל לראות את מערך הנתונים נמצא בפנים Ready מעמד.

ערכת נתונים מוכנה לקנבס

לתצוגה מקדימה של 100 השורות הראשונות של מערך הנתונים, העבר את העכבר מעל סמל העין.

ערכת נתונים של תצוגת קנבס

תופיע תצוגה מקדימה של מערך הנתונים. כאן נוכל לוודא שהנתונים שלנו נכונים.

Canvas Verify Data

לאחר שנאשר כי מערך הנתונים המיובא מוכן, אנו יוצרים את המודל שלנו.

לבחור מודל חדש.

קנבס דגמים חדשים

בחר את מערך הנתונים churn.csv ובחר בחר מערך נתונים.

ערכת נתונים בחר קנבס

כעת אנו מגדירים את תהליך בניית המודל.

בעד עמודות יעד, בחר את Churn? עמודה.

בעד סוג דגם, Canvas ממליץ באופן אוטומטי על סוג הדגם, במקרה זה חיזוי 2 קטגוריות (מה שמדען נתונים יכנה סיווג בינארי). זה מתאים למקרה השימוש שלנו מכיוון שיש לנו רק שני ערכי חיזוי אפשריים: True or False, אז אנחנו הולכים עם ההמלצה Canvas עשה.

דגם בניית קנבס

כעת אנו מאמתים כמה הנחות. אנו רוצים לקבל מבט מהיר על האם ניתן לחזות את עמודת היעד שלנו על ידי העמודות האחרות. נוכל לקבל מבט מהיר על הדיוק וההשפעה המשוערת של המודל (החשיבות המשוערת של כל עמודה בחיזוי עמודת היעד).

בחר את כל 21 העמודות ובחר דגם תצוגה מקדימה.

תכונה זו משתמשת בתת-קבוצה של מערך הנתונים שלנו ובמעבר בודד בלבד במודלים. במקרה השימוש שלנו, בניית מודל התצוגה המקדימה לוקחת בערך 2 דקות.

דגם תצוגה מקדימה של קנבס

כפי שמוצג בצילום המסך הבא, ה Phone ו State לעמודות יש הרבה פחות השפעה על התחזית שלנו. אנו רוצים להיות זהירים בעת הסרת קלט טקסט מכיוון שהוא יכול להכיל תכונות דיסקרטיות וקטגוריות חשובות התורמות לתחזית שלנו. כאן, מספר הטלפון הוא רק המקבילה למספר חשבון - לא בעל ערך בחיזוי הסבירות לנטישה של חשבונות אחרים, ומצבו של הלקוח לא משפיע הרבה על המודל שלנו.

אנו מסירים את העמודות הללו מכיוון שאין להן חשיבות תכונה גדולה.
לאחר שנסיר את Phone ו State עמודות, הבה נריץ שוב את התצוגה המקדימה.

כפי שמוצג בצילום המסך הבא, דיוק הדגם גדל ב-0.1%. למודל התצוגה המקדימה שלנו יש דיוק משוער של 95.9%, והעמודות עם ההשפעה הגדולה ביותר הן Night Calls, Eve Mins, ו Night Charge. זה נותן לנו תובנה לגבי העמודות המשפיעות ביותר על הביצועים של המודל שלנו. כאן עלינו להיות זהירים בעת בחירת תכונה מכיוון שאם תכונה בודדת משפיעה מאוד על התוצאה של מודל, זה אינדיקטור ראשוני של דליפת מטרה, והתכונה לא תהיה זמינה בזמן החיזוי. במקרה זה, מעט עמודות הראו השפעה דומה מאוד, אז אנחנו ממשיכים לבנות את המודל שלנו.

הנדסת תכונות קנבס לאחר

קנבס מציע שתי אפשרויות בנייה:

מבנה סטנדרטי - בונה את הדגם הטוב ביותר מתהליך אופטימלי המופעל על ידי AutoML; מהירות מוחלפת לדיוק הגדול ביותר
בנייה מהירה – בונה מודל בשבריר מהזמן בהשוואה למבנה רגיל; דיוק פוטנציאלי מוחלף למהירות.

עבור פוסט זה, אנו בוחרים את מבנה סטנדרטי אפשרות כי אנחנו רוצים לקבל את הדגם הטוב ביותר ואנו מוכנים להשקיע זמן נוסף בהמתנה לתוצאה.

מבנה קנבס סטנדרטי

תהליך הבנייה יכול להימשך 2-4 שעות. במהלך תקופה זו, Canvas בודק מאות צינורות מועמדים, בוחרת את הדגם הטוב ביותר להציג בפנינו. בצילום המסך הבא, נוכל לראות את זמן הבנייה וההתקדמות הצפוי.

מודל ניתוח קנבס

הערכת ביצועי המודל

כאשר תהליך בניית המודל הושלם, המודל חזה נטישה של 97.9% מהמקרים. זה נראה בסדר, אבל כאנליסטים אנחנו רוצים לצלול לעומק ולראות אם אנחנו יכולים לסמוך על המודל שיקבל החלטות על סמך זה. על מניה בכרטיסייה, נוכל לסקור עלילה ויזואלית של התחזיות שלנו הממופות לתוצאות שלהן. זה מאפשר לנו תובנה עמוקה יותר לגבי המודל שלנו.

Canvas מפריד את מערך הנתונים לקבוצות הדרכה ובדיקות. מערך ההדרכה הוא הנתונים שבהם משתמש Canvas לבניית המודל. ערכת הבדיקה משמשת כדי לראות אם המודל מתפקד היטב עם נתונים חדשים. דיאגרמת Sankey בצילום המסך הבא מציגה את ביצועי הדגם במערך הבדיקה. למידע נוסף, עיין ב הערכת הביצועים של הדגם שלך ב-Amazon SageMaker Canvas.

כדי לקבל תובנות מפורטות יותר מעבר למה שמוצג בתרשים Sankey, אנליסטים עסקיים יכולים להשתמש ב-a מטריצת בלבול ניתוח עבור הפתרונות העסקיים שלהם. לדוגמה, אנו רוצים להבין טוב יותר את הסבירות שהמודל יבצע תחזיות שווא. אנחנו יכולים לראות את זה בתרשים Sankey, אבל רוצים יותר תובנות, אז אנחנו בוחרים מדדים מתקדמים. מוצגת לנו מטריצת בלבול, המציגה את הביצועים של מודל בפורמט ויזואלי עם הערכים הבאים, ספציפיים למחלקה החיובית - אנו מודדים על סמך האם הם אכן יתפוגגו, כך שהמחלקה החיובית שלנו היא True בדוגמה זו:

חיובי אמיתי (TP) - מספר ה True תוצאות שנחזו נכון כ True
שלילי אמיתי (TN) - מספר ה False תוצאות שנחזו נכון כ False
חיובי כוזב (FP) - מספר ה False תוצאות שנחזו בטעות כ True
שלילי כוזב (FN) - מספר ה True תוצאות שנחזו בטעות כ False

אנו יכולים להשתמש בתרשים המטריצה הזה כדי לקבוע לא רק עד כמה המודל שלנו מדויק, אלא גם מתי הוא שגוי, באיזו תדירות זה עשוי להיות וכיצד הוא שגוי.

קנבס F1 מטריקס

המדדים המתקדמים נראים טוב. אנחנו יכולים לסמוך על תוצאת המודל. אנו רואים חיוביות שגויות נמוכות מאוד ושליליות שגויות. אלו הן אם המודל חושב שלקוח במערך הנתונים יתבטל והם למעשה לא (false positive), או אם המודל חושב שהלקוח יתבטל והם אכן עושים זאת (false negative). מספרים גבוהים עבור אחד מהם עשויים לגרום לנו לחשוב יותר אם נוכל להשתמש במודל כדי לקבל החלטות.

בוא נחזור ל סקירה כללית לשונית, כדי לסקור את ההשפעה של כל עמודה. מידע זה יכול לעזור לצוות השיווק לקבל תובנות שיובילו לנקיטת פעולות להפחתת נטישת הלקוחות. לדוגמה, אנו יכולים לראות את זה גם נמוך וגם גבוה CustServ Calls להגדיל את הסבירות לנטישה. צוות השיווק יכול לנקוט בפעולות למניעת נטישת לקוחות בהתבסס על למידה זו. דוגמאות כוללות יצירת שאלות נפוצות מפורטות באתרי אינטרנט כדי לצמצם שיחות לשירות לקוחות, והפעלת קמפיינים חינוכיים עם לקוחות בשאלות הנפוצות שיכולות לשמור על מעורבות.

הדגם שלנו נראה די מדויק. אנחנו יכולים לבצע ישירות חיזוי אינטראקטיבי על לחזות לשונית, בתחזית אצווה או בודדת (בזמן אמת). בדוגמה זו, ביצענו כמה שינויים בערכי עמודות מסוימים וביצענו חיזוי בזמן אמת. קנבס מראה לנו את תוצאת החיזוי יחד עם רמת הביטחון.

קנבס לחזות מסקנות

נניח שיש לנו לקוח קיים שיש לו את השימוש הבא: Night Mins הוא בן 40 ו Eve Mins הוא 40. אנחנו יכולים להריץ תחזית, והמודל שלנו מחזיר ציון ביטחון של 93.2% שהלקוח הזה יקבל (True). אנו עשויים כעת לבחור לספק הנחות לקידום מכירות כדי לשמור על לקוח זה.

נניח שיש לנו לקוח קיים שיש לו את השימוש הבא: Night Mins הוא בן 40 ו Eve Mins הוא 40. אנחנו יכולים להריץ תחזית, והמודל שלנו מחזיר ציון ביטחון של 93.2% שהלקוח הזה יקבל (True). ייתכן שנבחר כעת לספק הנחות לקידום כדי לשמור על לקוח זה.

הפעלת תחזית אחת מצוינת לניתוח מה-אם אינדיבידואלי, אבל אנחנו צריכים גם להריץ תחזיות על רשומות רבות בו-זמנית. קנבס מסוגל להפעיל תחזיות אצווה, המאפשר לך להריץ תחזיות בקנה מידה.

סיכום

בפוסט זה, הראינו כיצד אנליסט עסקי יכול ליצור מודל נטישה של לקוחות עם SageMaker Canvas באמצעות נתונים לדוגמה. Canvas מאפשר לאנליסטים העסקיים שלך ליצור מודלים מדויקים של ML ולייצר תחזיות באמצעות ממשק ללא קוד, חזותי, הצבע והקליק. מנתח שיווק יכול כעת להשתמש במידע זה כדי להפעיל קמפיינים לשימור ממוקדים ולבחון אסטרטגיות קמפיינים חדשות מהר יותר, מה שמוביל להפחתת נטישת הלקוחות.

אנליסטים יכולים לקחת את זה לשלב הבא על ידי שיתוף המודלים שלהם עם עמיתים למדעני נתונים. מדעני הנתונים יכולים לראות את מודל הקנבס ב סטודיו SageMaker של אמזון, שם הם יכולים לחקור את הבחירות שעשו Canvas AutoML, לאמת את תוצאות המודל, ואפילו לייצר את המודל בכמה קליקים. זה יכול להאיץ את יצירת הערך המבוססת על ML ולעזור להגדיל תוצאות משופרות מהר יותר.

למידע נוסף על השימוש ב-Canvas, ראה בנה, שתף, פרוס: כיצד אנליסטים עסקיים ומדעני נתונים משיגים זמן הגעה מהיר יותר לשוק באמצעות ML ללא קוד ו-Amazon SageMaker Canvas. למידע נוסף על יצירת מודלים של ML עם פתרון ללא קוד, ראה הכריזה על אמזון SageMaker Canvas - יכולת למידת מכונה חזותית ללא קוד עבור אנליסטים עסקיים.

על המחבר

הנרי רובלינו הוא אדריכל פתרונות ב-AWS, שבסיסו מניו ג'רזי. הוא נלהב ללמידת ענן ולמידת מכונה, והתפקיד שהם יכולים למלא בחברה. הוא משיג זאת על ידי עבודה עם לקוחות כדי לעזור להם להשיג את היעדים העסקיים שלהם באמצעות ענן AWS. מחוץ לעבודה, אתה יכול למצוא את הנרי מטייל או חוקר בחוץ עם בתו הפרווה ארלי.

חזה נטישה של לקוחות עם למידת מכונה ללא קוד באמצעות Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. חיפוש אנכי. איי. צ'אורן וואנג הוא אדריכל פתרונות ב-AWS, שבסיסו בדאלאס, טקסס. הוא עובד ב-AWS מאז שסיים את לימודיו באוניברסיטת טקסס בדאלאס ב-2016 עם תואר שני במדעי המחשב. Chaoran עוזר ללקוחות לבנות יישומים ניתנים להרחבה, מאובטחים וחסכוניים ולמצוא פתרונות לפתרון האתגרים העסקיים שלהם בענן AWS. מחוץ לעבודה, צ'אורן אוהב לבלות עם משפחתו ושני הכלבים, ביוביו וקוקו.

בול זמן: מאי 5, 2022

בול זמן: יאן 12, 2023

הועלה מחדש על ידי אפלטון

אימון והסקת AI בקנה מידה לגילוי תרופות באמצעות Amazon EKS ו-Karpenter | שירותי האינטרנט של אמזון

השתמש בתסריטי אימון משלך ובחר אוטומטית את הדגם הטוב ביותר באמצעות אופטימיזציה של היפרפרמטרים באמזון SageMaker

הכרזה על מחבר Salesforce המעודכן (V2) עבור אמזון קנדרה

למד כיצד לבנות ולפרוס כלים באמצעות סוכני LLM באמצעות AWS SageMaker JumpStart Foundation Models | שירותי האינטרנט של אמזון

פתיחת יעילות: ניצול הכוח של ביצוע סלקטיבי בצינורות אמזון SageMaker | שירותי האינטרנט של אמזון

תרגום רב לשוני של תמיכת לקוחות קל ב-Salesforce Service Cloud באמצעות Amazon Translate

אודות

חיפוש אנכי ו- Ai

פלטפורמה

שמור על קשר

חֶשְׁבּוֹן