הבנת התנהגות הלקוחות היא בראש מעייניו של כל עסק כיום. השגת תובנות לגבי מדוע וכיצד לקוחות קונים יכולים לעזור להגדיל את ההכנסות. אבל אובדן לקוחות (נקרא גם נטישת לקוחות) הוא תמיד סיכון, ותובנות לגבי הסיבה שלקוחות עוזבים יכולות להיות חשובות לא פחות לשמירה על הכנסות ורווחים. למידת מכונה (ML) יכולה לעזור עם תובנות, אבל עד עכשיו היית צריך מומחי ML כדי לבנות מודלים לחזות נטישה, שהיעדרם עלול לעכב פעולות מונעות תובנות של עסקים כדי לשמר לקוחות.
בפוסט זה, אנו מראים לכם כיצד אנליסטים עסקיים יכולים לבנות מודל ML של נטישת לקוחות אמזון SageMaker Canvas, אין צורך בקוד. Canvas מספקת לאנליסטים עסקיים ממשק חזותי של הצבע והקלקה המאפשר לך לבנות מודלים וליצור תחזיות ML מדויקות בעצמך - מבלי לדרוש ניסיון ב-ML או צורך לכתוב שורת קוד אחת.
סקירה כללית של הפיתרון
עבור פוסט זה, אנו מקבלים את התפקיד של אנליסט שיווקי במחלקת השיווק של מפעיל טלפונים סלולריים. הוטלה עלינו משימה לזהות לקוחות שעלולים להיות בסיכון לנטישה. יש לנו גישה לשימוש בשירות ונתוני התנהגות אחרים של לקוחות, ורוצים לדעת אם נתונים אלה יכולים לעזור להסביר מדוע לקוח יעזוב. אם נוכל לזהות גורמים המסבירים נטישה, נוכל לנקוט בפעולות מתקנות לשינוי התנהגות חזויה, כגון הפעלת מסעות פרסום ממוקדים לשמירה.
לשם כך, אנו משתמשים בנתונים שיש לנו בקובץ CSV, המכיל מידע על שימוש ו-churn של לקוחות. אנו משתמשים ב-Canvas כדי לבצע את השלבים הבאים:
- ייבא את מערך הנתונים של הנטישה מ שירות אחסון פשוט של אמזון (אמזון S3).
- אימון ובנה את מודל הנטישה.
- נתח את תוצאות המודל.
- בדוק תחזיות מול המודל.
עבור מערך הנתונים שלנו, אנו משתמשים ב-a מערך נתונים סינתטי מחברת טלפונים ניידים. מערך נתונים לדוגמה זה מכיל 5,000 רשומות, כאשר כל רשומה משתמשת ב-21 תכונות לתיאור פרופיל הלקוח. התכונות הן כדלקמן:
- מדינה – המדינה בארה"ב בה מתגורר הלקוח, המצוינת בקיצור בן שתי אותיות; לדוגמה, OH או NJ
- אורך החשבון – מספר הימים שבהם חשבון זה היה פעיל
- קידומת - אזור החיוג בן שלוש הספרות של מספר הטלפון של הלקוח
- טלפון – מספר הטלפון הנותר בן שבע הספרות
- תוכנית בינלאומית - האם ללקוח יש תוכנית שיחות בינלאומיות (כן/לא)
- תוכנית VMail - האם ללקוח יש תכונת דואר קולי (כן/לא)
- הודעת VMail – המספר הממוצע של הודעות תא קולי בחודש
- דקות יום – המספר הכולל של דקות שיחה בשימוש במהלך היום
- שיחות יום – המספר הכולל של שיחות שבוצעו במהלך היום
- חיוב יום – העלות החיובית של שיחות בשעות היום
- איב מינס, איב מתקשרת, חיוב חווה – העלות החיובית עבור שיחות ערב
- דקות לילה, שיחות לילה, חיוב לילה – העלות החיובית עבור שיחות לילה
- דקות בינלאומיות, שיחות בינלאומיות, חיוב בינלאומי – העלות החיובית עבור שיחות בינלאומיות
- שיחות CustServ – מספר השיחות שבוצעו לשירות הלקוחות
- מַחבֵּצָה? - האם הלקוח עזב את השירות (נכון/לא נכון)
התכונה האחרונה, Churn?
, היא התכונה שאנו רוצים שמודל ה-ML יחזה. תכונת המטרה היא בינארית, כלומר המודל שלנו חוזה את הפלט כאחת משתי קטגוריות (True
or False
).
תנאים מוקדמים
מנהל ענן עם חשבון AWS נדרשים הרשאות מתאימות כדי להשלים את התנאים המוקדמים הבאים:
- פרוס an אמזון SageMaker להוראות ראה נכלל ב-Amazon SageMaker Domain.
- פרוס קנבס. להנחיות, ראה הגדרה וניהול של Amazon SageMaker Canvas (עבור מנהלי IT).
- הגדר מדיניות שיתוף משאבים חוצי מוצא (CORS) עבור Canvas. להנחיות, ראה תן למשתמשים שלך את היכולת להעלות קבצים מקומיים.
צור מודל של נטישת לקוחות
ראשית, בואו נוריד את ה מערך נתונים של נטישה ועיין בקובץ כדי לוודא שכל הנתונים נמצאים שם. לאחר מכן השלם את השלבים הבאים:
- היכנס ל- קונסולת הניהול של AWS, באמצעות חשבון עם ההרשאות המתאימות לגישה ל-Canvas.
- היכנס לקונסולת Canvas.
זה המקום שבו אנחנו יכולים לנהל את מערכי הנתונים שלנו וליצור מודלים.
- לבחור תבואו.
- לבחור העלה ובחר את
churn.csv
קובץ. - לבחור ייבא נתונים כדי להעלות אותו לקנבס.
תהליך הייבוא אורך כ-10 שניות (זה יכול להשתנות בהתאם לגודל מערך הנתונים). כשזה יושלם, נוכל לראות את מערך הנתונים נמצא בפנים Ready
מעמד.
- לתצוגה מקדימה של 100 השורות הראשונות של מערך הנתונים, העבר את העכבר מעל סמל העין.
תופיע תצוגה מקדימה של מערך הנתונים. כאן נוכל לוודא שהנתונים שלנו נכונים.
לאחר שנאשר כי מערך הנתונים המיובא מוכן, אנו יוצרים את המודל שלנו.
- לבחור מודל חדש.
- בחר את מערך הנתונים churn.csv ובחר בחר מערך נתונים.
כעת אנו מגדירים את תהליך בניית המודל.
- בעד עמודות יעד, בחר את
Churn?
עמודה.
בעד סוג דגם, Canvas ממליץ באופן אוטומטי על סוג הדגם, במקרה זה חיזוי 2 קטגוריות (מה שמדען נתונים יכנה סיווג בינארי). זה מתאים למקרה השימוש שלנו מכיוון שיש לנו רק שני ערכי חיזוי אפשריים: True
or False
, אז אנחנו הולכים עם ההמלצה Canvas עשה.
כעת אנו מאמתים כמה הנחות. אנו רוצים לקבל מבט מהיר על האם ניתן לחזות את עמודת היעד שלנו על ידי העמודות האחרות. נוכל לקבל מבט מהיר על הדיוק וההשפעה המשוערת של המודל (החשיבות המשוערת של כל עמודה בחיזוי עמודת היעד).
- בחר את כל 21 העמודות ובחר דגם תצוגה מקדימה.
תכונה זו משתמשת בתת-קבוצה של מערך הנתונים שלנו ובמעבר בודד בלבד במודלים. במקרה השימוש שלנו, בניית מודל התצוגה המקדימה לוקחת בערך 2 דקות.
כפי שמוצג בצילום המסך הבא, ה Phone
ו State
לעמודות יש הרבה פחות השפעה על התחזית שלנו. אנו רוצים להיות זהירים בעת הסרת קלט טקסט מכיוון שהוא יכול להכיל תכונות דיסקרטיות וקטגוריות חשובות התורמות לתחזית שלנו. כאן, מספר הטלפון הוא רק המקבילה למספר חשבון - לא בעל ערך בחיזוי הסבירות לנטישה של חשבונות אחרים, ומצבו של הלקוח לא משפיע הרבה על המודל שלנו.
- אנו מסירים את העמודות הללו מכיוון שאין להן חשיבות תכונה גדולה.
- לאחר שנסיר את
Phone
וState
עמודות, הבה נריץ שוב את התצוגה המקדימה.
כפי שמוצג בצילום המסך הבא, דיוק הדגם גדל ב-0.1%. למודל התצוגה המקדימה שלנו יש דיוק משוער של 95.9%, והעמודות עם ההשפעה הגדולה ביותר הן Night Calls
, Eve Mins
, ו Night Charge
. זה נותן לנו תובנה לגבי העמודות המשפיעות ביותר על הביצועים של המודל שלנו. כאן עלינו להיות זהירים בעת בחירת תכונה מכיוון שאם תכונה בודדת משפיעה מאוד על התוצאה של מודל, זה אינדיקטור ראשוני של דליפת מטרה, והתכונה לא תהיה זמינה בזמן החיזוי. במקרה זה, מעט עמודות הראו השפעה דומה מאוד, אז אנחנו ממשיכים לבנות את המודל שלנו.
קנבס מציע שתי אפשרויות בנייה:
- מבנה סטנדרטי - בונה את הדגם הטוב ביותר מתהליך אופטימלי המופעל על ידי AutoML; מהירות מוחלפת לדיוק הגדול ביותר
- בנייה מהירה – בונה מודל בשבריר מהזמן בהשוואה למבנה רגיל; דיוק פוטנציאלי מוחלף למהירות.
- עבור פוסט זה, אנו בוחרים את מבנה סטנדרטי אפשרות כי אנחנו רוצים לקבל את הדגם הטוב ביותר ואנו מוכנים להשקיע זמן נוסף בהמתנה לתוצאה.
תהליך הבנייה יכול להימשך 2-4 שעות. במהלך תקופה זו, Canvas בודק מאות צינורות מועמדים, בוחרת את הדגם הטוב ביותר להציג בפנינו. בצילום המסך הבא, נוכל לראות את זמן הבנייה וההתקדמות הצפוי.
הערכת ביצועי המודל
כאשר תהליך בניית המודל הושלם, המודל חזה נטישה של 97.9% מהמקרים. זה נראה בסדר, אבל כאנליסטים אנחנו רוצים לצלול לעומק ולראות אם אנחנו יכולים לסמוך על המודל שיקבל החלטות על סמך זה. על מניה בכרטיסייה, נוכל לסקור עלילה ויזואלית של התחזיות שלנו הממופות לתוצאות שלהן. זה מאפשר לנו תובנה עמוקה יותר לגבי המודל שלנו.
Canvas מפריד את מערך הנתונים לקבוצות הדרכה ובדיקות. מערך ההדרכה הוא הנתונים שבהם משתמש Canvas לבניית המודל. ערכת הבדיקה משמשת כדי לראות אם המודל מתפקד היטב עם נתונים חדשים. דיאגרמת Sankey בצילום המסך הבא מציגה את ביצועי הדגם במערך הבדיקה. למידע נוסף, עיין ב הערכת הביצועים של הדגם שלך ב-Amazon SageMaker Canvas.
כדי לקבל תובנות מפורטות יותר מעבר למה שמוצג בתרשים Sankey, אנליסטים עסקיים יכולים להשתמש ב-a מטריצת בלבול ניתוח עבור הפתרונות העסקיים שלהם. לדוגמה, אנו רוצים להבין טוב יותר את הסבירות שהמודל יבצע תחזיות שווא. אנחנו יכולים לראות את זה בתרשים Sankey, אבל רוצים יותר תובנות, אז אנחנו בוחרים מדדים מתקדמים. מוצגת לנו מטריצת בלבול, המציגה את הביצועים של מודל בפורמט ויזואלי עם הערכים הבאים, ספציפיים למחלקה החיובית - אנו מודדים על סמך האם הם אכן יתפוגגו, כך שהמחלקה החיובית שלנו היא True
בדוגמה זו:
- חיובי אמיתי (TP) - מספר ה
True
תוצאות שנחזו נכון כTrue
- שלילי אמיתי (TN) - מספר ה
False
תוצאות שנחזו נכון כFalse
- חיובי כוזב (FP) - מספר ה
False
תוצאות שנחזו בטעות כTrue
- שלילי כוזב (FN) - מספר ה
True
תוצאות שנחזו בטעות כFalse
אנו יכולים להשתמש בתרשים המטריצה הזה כדי לקבוע לא רק עד כמה המודל שלנו מדויק, אלא גם מתי הוא שגוי, באיזו תדירות זה עשוי להיות וכיצד הוא שגוי.
המדדים המתקדמים נראים טוב. אנחנו יכולים לסמוך על תוצאת המודל. אנו רואים חיוביות שגויות נמוכות מאוד ושליליות שגויות. אלו הן אם המודל חושב שלקוח במערך הנתונים יתבטל והם למעשה לא (false positive), או אם המודל חושב שהלקוח יתבטל והם אכן עושים זאת (false negative). מספרים גבוהים עבור אחד מהם עשויים לגרום לנו לחשוב יותר אם נוכל להשתמש במודל כדי לקבל החלטות.
בוא נחזור ל סקירה כללית לשונית, כדי לסקור את ההשפעה של כל עמודה. מידע זה יכול לעזור לצוות השיווק לקבל תובנות שיובילו לנקיטת פעולות להפחתת נטישת הלקוחות. לדוגמה, אנו יכולים לראות את זה גם נמוך וגם גבוה CustServ Calls
להגדיל את הסבירות לנטישה. צוות השיווק יכול לנקוט בפעולות למניעת נטישת לקוחות בהתבסס על למידה זו. דוגמאות כוללות יצירת שאלות נפוצות מפורטות באתרי אינטרנט כדי לצמצם שיחות לשירות לקוחות, והפעלת קמפיינים חינוכיים עם לקוחות בשאלות הנפוצות שיכולות לשמור על מעורבות.
הדגם שלנו נראה די מדויק. אנחנו יכולים לבצע ישירות חיזוי אינטראקטיבי על לחזות לשונית, בתחזית אצווה או בודדת (בזמן אמת). בדוגמה זו, ביצענו כמה שינויים בערכי עמודות מסוימים וביצענו חיזוי בזמן אמת. קנבס מראה לנו את תוצאת החיזוי יחד עם רמת הביטחון.
נניח שיש לנו לקוח קיים שיש לו את השימוש הבא: Night Mins
הוא בן 40 ו Eve Mins
הוא 40. אנחנו יכולים להריץ תחזית, והמודל שלנו מחזיר ציון ביטחון של 93.2% שהלקוח הזה יקבל (True
). אנו עשויים כעת לבחור לספק הנחות לקידום מכירות כדי לשמור על לקוח זה.
נניח שיש לנו לקוח קיים שיש לו את השימוש הבא: Night Mins
הוא בן 40 ו Eve Mins
הוא 40. אנחנו יכולים להריץ תחזית, והמודל שלנו מחזיר ציון ביטחון של 93.2% שהלקוח הזה יקבל (True
). ייתכן שנבחר כעת לספק הנחות לקידום כדי לשמור על לקוח זה.
הפעלת תחזית אחת מצוינת לניתוח מה-אם אינדיבידואלי, אבל אנחנו צריכים גם להריץ תחזיות על רשומות רבות בו-זמנית. קנבס מסוגל להפעיל תחזיות אצווה, המאפשר לך להריץ תחזיות בקנה מידה.
סיכום
בפוסט זה, הראינו כיצד אנליסט עסקי יכול ליצור מודל נטישה של לקוחות עם SageMaker Canvas באמצעות נתונים לדוגמה. Canvas מאפשר לאנליסטים העסקיים שלך ליצור מודלים מדויקים של ML ולייצר תחזיות באמצעות ממשק ללא קוד, חזותי, הצבע והקליק. מנתח שיווק יכול כעת להשתמש במידע זה כדי להפעיל קמפיינים לשימור ממוקדים ולבחון אסטרטגיות קמפיינים חדשות מהר יותר, מה שמוביל להפחתת נטישת הלקוחות.
אנליסטים יכולים לקחת את זה לשלב הבא על ידי שיתוף המודלים שלהם עם עמיתים למדעני נתונים. מדעני הנתונים יכולים לראות את מודל הקנבס ב סטודיו SageMaker של אמזון, שם הם יכולים לחקור את הבחירות שעשו Canvas AutoML, לאמת את תוצאות המודל, ואפילו לייצר את המודל בכמה קליקים. זה יכול להאיץ את יצירת הערך המבוססת על ML ולעזור להגדיל תוצאות משופרות מהר יותר.
למידע נוסף על השימוש ב-Canvas, ראה בנה, שתף, פרוס: כיצד אנליסטים עסקיים ומדעני נתונים משיגים זמן הגעה מהיר יותר לשוק באמצעות ML ללא קוד ו-Amazon SageMaker Canvas. למידע נוסף על יצירת מודלים של ML עם פתרון ללא קוד, ראה הכריזה על אמזון SageMaker Canvas - יכולת למידת מכונה חזותית ללא קוד עבור אנליסטים עסקיים.
על המחבר
הנרי רובלינו הוא אדריכל פתרונות ב-AWS, שבסיסו מניו ג'רזי. הוא נלהב ללמידת ענן ולמידת מכונה, והתפקיד שהם יכולים למלא בחברה. הוא משיג זאת על ידי עבודה עם לקוחות כדי לעזור להם להשיג את היעדים העסקיים שלהם באמצעות ענן AWS. מחוץ לעבודה, אתה יכול למצוא את הנרי מטייל או חוקר בחוץ עם בתו הפרווה ארלי.
צ'אורן וואנג הוא אדריכל פתרונות ב-AWS, שבסיסו בדאלאס, טקסס. הוא עובד ב-AWS מאז שסיים את לימודיו באוניברסיטת טקסס בדאלאס ב-2016 עם תואר שני במדעי המחשב. Chaoran עוזר ללקוחות לבנות יישומים ניתנים להרחבה, מאובטחים וחסכוניים ולמצוא פתרונות לפתרון האתגרים העסקיים שלהם בענן AWS. מחוץ לעבודה, צ'אורן אוהב לבלות עם משפחתו ושני הכלבים, ביוביו וקוקו.
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- אודות
- להאיץ
- גישה
- חֶשְׁבּוֹן
- מדויק
- פעולות
- נוסף
- מנהל
- מנהלים
- מתקדם
- תעשיות
- אמזון בעברית
- אנליזה
- מנתח
- יישומים
- מתאים
- בערך
- AREA
- תכונות
- זמין
- מְמוּצָע
- AWS
- הטוב ביותר
- מעבר
- הגדול ביותר
- גבול
- לִבנוֹת
- בִּניָן
- בונה
- עסקים
- עסקים
- לִקְנוֹת
- שיחה
- מבצע
- קמפיינים
- יכול לקבל
- מועמד
- בד
- קטגוריה
- מסוים
- האתגרים
- שינוי
- תשלום
- בחירות
- לבחור
- בכיתה
- מיון
- ענן
- קוד
- עמיתים
- טור
- לעומת
- המחשב
- מדעי מחשב
- אמון
- בלבול
- קונסול
- מכיל
- להמשיך
- עלות תועלת
- יכול
- לִיצוֹר
- יוצרים
- יצירה
- לקוח
- שירות לקוחות
- לקוחות
- דאלאס
- נתונים
- מדען נתונים
- עמוק יותר
- עיכוב
- תלוי
- לפרוס
- מְפוֹרָט
- לקבוע
- ישירות
- מציג
- לא
- חינוך
- התעסקות
- הנדסה
- מוערך
- דוגמה
- קיימים
- צפוי
- ניסיון
- מומחים
- לחקור
- עין
- גורמים
- משפחה
- שאלות נפוצות
- מהר
- מהר יותר
- מאפיין
- תכונות
- סוף
- ראשון
- הבא
- פוּרמָט
- ליצור
- שערים
- טוב
- גדול
- הגדול ביותר
- לגדול
- יש
- לעזור
- עוזר
- כאן
- גָבוֹהַ
- איך
- HTTPS
- מאות
- ICON
- לזהות
- זיהוי
- פְּגִיעָה
- בר - השפעה
- חשיבות
- חשוב
- משופר
- לכלול
- להגדיל
- גדל
- בנפרד
- מידע
- קלט
- תובנות
- אינטראקטיבי
- מִמְשָׁק
- ברמה בינלאומית
- IT
- עוֹפֶרֶת
- מוביל
- לִלמוֹד
- למידה
- יציאה
- רמה
- קו
- מקומי
- מכונה
- למידת מכונה
- עשוי
- גדול
- עשייה
- לנהל
- ניהול
- ניהול
- שיווק
- מאסטר
- מַטרִיצָה
- משמעות
- מדדים
- אכפת לי
- ML
- סלולרי
- טלפון סלולרי
- מודל
- מודלים
- יותר
- רוב
- שלילי
- מספר
- מספרים
- המיוחדות שלנו
- אופטימיזציה
- אפשרות
- אפשרויות
- אחר
- בחוץ
- לוהט
- ביצועים
- לְשַׂחֵק
- מדיניות
- חיובי
- אפשרי
- פוטנציאל
- לחזות
- נבואה
- התחזיות
- להציג
- יפה
- תצוגה מקדימה
- יְסוֹדִי
- תהליך
- פּרוֹפִיל
- רווחים
- קידום
- קידום מכירות
- לספק
- מספק
- מָהִיר
- זמן אמת
- ממליצה
- שיא
- רשום
- להפחית
- נותר
- הסרת
- נדרש
- משאב
- תוצאות
- החזרות
- הכנסה
- סקירה
- הסיכון
- הפעלה
- ריצה
- להרחבה
- סולם
- מדע
- מַדְעָן
- מדענים
- שניות
- לבטח
- שרות
- סט
- שיתוף
- שיתוף
- דומה
- פָּשׁוּט
- מידה
- So
- חֶברָה
- מוצק
- פִּתָרוֹן
- פתרונות
- לפתור
- כמה
- מְהִירוּת
- לבלות
- הוצאה
- תֶקֶן
- מדינה
- מצב
- אחסון
- אסטרטגיות
- נטילת
- יעד
- נבחרת
- התקשורת
- מבחן
- בדיקות
- טקסס
- זמן
- היום
- חלק עליון
- הדרכה
- נסיעה
- סומך
- TX
- להבין
- אוניברסיטה
- us
- להשתמש
- משתמשים
- ערך
- לאמת
- לצפיה
- קול
- אתרים
- מה
- מה
- אם
- מי
- ויקיפדיה
- תיק עבודות
- עובד
- היה