Prognostizieren Sie die Kundenabwanderung mit maschinellem Lernen ohne Code mithilfe von Amazon SageMaker Canvas

Neuauflage von Plato

Verfolger: 0

Das Verständnis des Kundenverhaltens ist heute für jedes Unternehmen von höchster Bedeutung. Erkenntnisse darüber zu gewinnen, warum und wie Kunden kaufen, kann zur Umsatzsteigerung beitragen. Der Verlust von Kunden (auch als Kundenabwanderung bezeichnet) ist jedoch immer ein Risiko, und Erkenntnisse darüber, warum Kunden das Unternehmen verlassen, können für die Aufrechterhaltung von Umsätzen und Gewinnen genauso wichtig sein. Maschinelles Lernen (ML) kann mit Erkenntnissen helfen, aber bisher brauchte man ML-Experten, um Modelle zur Vorhersage der Abwanderung zu erstellen, deren Fehlen erkenntnisgesteuerte Maßnahmen von Unternehmen zur Kundenbindung verzögern könnten.

In diesem Beitrag zeigen wir Ihnen, wie Business-Analysten ein ML-Modell zur Kundenabwanderung erstellen können Amazon SageMaker-Leinwand, kein Code erforderlich. Canvas bietet Geschäftsanalysten eine visuelle Point-and-Click-Oberfläche, mit der Sie selbst Modelle erstellen und genaue ML-Vorhersagen generieren können – ohne ML-Erfahrung zu benötigen oder eine einzige Codezeile schreiben zu müssen.

Lösungsübersicht

Für diese Stelle übernehmen wir die Rolle eines Marketinganalysten in der Marketingabteilung eines Mobilfunkanbieters. Wir wurden damit beauftragt, potenziell abwanderungsgefährdete Kunden zu identifizieren. Wir haben Zugriff auf die Servicenutzung und andere Daten zum Kundenverhalten und möchten wissen, ob diese Daten helfen können zu erklären, warum ein Kunde den Dienst verlässt. Wenn wir Faktoren identifizieren können, die die Abwanderung erklären, können wir Korrekturmaßnahmen ergreifen, um das vorhergesagte Verhalten zu ändern, wie z. B. die Durchführung gezielter Bindungskampagnen.

Dazu verwenden wir die uns vorliegenden Daten in einer CSV-Datei, die Informationen zur Kundennutzung und -abwanderung enthält. Wir verwenden Canvas, um die folgenden Schritte auszuführen:

Importieren Sie das Abwanderungs-Dataset aus Amazon Simple Storage-Service (Amazon S3).
Trainieren und erstellen Sie das Abwanderungsmodell.
Analysieren Sie die Modellergebnisse.
Testen Sie Vorhersagen anhand des Modells.

Für unseren Datensatz verwenden wir a synthetischer Datensatz von einem Telekommunikations-Mobilfunkanbieter. Dieser Beispieldatensatz enthält 5,000 Datensätze, wobei jeder Datensatz 21 Attribute verwendet, um das Kundenprofil zu beschreiben. Die Attribute lauten wie folgt:

Bundesstaat – Der US-Bundesstaat, in dem der Kunde ansässig ist, angegeben durch eine aus zwei Buchstaben bestehende Abkürzung; zum Beispiel OH oder NJ
Kontolänge – Die Anzahl der Tage, die dieses Konto aktiv war
Vorwahl – Die dreistellige Vorwahl der Telefonnummer des Kunden
Telefon – Die verbleibende siebenstellige Telefonnummer
Internationaler Plan – Ob der Kunde einen internationalen Tarif hat (ja/nein)
VMail-Plan – ob der Kunde eine Voicemail-Funktion hat (ja/nein)
VMail-Nachricht – Die durchschnittliche Anzahl von Voicemail-Nachrichten pro Monat
Tag Min – Die Gesamtzahl der während des Tages genutzten Gesprächsminuten
Tagesanrufe – Die Gesamtzahl der während des Tages getätigten Anrufe
Tagesgebühr – Die in Rechnung gestellten Kosten für Tagesanrufe
Eva Minuten, Eva ruft, Vorabendladung – Die in Rechnung gestellten Kosten für Abendgespräche
Nacht Min, Nachtanrufe, Nachtgebühr – Die in Rechnung gestellten Kosten für Nachtgespräche
Int. Min, Internationale Anrufe, Internationale Gebühr – Die in Rechnung gestellten Kosten für Auslandsgespräche
CustServ-Anrufe – Die Anzahl der Anrufe beim Kundenservice
Abwanderung? – ob der Kunde den Service verlassen hat (true/false)

Das letzte Attribut, Churn?, ist das Attribut, das das ML-Modell vorhersagen soll. Das Zielattribut ist binär, was bedeutet, dass unser Modell die Ausgabe als eine von zwei Kategorien vorhersagt (True or False).

Voraussetzungen:

Ein Cloud-Administrator mit einer AWS-Konto mit den entsprechenden Berechtigungen ist erforderlich, um die folgenden Voraussetzungen zu erfüllen:

Stellen Sie eine bereit Amazon Sage Maker Anweisungen finden Sie unter Integrieren in die Amazon SageMaker-Domäne.
Canvas bereitstellen. Anweisungen finden Sie unter Einrichten und Verwalten von Amazon SageMaker Canvas (für IT-Administratoren).
Konfigurieren Sie CORS-Richtlinien (Cross-Origin Resource Sharing) für Canvas. Anweisungen finden Sie unter Geben Sie Ihren Benutzern die Möglichkeit, lokale Dateien hochzuladen.

Erstellen Sie ein Kundenabwanderungsmodell

Zuerst laden wir die herunter Churn-Datensatz und überprüfen Sie die Datei, um sicherzustellen, dass alle Daten vorhanden sind. Führen Sie dann die folgenden Schritte aus:

Melden Sie sich bei der an AWS-Managementkonsole, indem Sie ein Konto mit den entsprechenden Berechtigungen für den Zugriff auf Canvas verwenden.
Melden Sie sich bei der Canvas-Konsole an.

Hier können wir unsere Datensätze verwalten und Modelle erstellen.

Auswählen Import.

Canvas-Import-Schaltfläche auswählen

Auswählen Hochladen und wählen Sie die churn.csv Datei.
Auswählen Daten importieren um es auf Canvas hochzuladen.

Canvas-Auswahldaten aus s3

Der Importvorgang dauert ungefähr 10 Sekunden (dies kann je nach Datensatzgröße variieren). Wenn es fertig ist, können wir sehen, dass das Dataset vorhanden ist Ready Status.

Canvas-Ready-Datensatz

Um eine Vorschau der ersten 100 Zeilen des Datensatzes anzuzeigen, bewegen Sie die Maus über das Augensymbol.

Canvas-Ansichtsdatensatz

Eine Vorschau des Datensatzes wird angezeigt. Hier können wir die Richtigkeit unserer Daten überprüfen.

Canvas-Daten überprüfen

Nachdem wir bestätigt haben, dass der importierte Datensatz bereit ist, erstellen wir unser Modell.

Auswählen Neues Modell.

Leinwand Neue Modelle

Wählen Sie das Dataset churn.csv aus und wählen Sie aus Datensatz auswählen.

Canvas Datensatz auswählen

Jetzt konfigurieren wir den Build-Model-Prozess.

Aussichten für Zielspalten, wählen Sie das Churn? Spalte.

Aussichten für Modelltyp, Canvas empfiehlt in diesem Fall automatisch den Modelltyp 2-Kategorie-Vorhersage (was ein Datenwissenschaftler binäre Klassifizierung nennen würde). Dies ist für unseren Anwendungsfall geeignet, da wir nur zwei mögliche Vorhersagewerte haben: True or False, also gehen wir von der Empfehlung Canvas aus.

Canvas-Build-Modell

Wir validieren nun einige Annahmen. Wir möchten einen schnellen Überblick darüber erhalten, ob unsere Zielspalte von den anderen Spalten vorhergesagt werden kann. Wir können einen schnellen Überblick über die geschätzte Genauigkeit des Modells und die Auswirkung auf die Spalte erhalten (die geschätzte Bedeutung jeder Spalte bei der Vorhersage der Zielspalte)..

Wählen Sie alle 21 Spalten aus und wählen Sie Vorschaumodell.

Diese Funktion verwendet eine Teilmenge unseres Datensatzes und nur einen einzigen Durchlauf bei der Modellierung. Für unseren Anwendungsfall dauert das Erstellen des Vorschaumodells etwa 2 Minuten.

Canvas-Vorschaumodell

Wie im folgenden Screenshot gezeigt, ist die Phone und State Spalten haben viel weniger Einfluss auf unsere Vorhersage. Wir möchten beim Entfernen von Texteingaben vorsichtig sein, da sie wichtige diskrete, kategoriale Merkmale enthalten können, die zu unserer Vorhersage beitragen. Hier ist die Telefonnummer nur das Äquivalent einer Kontonummer – sie ist nicht von Wert, um die Abwanderungswahrscheinlichkeit anderer Konten vorherzusagen, und der Status des Kunden hat keinen großen Einfluss auf unser Modell.

Wir entfernen diese Spalten, da sie keine wesentliche Feature-Bedeutung haben.
Nachdem wir die entfernt haben Phone und State Spalten, lassen Sie uns die Vorschau erneut ausführen.

Wie im folgenden Screenshot gezeigt, hat sich die Modellgenauigkeit um 0.1 % erhöht. Unser Vorschaumodell hat eine geschätzte Genauigkeit von 95.9 %, und die Spalten mit der größten Wirkung sind Night Calls, Eve Mins und Night Charge. Dies gibt uns einen Einblick, welche Spalten die Leistung unseres Modells am meisten beeinflussen. Hier müssen wir bei der Merkmalsauswahl vorsichtig sein, denn wenn ein einzelnes Merkmal einen extremen Einfluss auf das Ergebnis eines Modells hat, ist dies ein primärer Indikator dafür Zielleckage, und die Funktion ist zum Zeitpunkt der Vorhersage nicht verfügbar. In diesem Fall zeigten nur wenige Säulen eine sehr ähnliche Wirkung, daher bauen wir unser Modell weiter aus.

Canvas Feature Engineering nachher

Canvas bietet zwei Build-Optionen:

Standardaufbau – Erstellt das beste Modell aus einem optimierten Prozess powered by AutoML; Geschwindigkeit wird gegen höchste Genauigkeit ausgetauscht
Schneller Aufbau – Baut ein Modell in einem Bruchteil der Zeit im Vergleich zu einem Standardbau; potenzielle Genauigkeit wird gegen Geschwindigkeit eingetauscht.

Für diesen Beitrag wählen wir die Standardaufbau Option, weil wir das allerbeste Modell haben wollen und bereit sind, zusätzliche Zeit damit zu verbringen, auf das Ergebnis zu warten.

Canvas-Standardaufbau

Der Erstellungsprozess kann 2–4 Stunden dauern. Während dieser Zeit testet Canvas Hunderte von Pipeline-Kandidaten und wählt das beste Modell aus, um es uns vorzustellen. Im folgenden Screenshot sehen wir die erwartete Bauzeit und den Fortschritt.

Canvas Analysemodell

Bewerten Sie die Modellleistung

Wenn der Modellerstellungsprozess abgeschlossen ist, prognostizierte das Modell eine Abwanderung in 97.9 % der Fälle. Das scheint in Ordnung zu sein, aber als Analysten wollen wir tiefer eintauchen und sehen, ob wir darauf vertrauen können, dass das Modell darauf basierende Entscheidungen trifft. Auf der Scoring Registerkarte können wir ein visuelles Diagramm unserer Vorhersagen überprüfen, die ihren Ergebnissen zugeordnet sind. Dies ermöglicht uns einen tieferen Einblick in unser Modell.

Canvas trennt den Datensatz in Trainings- und Testdatensätze. Das Trainings-Dataset sind die Daten, die Canvas zum Erstellen des Modells verwendet. Das Testset wird verwendet, um zu sehen, ob das Modell mit neuen Daten gut funktioniert. Das Sankey-Diagramm im folgenden Screenshot zeigt die Leistung des Modells auf dem Testset. Weitere Informationen finden Sie unter Bewerten der Leistung Ihres Modells in Amazon SageMaker Canvas.

Um detailliertere Einblicke zu erhalten, die über das hinausgehen, was im Sankey-Diagramm angezeigt wird, können Geschäftsanalysten a verwenden Verwirrung Matrix Analysen für ihre Geschäftslösungen. Beispielsweise möchten wir die Wahrscheinlichkeit besser verstehen, dass das Modell falsche Vorhersagen macht. Wir können dies im Sankey-Diagramm sehen, wollen aber mehr Einblicke, also wählen wir Erweiterte Messwerte. Uns wird eine Verwirrungsmatrix präsentiert, die die Leistung eines Modells in einem visuellen Format mit den folgenden Werten anzeigt, die spezifisch für die positive Klasse sind – wir messen basierend darauf, ob sie tatsächlich abwandern, also unsere positive Klasse True in diesem Beispiel:

Richtig positiv (TP) - Die Anzahl der True Ergebnisse, die korrekt als vorhergesagt wurden True
Richtig negativ (TN) - Die Anzahl der False Ergebnisse, die korrekt als vorhergesagt wurden False
Falsch positiv (FP) - Die Anzahl der False Ergebnisse, die fälschlicherweise als vorhergesagt wurden True
Falsch negativ (FN) - Die Anzahl der True Ergebnisse, die fälschlicherweise als vorhergesagt wurden False

Wir können dieses Matrixdiagramm verwenden, um nicht nur zu bestimmen, wie genau unser Modell ist, sondern auch, wenn es falsch ist, wie oft das sein könnte und wie es falsch ist.

Leinwand F1-Matrix

Die erweiterten Metriken sehen gut aus. Wir können dem Modellergebnis vertrauen. Wir sehen sehr wenige falsch positive und falsch negative Ergebnisse. Dies ist der Fall, wenn das Modell annimmt, dass ein Kunde im Datensatz abwandern wird, und dies tatsächlich nicht der Fall ist (falsch positiv), oder wenn das Modell annimmt, dass der Kunde abwandern wird, und dies tatsächlich der Fall ist (falsch negativ). Hohe Zahlen für beide könnten uns dazu bringen, mehr darüber nachzudenken, ob wir das Modell verwenden können, um Entscheidungen zu treffen.

Gehen wir zurück zu Überblick Registerkarte, um die Auswirkung jeder Spalte zu überprüfen. Diese Informationen können dem Marketingteam helfen, Erkenntnisse zu gewinnen, die zu Maßnahmen zur Verringerung der Kundenabwanderung führen. Zum Beispiel können wir das sowohl niedrig als auch hoch sehen CustServ Calls die Abwanderungswahrscheinlichkeit erhöhen. Basierend auf diesen Erkenntnissen kann das Marketingteam Maßnahmen ergreifen, um die Kundenabwanderung zu verhindern. Beispiele hierfür sind die Erstellung detaillierter FAQ auf Websites, um Kundendienstanrufe zu reduzieren, und die Durchführung von Aufklärungskampagnen mit Kunden über die FAQ, die das Engagement aufrechterhalten können.

Unser Modell sieht ziemlich genau aus. Wir können direkt eine interaktive Vorhersage auf der durchführen Vorhersagen entweder in Batch- oder Einzelvorhersage (Echtzeit). In diesem Beispiel haben wir einige Änderungen an bestimmten Spaltenwerten vorgenommen und eine Echtzeitvorhersage durchgeführt. Canvas zeigt uns das Vorhersageergebnis zusammen mit dem Konfidenzniveau.

Canvas-Vorhersage-Inferenz

Nehmen wir an, wir haben einen bestehenden Kunden, der die folgende Verwendung hat: Night Mins ist 40 und Eve Mins ist 40. Wir können eine Vorhersage durchführen und unser Modell gibt einen Konfidenzwert von 93.2 % zurück, dass dieser Kunde abwandern wird (True). Wir können uns jetzt dafür entscheiden, Werberabatte anzubieten, um diesen Kunden zu halten.

Nehmen wir an, wir haben einen bestehenden Kunden, der die folgende Verwendung hat: Night Mins ist 40 und Eve Mins ist 40. Wir können eine Vorhersage durchführen und unser Modell gibt einen Konfidenzwert von 93.2 % zurück, dass dieser Kunde abwandern wird (True). Wir könnten uns jetzt dafür entscheiden, Aktionsrabatte anzubieten, um diesen Kunden zu halten.

Das Ausführen einer Vorhersage eignet sich hervorragend für individuelle Was-wäre-wenn-Analysen, aber wir müssen auch Vorhersagen für viele Datensätze gleichzeitig ausführen. Leinwand kann Batchvorhersagen ausführen, mit dem Sie Vorhersagen in großem Maßstab ausführen können.

Zusammenfassung

In diesem Beitrag haben wir gezeigt, wie ein Business-Analyst mit SageMaker Canvas anhand von Beispieldaten ein Kundenabwanderungsmodell erstellen kann. Canvas ermöglicht es Ihren Business-Analysten, genaue ML-Modelle zu erstellen und Vorhersagen mithilfe einer codefreien, visuellen Point-and-Click-Oberfläche zu generieren. Ein Marketinganalytiker kann diese Informationen nun verwenden, um gezielte Bindungskampagnen durchzuführen und neue Kampagnenstrategien schneller zu testen, was zu einer Verringerung der Kundenabwanderung führt.

Analysten können dies auf die nächste Stufe heben, indem sie ihre Modelle mit Kollegen von Data Scientists teilen. Die Data Scientists können das Canvas-Modell in anzeigen Amazon SageMaker-Studio, wo sie die von Canvas AutoML getroffenen Entscheidungen untersuchen, Modellergebnisse validieren und sogar das Modell mit wenigen Klicks produktiv machen können. Dies kann die ML-basierte Wertschöpfung beschleunigen und dazu beitragen, verbesserte Ergebnisse schneller zu skalieren.

Weitere Informationen zur Verwendung von Canvas finden Sie unter Build, Share, Deploy: Wie Business-Analysten und Data Scientists mit No-Code-ML und Amazon SageMaker Canvas eine schnellere Markteinführung erreichen. Weitere Informationen zum Erstellen von ML-Modellen mit einer No-Code-Lösung finden Sie unter Ankündigung von Amazon SageMaker Canvas – eine visuelle maschinelle Lernfunktion ohne Code für Business-Analysten.

Über den Autor

Heinrich Robalino ist ein Lösungsarchitekt bei AWS mit Sitz in New Jersey. Er interessiert sich leidenschaftlich für Cloud und maschinelles Lernen und die Rolle, die sie in der Gesellschaft spielen können. Er erreicht dies, indem er mit Kunden zusammenarbeitet, um ihnen zu helfen, ihre Geschäftsziele mit der AWS Cloud zu erreichen. Außerhalb der Arbeit ist Henry mit seiner Felltochter Arly unterwegs oder erkundet die Natur.

Prognostizieren Sie die Kundenabwanderung mit maschinellem Lernen ohne Code mithilfe von Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertikale Suche. Ai. Chaoran Wang ist Solution Architect bei AWS mit Sitz in Dallas, TX. Er arbeitet bei AWS seit seinem Abschluss an der University of Texas in Dallas im Jahr 2016 mit einem Master in Informatik. Chaoran unterstützt Kunden beim Aufbau skalierbarer, sicherer und kostengünstiger Anwendungen und bei der Suche nach Lösungen zur Bewältigung ihrer geschäftlichen Herausforderungen in der AWS Cloud. Außerhalb der Arbeit verbringt Chaoran gerne Zeit mit seiner Familie und seinen beiden Hunden Biubiu und Coco.

Zeitstempel: 5. Mai 2022

Zeitstempel: 13. April 2023

Neuauflage von Plato

Grundlegender Datenschutz für die LLM-Beschleunigung von Unternehmen mit Protopia AI | Amazon Web Services

Transformation der qualitativen Forschung durch die Automatisierung von Sprache in Text-zu-Text-Analysen

Wie Sophos mit Amazon SageMaker einen leistungsstarken, leichten PDF-Malware-Erkenner im Ultramaßstab trainiert

Automatisieren Sie die Klassifizierung von IT-Serviceanfragen mit einem benutzerdefinierten Amazon Comprehend-Klassifikator

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto