Prédire le taux de désabonnement des clients grâce à l'apprentissage automatique sans code à l'aide d'Amazon SageMaker Canvas

Republié par Platon

Suiveurs: 0

Comprendre le comportement des clients est aujourd'hui une priorité pour toutes les entreprises. Comprendre pourquoi et comment les clients achètent peut contribuer à augmenter les revenus. Mais perdre des clients (également appelé désabonnement) est toujours un risque, et comprendre pourquoi les clients partent peut être tout aussi important pour maintenir les revenus et les bénéfices. L'apprentissage automatique (ML) peut aider à obtenir des informations, mais jusqu'à présent, vous aviez besoin d'experts en ML pour créer des modèles permettant de prédire l'attrition, dont l'absence pouvait retarder les actions axées sur les informations par les entreprises pour fidéliser les clients.

Dans cet article, nous vous montrons comment les analystes commerciaux peuvent créer un modèle ML de désabonnement client avec Toile Amazon SageMaker, aucun code requis. Canvas fournit aux analystes commerciaux une interface visuelle pointer-cliquer qui vous permet de créer des modèles et de générer vous-même des prédictions ML précises, sans nécessiter aucune expérience ML ni avoir à écrire une seule ligne de code.

Présentation de la solution

Pour ce poste, nous assumons le rôle d'analyste marketing au sein du service marketing d'un opérateur de téléphonie mobile. Nous avons été chargés d'identifier les clients potentiellement à risque d'attrition. Nous avons accès à l'utilisation du service et à d'autres données sur le comportement des clients, et nous voulons savoir si ces données peuvent aider à expliquer pourquoi un client partirait. Si nous pouvons identifier les facteurs qui expliquent le taux de désabonnement, nous pouvons alors prendre des mesures correctives pour modifier le comportement prévu, comme l'exécution de campagnes de rétention ciblées.

Pour ce faire, nous utilisons les données dont nous disposons dans un fichier CSV, qui contient des informations sur l'utilisation et le désabonnement des clients. Nous utilisons Canvas pour effectuer les étapes suivantes :

Importer l'ensemble de données d'attrition à partir de Service de stockage simple Amazon (Amazon S3).
Entraînez et construisez le modèle de désabonnement.
Analysez les résultats du modèle.
Testez les prédictions par rapport au modèle.

Pour notre jeu de données, nous utilisons un jeu de données synthétique auprès d'un opérateur de téléphonie mobile. Cet exemple de jeu de données contient 5,000 21 enregistrements, où chaque enregistrement utilise XNUMX attributs pour décrire le profil du client. Les attributs sont les suivants :

Région – L'État américain dans lequel réside le client, indiqué par une abréviation à deux lettres ; par exemple, OH ou NJ
Durée du compte – Le nombre de jours pendant lesquels ce compte a été actif
Indicatif régional – L'indicatif régional à trois chiffres du numéro de téléphone du client
Téléphone – Le numéro de téléphone à sept chiffres restant
Plan international – Si le client a un forfait d'appels internationaux (oui/non)
Forfait VMail – Si le client dispose d'une fonctionnalité de messagerie vocale (oui/non)
Message VMail – Le nombre moyen de messages vocaux par mois
Minutes du jour – Le nombre total de minutes d'appel utilisées dans la journée
Appels de jour – Le nombre total d'appels passés pendant la journée
Frais de jour – Le coût facturé des appels de jour
Eve Min, Veille appelle, Eve charge – Le coût facturé pour les appels du soir
Minutes de nuit, Appels de nuit, Charge de nuit – Le coût facturé pour les appels de nuit
Minutes internationales, Appels Internationaux, Charge internationale – Le coût facturé pour les appels internationaux
Appels CustServ – Le nombre d’appels passés au service client
Baratte? – Si le client a quitté le service (vrai/faux)

Le dernier attribut, Churn?, est l'attribut que nous voulons que le modèle ML prédise. L'attribut cible est binaire, ce qui signifie que notre modèle prédit la sortie comme l'une des deux catégories (True or False).

Pré-requis

Un administrateur cloud avec un Compte AWS avec les autorisations appropriées est nécessaire pour remplir les conditions préalables suivantes :

Déployer un Amazon Sage Maker Pour obtenir des instructions, consultez Intégration au domaine Amazon SageMaker.
Déployez Canvas. Pour obtenir des instructions, consultez Configuration et gestion d'Amazon SageMaker Canvas (pour les administrateurs informatiques).
Configurez les stratégies de partage des ressources cross-origin (CORS) pour Canvas. Pour obtenir des instructions, consultez Donnez à vos utilisateurs la possibilité de télécharger des fichiers locaux.

Créer un modèle de désabonnement client

Tout d'abord, téléchargeons le jeu de données d'attrition et examinez le fichier pour vous assurer que toutes les données s'y trouvent. Effectuez ensuite les étapes suivantes :

Connectez-vous à la Console de gestion AWS, en utilisant un compte disposant des autorisations appropriées pour accéder à Canvas.
Connectez-vous à la console Canvas.

C'est là que nous pouvons gérer nos ensembles de données et créer des modèles.

Selectionnez L’.

Sélection du bouton d'importation de canevas

Selectionnez Téléchargement et sélectionnez le churn.csv fichier.
Selectionnez Importer des dates pour le télécharger sur Canvas.

Canevas sélectionner les données de s3

Le processus d'importation prend environ 10 secondes (cela peut varier en fonction de la taille de l'ensemble de données). Lorsqu'il est terminé, nous pouvons voir que l'ensemble de données est dans Ready état.

Ensemble de données prêt pour le canevas

Pour prévisualiser les 100 premières lignes de l'ensemble de données, passez votre souris sur l'icône en forme d'œil.

Ensemble de données de la vue canevas

Un aperçu du jeu de données s'affiche. Ici, nous pouvons vérifier que nos données sont correctes.

Canevas Vérifier les données

Après avoir confirmé que l'ensemble de données importé est prêt, nous créons notre modèle.

Selectionnez Nouveau modèle.

Toile Nouveaux Modèles

Sélectionnez le jeu de données churn.csv et choisissez Sélectionnez un jeu de données.

Canevas Sélectionner un jeu de données

Nous configurons maintenant le processus de construction du modèle.

Pour Colonnes cibles, choisir la Churn? colonne.

Pour Type de modèle, Canvas recommande automatiquement le type de modèle, dans ce cas Prédiction à 2 catégories (ce qu'un data scientist appellerait une classification binaire). Cela convient à notre cas d'utilisation car nous n'avons que deux valeurs de prédiction possibles : True or False, nous suivons donc la recommandation faite par Canvas.

Modèle de construction de canevas

Nous validons maintenant certaines hypothèses. Nous voulons voir rapidement si notre colonne cible peut être prédite par les autres colonnes. Nous pouvons obtenir une vue rapide de la précision estimée du modèle et de l'impact de la colonne (l'importance estimée de chaque colonne dans la prédiction de la colonne cible).

Sélectionnez les 21 colonnes et choisissez Aperçu du modèle.

Cette fonctionnalité utilise un sous-ensemble de notre ensemble de données et une seule passe de modélisation. Pour notre cas d'utilisation, le modèle de prévisualisation prend environ 2 minutes à créer.

Modèle d'aperçu du canevas

Comme le montre la capture d'écran suivante, le Phone ainsi que State les colonnes ont beaucoup moins d'impact sur notre prédiction. Nous voulons être prudents lors de la suppression de l'entrée de texte, car elle peut contenir d'importantes caractéristiques discrètes et catégorielles contribuant à notre prédiction. Ici, le numéro de téléphone n'est que l'équivalent d'un numéro de compte, sans valeur pour prédire la probabilité de désabonnement d'autres comptes, et l'état du client n'a pas beaucoup d'impact sur notre modèle.

Nous supprimons ces colonnes car elles n'ont pas d'importance majeure.
Après avoir retiré le Phone ainsi que State colonnes, exécutons à nouveau l'aperçu.

Comme le montre la capture d'écran suivante, la précision du modèle a augmenté de 0.1 %. Notre modèle d'aperçu a une précision estimée à 95.9 %, et les colonnes ayant le plus grand impact sont Night Calls, Eve Minset Night Charge. Cela nous donne un aperçu des colonnes qui ont le plus d'impact sur les performances de notre modèle. Ici, nous devons être prudents lors de la sélection des fonctionnalités, car si une seule fonctionnalité a un impact extrêmement important sur le résultat d'un modèle, c'est un indicateur principal de fuite cible, et la fonctionnalité ne sera pas disponible au moment de la prédiction. Dans ce cas, peu de colonnes ont montré un impact très similaire, nous continuons donc à construire notre modèle.

Ingénierie des fonctionnalités du canevas après

Canvas propose deux options de construction :

Construction standard – Construit le meilleur modèle à partir d'un processus optimisé alimenté par AutoML; la vitesse est échangée pour une plus grande précision
Construction rapide – Construit un modèle en une fraction de temps par rapport à une construction standard ; la précision potentielle est échangée contre la vitesse.

Pour ce poste, nous choisissons le Construction standard option parce que nous voulons avoir le meilleur modèle et nous sommes prêts à passer plus de temps à attendre le résultat.

Construction standard en toile

Le processus de construction peut prendre de 2 à 4 heures. Pendant ce temps, Canvas teste des centaines de pipelines candidats, en sélectionnant le meilleur modèle à nous présenter. Dans la capture d'écran suivante, nous pouvons voir le temps de construction et la progression attendus.

Modèle d'analyse de canevas

Évaluer les performances du modèle

Lorsque le processus de construction du modèle est terminé, le modèle a prédit le désabonnement 97.9 % du temps. Cela semble bien, mais en tant qu'analystes, nous voulons approfondir et voir si nous pouvons faire confiance au modèle pour prendre des décisions en fonction de celui-ci. Sur le Scoring onglet, nous pouvons examiner un tracé visuel de nos prédictions mappées à leurs résultats. Cela nous permet de mieux comprendre notre modèle.

Canvas sépare l'ensemble de données en ensembles d'apprentissage et de test. L'ensemble de données d'apprentissage correspond aux données que Canvas utilise pour créer le modèle. L'ensemble de test est utilisé pour voir si le modèle fonctionne bien avec de nouvelles données. Le diagramme de Sankey dans la capture d'écran suivante montre comment le modèle s'est comporté sur l'ensemble de test. Pour en savoir plus, consultez Évaluation des performances de votre modèle dans Amazon SageMaker Canvas.

Pour obtenir des informations plus détaillées au-delà de ce qui est affiché dans le diagramme de Sankey, les analystes métier peuvent utiliser un matrice de confusion analyse pour leurs solutions d'affaires. Par exemple, nous voulons mieux comprendre la probabilité que le modèle fasse de fausses prédictions. Nous pouvons voir cela dans le diagramme de Sankey, mais nous voulons plus d'informations, nous choisissons donc Métriques avancées. On nous présente une matrice de confusion, qui affiche les performances d'un modèle dans un format visuel avec les valeurs suivantes, spécifiques à la classe positive - nous mesurons en fonction de leur taux de désabonnement, donc notre classe positive est True dans cet exemple :

Vrai positif (TP) - Le nombre de True résultats qui ont été correctement prédits comme True
Vrai négatif (TN) - Le nombre de False résultats qui ont été correctement prédits comme False
Faux positif (FP) - Le nombre de False résultats qui ont été prédits à tort comme True
Faux négatif (FN) - Le nombre de True résultats qui ont été prédits à tort comme False

Nous pouvons utiliser ce tableau matriciel pour déterminer non seulement la précision de notre modèle, mais aussi quand il est faux, à quelle fréquence cela peut être et comment il est faux.

Toile F1 Matrix

Les métriques avancées semblent bonnes. Nous pouvons faire confiance au résultat du modèle. Nous voyons très peu de faux positifs et de faux négatifs. Ce sont si le modèle pense qu'un client dans l'ensemble de données va se désabonner et qu'il ne le fait pas (faux positif), ou si le modèle pense que le client va se désabonner et qu'il le fait réellement (faux négatif). Des nombres élevés pour l'un ou l'autre pourraient nous faire réfléchir davantage si nous pouvons utiliser le modèle pour prendre des décisions.

Revenons à Vue d’ensemble , pour examiner l'impact de chaque colonne. Ces informations peuvent aider l'équipe marketing à obtenir des informations qui conduisent à prendre des mesures pour réduire le taux de désabonnement des clients. Par exemple, nous pouvons voir qu'à la fois bas et haut CustServ Calls augmenter la probabilité de désabonnement. L'équipe marketing peut prendre des mesures pour empêcher le désabonnement des clients en fonction de ces apprentissages. Les exemples incluent la création d'une FAQ détaillée sur les sites Web pour réduire les appels au service client et l'exécution de campagnes d'éducation avec les clients sur la FAQ qui peuvent maintenir l'engagement.

Notre modèle semble assez précis. On peut effectuer directement une prédiction interactive sur le Prédire tab, soit par lot soit par prédiction unique (en temps réel). Dans cet exemple, nous avons apporté quelques modifications à certaines valeurs de colonne et effectué une prédiction en temps réel. Canvas nous montre le résultat de la prédiction ainsi que le niveau de confiance.

Canevas Prédire l'inférence

Disons que nous avons un client existant qui a l'utilisation suivante : Night Mins est 40 et Eve Mins est de 40. Nous pouvons exécuter une prédiction, et notre modèle renvoie un score de confiance de 93.2 % que ce client désabonnera (True). Nous pourrions maintenant choisir de proposer des remises promotionnelles pour fidéliser ce client.

L'exécution d'une prédiction est idéale pour une analyse de simulation individuelle, mais nous devons également exécuter des prédictions sur plusieurs enregistrements à la fois. La toile est capable de exécuter des prédictions par lots, qui vous permet d'exécuter des prédictions à grande échelle.

Conclusion

Dans cet article, nous avons montré comment un analyste commercial peut créer un modèle de désabonnement client avec SageMaker Canvas à l'aide d'exemples de données. Canvas permet à vos analystes commerciaux de créer des modèles ML précis et de générer des prédictions à l'aide d'une interface visuelle sans code et pointer-cliquer. Un analyseur marketing peut désormais utiliser ces informations pour lancer des campagnes de fidélisation ciblées et tester plus rapidement de nouvelles stratégies de campagne, ce qui entraîne une réduction du taux de désabonnement des clients.

Les analystes peuvent passer au niveau supérieur en partageant leurs modèles avec des collègues data scientists. Les data scientists peuvent visualiser le modèle Canvas dans Amazon SageMakerStudio, où ils peuvent explorer les choix effectués par Canvas AutoML, valider les résultats du modèle et même produire le modèle en quelques clics. Cela peut accélérer la création de valeur basée sur le ML et contribuer à améliorer les résultats plus rapidement.

Pour en savoir plus sur l'utilisation de Canvas, consultez Construire, partager, déployer : comment les analystes commerciaux et les spécialistes des données accélèrent la mise sur le marché à l'aide de ML sans code et d'Amazon SageMaker Canvas. Pour plus d'informations sur la création de modèles de ML avec une solution sans code, consultez Présentation d'Amazon SageMaker Canvas, une capacité d'apprentissage automatique visuelle et sans code pour les analystes commerciaux.

À propos de l’auteur

Henri Robalino est un architecte de solutions chez AWS, basé à NJ. Il est passionné par le cloud et l'apprentissage automatique, ainsi que par le rôle qu'ils peuvent jouer dans la société. Il y parvient en travaillant avec les clients pour les aider à atteindre leurs objectifs commerciaux à l'aide du cloud AWS. En dehors du travail, vous pouvez trouver Henry en voyage ou en plein air avec sa fille en fourrure Arly.

Prévoyez le taux de désabonnement des clients grâce au machine learning sans code à l'aide d'Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Chaoran Wang est un architecte de solutions chez AWS, basé à Dallas, TX. Il travaille chez AWS depuis l'obtention de son diplôme de l'Université du Texas à Dallas en 2016 avec une maîtrise en informatique. Chaoran aide les clients à créer des applications évolutives, sécurisées et rentables et à trouver des solutions pour résoudre leurs problèmes commerciaux sur le cloud AWS. En dehors du travail, Chaoran aime passer du temps avec sa famille et ses deux chiens, Biubiu et Coco.

Horodatage: 5 mai 2022

Horodatage: 13 avril 2023

Republié par Platon

Protection fondamentale des données pour l'accélération LLM d'entreprise avec Protopia AI | Services Web Amazon

Transformer la recherche qualitative en automatisant l'analyse de la parole en texte à texte

Comment Sophos forme un détecteur de malware PDF puissant et léger à très grande échelle avec Amazon SageMaker

Automatisez la classification des demandes de service informatique avec un classificateur personnalisé Amazon Comprehend

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte