Predecir la rotación de clientes con aprendizaje automático sin código mediante Amazon SageMaker Canvas

Reeditado por Platón

seguidores: 0

Comprender el comportamiento del cliente es lo más importante para todas las empresas hoy en día. Obtener información sobre por qué y cómo compran los clientes puede ayudar a aumentar los ingresos. Pero perder clientes (también llamado abandono de clientes) es siempre un riesgo, y la comprensión de por qué los clientes se van puede ser igual de importante para mantener los ingresos y las ganancias. El aprendizaje automático (ML) puede ayudar con los conocimientos, pero hasta ahora necesitaba expertos en ML para crear modelos para predecir la rotación, cuya falta podría retrasar las acciones basadas en conocimientos de las empresas para retener a los clientes.

En esta publicación, le mostramos cómo los analistas comerciales pueden crear un modelo de aprendizaje automático de rotación de clientes con Lienzo de Amazon SageMaker, no se requiere código. Canvas proporciona a los analistas de negocios una interfaz visual de apuntar y hacer clic que le permite crear modelos y generar predicciones precisas de ML por su cuenta, sin necesidad de experiencia en ML ni tener que escribir una sola línea de código.

Resumen de la solución

Para esta publicación, asumimos el papel de un analista de marketing en el departamento de marketing de un operador de telefonía móvil. Se nos ha encomendado la tarea de identificar a los clientes que están potencialmente en riesgo de abandono. Tenemos acceso al uso del servicio y otros datos de comportamiento del cliente, y queremos saber si estos datos pueden ayudar a explicar por qué un cliente se iría. Si podemos identificar los factores que explican la rotación, entonces podemos tomar medidas correctivas para cambiar el comportamiento previsto, como ejecutar campañas de retención específicas.

Para hacer esto, usamos los datos que tenemos en un archivo CSV, que contiene información sobre el uso y abandono de clientes. Usamos Canvas para realizar los siguientes pasos:

Importar el conjunto de datos de abandono de Servicio de almacenamiento simple de Amazon (Amazon S3).
Entrene y construya el modelo de abandono.
Analizar los resultados del modelo.
Probar predicciones contra el modelo.

Para nuestro conjunto de datos, utilizamos un conjunto de datos sintético de un operador de telefonía móvil de telecomunicaciones. Este conjunto de datos de muestra contiene 5,000 registros, donde cada registro usa 21 atributos para describir el perfil del cliente. Los atributos son los siguientes:

Estado – El estado de EE. UU. en el que reside el cliente, indicado por una abreviatura de dos letras; por ejemplo, OH o NJ
Longitud de la cuenta - La cantidad de días que esta cuenta ha estado activa.
Codigo de AREA – El código de área de tres dígitos del número de teléfono del cliente
Teléfono – El número de teléfono restante de siete dígitos
Plan Internacional – Si el cliente tiene un plan de llamadas internacionales (sí/no)
Plan de correo virtual – Si el cliente tiene una función de correo de voz (sí/no)
Mensaje de VMail - La cantidad promedio de mensajes de correo de voz por mes
Minutos del día – El número total de minutos de llamadas utilizados durante el día
Llamadas diurnas – El número total de llamadas realizadas durante el día
Cargo por día – El costo facturado de las llamadas diurnas
Minutos de víspera, Eva llama, Eve Evege – El costo facturado por llamadas nocturnas
Minutos de la noche, Llamadas nocturnas, Cargo nocturno – El costo facturado por llamadas nocturnas
Minutos internacionales, Llamadas internacionales, Cargo internacional - El costo facturado por llamadas internacionales
Llamadas CustServ - El número de llamadas realizadas al servicio de atención al cliente.
¿Batir? – Si el cliente abandonó el servicio (verdadero/falso)

El último atributo, Churn?, es el atributo que queremos que prediga el modelo de ML. El atributo de destino es binario, lo que significa que nuestro modelo predice la salida como una de dos categorías (True or False).

Requisitos previos

Un administrador de la nube con un Cuenta de AWS con los permisos apropiados es necesario completar los siguientes requisitos previos:

Implementar un Amazon SageMaker Para instrucciones, vea Incorporación al dominio de Amazon SageMaker.
Implementar lienzo. Para obtener instrucciones, consulte Configuración y administración de Amazon SageMaker Canvas (para administradores de TI).
Configure las políticas de uso compartido de recursos de origen cruzado (CORS) para Canvas. Para obtener instrucciones, consulte Ofrezca a sus usuarios la posibilidad de cargar archivos locales.

Crear un modelo de abandono de clientes

Primero, descarguemos el conjunto de datos de abandono y revise el archivo para asegurarse de que todos los datos estén allí. Luego complete los siguientes pasos:

Inicia sesión en el Consola de administración de AWS, usando una cuenta con los permisos apropiados para acceder a Canvas.
Inicie sesión en la consola de Canvas.

Aquí es donde podemos administrar nuestros conjuntos de datos y crear modelos.

Elige Importa.

Seleccionar botón de importación de lienzo

Elige Subir y seleccione el churn.csv archivo.
Elige Importar fechas para subirlo a Canvas.

Canvas selecciona datos de s3

El proceso de importación tarda aproximadamente 10 segundos (esto puede variar según el tamaño del conjunto de datos). Cuando esté completo, podemos ver que el conjunto de datos está en Ready de estado.

Conjunto de datos listo para lienzo

Para obtener una vista previa de las primeras 100 filas del conjunto de datos, pase el mouse sobre el ícono del ojo.

Conjunto de datos de vista de lienzo

Aparece una vista previa del conjunto de datos. Aquí podemos comprobar que nuestros datos son correctos.

Lienzo Verificar datos

Después de confirmar que el conjunto de datos importado está listo, creamos nuestro modelo.

Elige Nuevo modelo.

Lona Nuevos Modelos

Seleccione el conjunto de datos churn.csv y elija Seleccionar conjunto de datos.

Conjunto de datos de selección de lienzo

Ahora configuramos el proceso de construcción del modelo.

Columnas de destino, elegir la Churn? columna.

Tipo de modelo, Canvas recomienda automáticamente el tipo de modelo, en este caso predicción de 2 categorías (lo que un científico de datos llamaría clasificación binaria). Esto es adecuado para nuestro caso de uso porque solo tenemos dos valores de predicción posibles: True or False, así que vamos con la recomendación que hizo Canvas.

Modelo de construcción de lienzo

Ahora validamos algunas suposiciones. Queremos obtener una vista rápida de si nuestra columna de destino puede ser predicha por las otras columnas. Podemos obtener una vista rápida de la precisión estimada del modelo y el impacto de la columna (la importancia estimada de cada columna en la predicción de la columna de destino).

Seleccione las 21 columnas y elija Modelo de vista previa.

Esta función utiliza un subconjunto de nuestro conjunto de datos y solo una pasada en el modelado. Para nuestro caso de uso, el modelo de vista previa tarda aproximadamente 2 minutos en construirse.

Modelo de vista previa de lienzo

Como se muestra en la siguiente captura de pantalla, el Phone y State las columnas tienen mucho menos impacto en nuestra predicción. Queremos tener cuidado al eliminar la entrada de texto porque puede contener importantes características discretas y categóricas que contribuyen a nuestra predicción. Aquí, el número de teléfono es solo el equivalente de un número de cuenta, no tiene valor para predecir la probabilidad de abandono de otras cuentas, y el estado del cliente no afecta mucho nuestro modelo.

Eliminamos estas columnas porque no tienen una característica importante.
Después de que eliminemos el Phone y State columnas, vamos a ejecutar la vista previa de nuevo.

Como se muestra en la siguiente captura de pantalla, la precisión del modelo aumentó un 0.1 %. Nuestro modelo de vista previa tiene una precisión estimada del 95.9% y las columnas con mayor impacto son Night Calls, Eve Minsy Night Charge. Esto nos da una idea de qué columnas afectan más el rendimiento de nuestro modelo. Aquí debemos tener cuidado al hacer la selección de funciones porque si una sola función tiene un gran impacto en el resultado de un modelo, es un indicador principal de fuga de destinoy la función no estará disponible en el momento de la predicción. En este caso, pocas columnas mostraron un impacto muy similar, por lo que continuamos construyendo nuestro modelo.

Ingeniería de características de Canvas después

Canvas ofrece dos opciones de construcción:

Construcción estándar – Construye el mejor modelo a partir de un proceso optimizado impulsado por AutoML; la velocidad se cambia por la mayor precisión
Construcción rápida – Construye un modelo en una fracción del tiempo en comparación con una construcción estándar; la precisión potencial se cambia por velocidad.

Para esta publicación, elegimos el Construcción estándar opción porque queremos tener el mejor modelo y estamos dispuestos a pasar más tiempo esperando el resultado.

Construcción estándar de Canvas

El proceso de compilación puede tardar de 2 a 4 horas. Durante este tiempo, Canvas prueba cientos de proyectos candidatos y selecciona el mejor modelo para presentarnos. En la siguiente captura de pantalla, podemos ver el tiempo de construcción y el progreso esperados.

Modelo de análisis de lienzo

Evaluar el rendimiento del modelo

Cuando se completa el proceso de creación del modelo, el modelo predijo la rotación el 97.9 % del tiempo. Esto parece estar bien, pero como analistas queremos profundizar más y ver si podemos confiar en el modelo para tomar decisiones basadas en él. Sobre el Scoring pestaña, podemos revisar un gráfico visual de nuestras predicciones asignadas a sus resultados. Esto nos permite una visión más profunda de nuestro modelo.

Canvas separa el conjunto de datos en conjuntos de entrenamiento y de prueba. El conjunto de datos de entrenamiento son los datos que utiliza Canvas para construir el modelo. El conjunto de prueba se usa para ver si el modelo funciona bien con nuevos datos. El diagrama de Sankey en la siguiente captura de pantalla muestra cómo se desempeñó el modelo en el conjunto de prueba. Para obtener más información, consulte Evaluación del rendimiento de su modelo en Amazon SageMaker Canvas.

Para obtener información más detallada más allá de lo que se muestra en el diagrama de Sankey, los analistas de negocios pueden usar un matriz de confusión análisis para sus soluciones de negocio. Por ejemplo, queremos comprender mejor la probabilidad de que el modelo haga predicciones falsas. Podemos ver esto en el diagrama de Sankey, pero queremos más información, así que elegimos Métricas avanzadas. Se nos presenta una matriz de confusión, que muestra el rendimiento de un modelo en un formato visual con los siguientes valores, específicos de la clase positiva: estamos midiendo en función de si de hecho abandonarán, por lo que nuestra clase positiva es True en este ejemplo:

Verdadero Positivo (TP) - El número de True resultados que fueron correctamente predichos como True
Verdadero Negativo (TN) - El número de False resultados que fueron correctamente predichos como False
Falso positivo (FP) - El número de False resultados que fueron erróneamente predichos como True
Falso Negativo (FN) - El número de True resultados que fueron erróneamente predichos como False

Podemos usar este gráfico matricial para determinar no solo qué tan preciso es nuestro modelo, sino también cuándo está mal, con qué frecuencia puede ser y cómo está mal.

Lona F1 Matriz

Las métricas avanzadas se ven bien. Podemos confiar en el resultado del modelo. Vemos muy pocos falsos positivos y falsos negativos. Estos son si el modelo cree que un cliente en el conjunto de datos abandonará y en realidad no lo hará (falso positivo), o si el modelo cree que el cliente abandonará y realmente lo hará (falso negativo). Los números altos para cualquiera de los dos podrían hacernos pensar más si podemos usar el modelo para tomar decisiones.

Volvamos a General pestaña, para revisar el impacto de cada columna. Esta información puede ayudar al equipo de marketing a obtener información que lo lleve a tomar medidas para reducir la pérdida de clientes. Por ejemplo, podemos ver que tanto el bajo como el alto CustServ Calls aumentar la probabilidad de abandono. El equipo de marketing puede tomar medidas para evitar la pérdida de clientes en función de estos aprendizajes. Los ejemplos incluyen la creación de preguntas frecuentes detalladas en los sitios web para reducir las llamadas al servicio de atención al cliente y la ejecución de campañas educativas con los clientes sobre las preguntas frecuentes que pueden mantener el compromiso.

Nuestro modelo parece bastante preciso. Podemos realizar directamente una predicción interactiva en el Predicción pestaña, ya sea en lote o predicción única (en tiempo real). En este ejemplo, hicimos algunos cambios en ciertos valores de columna y realizamos una predicción en tiempo real. Canvas nos muestra el resultado de la predicción junto con el nivel de confianza.

Inferencia de predicción de Canvas

Digamos que tenemos un cliente existente que tiene el siguiente uso: Night Mins es 40 y Eve Mins es 40. Podemos ejecutar una predicción y nuestro modelo arroja una puntuación de confianza del 93.2 % de que este cliente abandonará (True). Ahora podríamos optar por ofrecer descuentos promocionales para retener a este cliente.

Digamos que tenemos un cliente existente que tiene el siguiente uso: Night Mins es 40 y Eve Mins es 40. Podemos ejecutar una predicción y nuestro modelo arroja una puntuación de confianza del 93.2 % de que este cliente abandonará (True). Ahora podríamos optar por proporcionar descuentos de promoción para retener a este cliente.

Ejecutar una predicción es excelente para el análisis hipotético individual, pero también necesitamos ejecutar predicciones en muchos registros a la vez. El lienzo es capaz de ejecutar predicciones por lotes, que le permite ejecutar predicciones a escala.

Conclusión

En esta publicación, mostramos cómo un analista comercial puede crear un modelo de rotación de clientes con SageMaker Canvas utilizando datos de muestra. Canvas permite a sus analistas comerciales crear modelos de ML precisos y generar predicciones mediante una interfaz de apuntar y hacer clic, visual y sin código. Un analista de marketing ahora puede usar esta información para ejecutar campañas de retención dirigidas y probar nuevas estrategias de campaña más rápido, lo que lleva a una reducción en la rotación de clientes.

Los analistas pueden llevar esto al siguiente nivel al compartir sus modelos con colegas científicos de datos. Los científicos de datos pueden ver el modelo Canvas en Estudio Amazon SageMaker, donde pueden explorar las elecciones que hizo Canvas AutoML, validar los resultados del modelo e incluso producir el modelo con unos pocos clics. Esto puede acelerar la creación de valor basada en ML y ayudar a escalar mejores resultados más rápido.

Para obtener más información sobre el uso de Canvas, consulte Cree, comparta, implemente: cómo los analistas de negocios y los científicos de datos logran un tiempo de comercialización más rápido utilizando ML sin código y Amazon SageMaker Canvas. Para obtener más información sobre la creación de modelos ML con una solución sin código, consulte Anuncio de Amazon SageMaker Canvas: una capacidad de aprendizaje automático visual y sin código para analistas de negocios.

Sobre la autora

Enrique Robalino es arquitecto de soluciones en AWS, con sede en NJ. Le apasiona la nube y el aprendizaje automático, y el papel que pueden desempeñar en la sociedad. Lo logra trabajando con los clientes para ayudarlos a lograr sus objetivos comerciales utilizando la nube de AWS. Fuera del trabajo, puedes encontrar a Henry viajando o explorando el aire libre con su hija peluda Arly.

Prediga la rotación de clientes con aprendizaje automático sin código utilizando Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai. chaoran wang es un arquitecto de soluciones en AWS, con sede en Dallas, TX. Ha estado trabajando en AWS desde que se graduó de la Universidad de Texas en Dallas en 2016 con una maestría en Ciencias de la Computación. Chaoran ayuda a los clientes a crear aplicaciones escalables, seguras y rentables y a encontrar soluciones para resolver sus desafíos comerciales en la nube de AWS. Fuera del trabajo, a Chaoran le encanta pasar tiempo con su familia y sus dos perros, Biubiu y Coco.

Sello de tiempo: 5 de mayo de 2022

Sello de tiempo: Apr 13, 2023

Reeditado por Platón

Protección de datos fundamental para la aceleración de LLM empresarial con Protopia AI | Servicios web de Amazon

Transformar la investigación cualitativa mediante la automatización del análisis de voz a texto a texto

Cómo Sophos entrena un potente y ligero detector de malware PDF a gran escala con Amazon SageMaker

Automatice la clasificación de las solicitudes de servicios de TI con un clasificador personalizado de Amazon Comprehend

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta