Resuelva problemas comerciales de un extremo a otro mediante el aprendizaje automático en las soluciones JumpStart de Amazon SageMaker

Reeditado por Platón

seguidores: 0

JumpStart de Amazon SageMaker proporciona modelos de código abierto previamente entrenados para una amplia gama de tipos de problemas para ayudarlo a comenzar con el aprendizaje automático (ML). JumpStart también proporciona plantillas de solución que configuran la infraestructura para casos de uso comunes y cuadernos de ejemplo ejecutables para ML con Amazon SageMaker.

Como usuario comercial, puede hacer lo siguiente con las soluciones JumpStart:

Explore las soluciones y evalúe cuáles son una buena combinación para las necesidades de su negocio.
Inicie soluciones con un solo clic en Estudio Amazon SageMaker. Esto lanza un Formación en la nube de AWS plantilla para crear los recursos necesarios.
Modifique la solución para que satisfaga sus necesidades con acceso a cuadernos subyacentes y activos modelo.
Elimine los recursos adquiridos una vez hecho.

Esta publicación se centra en las cinco soluciones de ML que se agregaron recientemente para abordar cinco desafíos comerciales diferentes. Al momento de escribir este artículo, JumpStart ofrece 23 soluciones comerciales que van desde la detección de fraude en transacciones financieras hasta el reconocimiento de escritura a mano. La cantidad de soluciones que se ofrecen a través de JumpStart aumenta regularmente a medida que se le agregan más soluciones.

Resumen de la solución

Las cinco nuevas soluciones son las siguientes:

Optimización de precios – Ofrece modelos de ML personalizables para ayudarlo a tomar decisiones óptimas para establecer el precio de su producto o servicio a fin de lograr su objetivo comercial, como maximizar los ingresos, las ganancias u otras métricas personalizadas.
Predicción de especies de aves – Muestra cómo puede entrenar y ajustar un modelo de detección de objetos. Demuestra el ajuste del modelo a través del aumento de la imagen de entrenamiento y traza las mejoras de precisión que se producen a lo largo de las iteraciones (épocas) del trabajo de entrenamiento.
Predicción de supervivencia del cáncer de pulmón: Muestra cómo puede alimentar características radiómicas 2D y 3D y datos demográficos de pacientes a un algoritmo de aprendizaje automático para predecir las posibilidades de supervivencia del cáncer de pulmón de un paciente. Los resultados de esta predicción pueden ayudar a los proveedores a tomar las medidas proactivas adecuadas.
Clasificación de pagos financieros – Demuestra cómo entrenar e implementar un modelo ML para clasificar las transacciones financieras en función de la información de la transacción. También puede utilizar esta solución como paso intermedio en la detección de fraudes, personalización o detección de anomalías.
Predicción de abandono para clientes de telefonía móvil – Demuestra cómo desarrollar rápidamente un modelo de predicción de abandono utilizando un conjunto de datos de transacciones de llamadas móviles. Este es un ejemplo simple para los usuarios que son nuevos en ML.

Requisitos previos

Para utilizar estas soluciones, asegúrese de tener acceso a Studio con una función de ejecución que le permita ejecutar la funcionalidad de SageMaker. Para su rol de usuario dentro de Studio, asegúrese de que el Proyectos de SageMaker y JumpStart la opción está activada

En las siguientes secciones, analizamos cada una de las cinco nuevas soluciones y discutimos cómo funciona en detalle, junto con algunas recomendaciones sobre cómo puede usarlas para sus propias necesidades comerciales.

Optimización de precios

A las empresas les gusta usar varias palancas para obtener los mejores resultados. Por ejemplo, el precio de un producto o servicio es una palanca que una empresa puede controlar. La pregunta es cómo decidir a qué precio establecer un producto o servicio, para maximizar un objetivo comercial como la ganancia o los ingresos.

Esta solución proporciona modelos de ML personalizables para ayudarlo a tomar decisiones óptimas para establecer el precio de su producto o servicio a fin de lograr su objetivo, como maximizar los ingresos, las ganancias u otras métricas personalizadas. La solución utiliza ML y enfoques de inferencia causal para aprender relaciones precio-volumen a partir de datos históricos, y puede hacer recomendaciones dinámicas de precios en tiempo real para optimizar las métricas objetivas personalizadas.

La siguiente captura de pantalla muestra los datos de entrada de muestra.

La solución incluye tres partes:

Estimación de la elasticidad precio – Esto se estima por inferencia causal a través de un algoritmo de ML doble
Pronóstico de volumen – Esto se pronostica usando el algoritmo Prophet
Optimización de precios – Esto se logra mediante una simulación hipotética a través de diferentes escenarios de precios.

La solución proporciona el precio recomendado para el día siguiente para maximizar los ingresos. Además, los resultados incluyen la elasticidad del precio estimada, que es un valor que indica el efecto del precio en el volumen, y un modelo de pronóstico, que puede pronosticar el volumen del día siguiente. El siguiente gráfico muestra cómo un modelo causal que incorporó la elasticidad del precio calculada funciona mucho mejor bajo un análisis hipotético (con grandes desviaciones del comportamiento del precio) que un modelo predictivo que usa Prophet para pronosticar el volumen usando datos de series de tiempo.

Puede aplicar esta solución a su negocio para los siguientes casos de uso:

Determinar el precio óptimo de los bienes para una tienda minorista.
Estimar el efecto de los cupones de descuento en las compras de los clientes
Predecir el efecto de varios métodos de incentivos en cualquier negocio

Predicción de especies de aves

Existen varias aplicaciones de visión por computadora (CV) para las empresas en la actualidad. Una de esas aplicaciones es la detección de objetos, donde un algoritmo ML detecta la ubicación de un objeto en una imagen dibujando un cuadro delimitador a su alrededor e identifica el tipo de objeto que es. Aprender a aplicar un modelo de detección de objetos y ajustarlo puede ser de gran valor para una organización que tiene necesidades de CV.

Esta solución proporciona un ejemplo de cómo traducir las especificaciones del cuadro delimitador al proporcionar imágenes al algoritmo de SageMaker. Esta solución también demuestra cómo mejorar un modelo de detección de objetos agregando imágenes de entrenamiento que se voltean horizontalmente (imágenes especulares).

Se proporciona un cuaderno para experimentar con desafíos de detección de objetos cuando hay una gran cantidad de clases (200 especies de aves). El cuaderno también muestra cómo graficar las mejoras de precisión que ocurren a lo largo de las épocas del trabajo de entrenamiento. La siguiente imagen muestra imágenes de ejemplo del conjunto de datos de aves.

Esta solución contiene cinco pasos:

Preparar los datos, incluida la descarga y RecordIO generación de archivos.
Cree y entrene un modelo de detección de objetos.
Implemente un punto final y evalúe el rendimiento del modelo.
Cree y entrene de nuevo un modelo de detección de objetos con el conjunto de datos ampliado.
Implemente un punto final y evalúe el rendimiento del modelo ampliado.

Obtienes lo siguiente como salida:

Resultados de detección de objetos con cajas de unión contra su imagen de prueba
Un modelo de detección de objetos entrenado
Un modelo de detección de objetos entrenado con un conjunto de datos expandido (invertido) adicional
Dos puntos finales separados implementados con uno de cada modelo

El siguiente gráfico muestra la mejora del modelo frente a las iteraciones del modelo (épocas) durante el entrenamiento.

Los siguientes ejemplos se obtienen a partir de dos imágenes de prueba.

Puede aplicar esta solución a su negocio para los siguientes casos de uso:

Detección de objetos en una cinta transportadora en una industria de embalaje
Detectar ingredientes en una pizza
Implementar aplicaciones operativas de la cadena de suministro que involucren la detección de objetos.

Predicción de supervivencia del cáncer de pulmón

COVID-19 atrajo mucha más atención a los desafíos médicos relacionados con los pulmones. También ha ejercido mucha presión sobre hospitales, médicos, enfermeras y radiólogos. Imagine una posibilidad en la que pueda aplicar ML como una herramienta poderosa para ayudar a los médicos y ayudarlos a acelerar su trabajo. En esta solución, mostramos cómo las características radiómicas 2D y 3D y los datos demográficos de los pacientes pueden incorporarse a un algoritmo de aprendizaje automático para predecir las posibilidades de supervivencia del cáncer de pulmón de un paciente. Los resultados de esta predicción pueden ayudar a los proveedores a tomar las medidas proactivas adecuadas.

Esta solución demuestra cómo crear una canalización de aprendizaje automático escalable para el conjunto de datos de radiogenómica del cáncer de pulmón de células no pequeñas (NSCLC), que consta de datos de secuenciación de ARN, datos clínicos (que reflejan los datos de EHR) e imágenes médicas. El uso de múltiples tipos de datos para crear un modelo de máquina se conoce como multimodal ML. Esta solución predice el resultado de supervivencia de los pacientes diagnosticados con cáncer de pulmón de células no pequeñas.

La siguiente imagen muestra un ejemplo de los datos de entrada del conjunto de datos de radiogenómica del cáncer de pulmón de células no pequeñas (NSCLC).

Como parte de la solución, se extrajo el ARN total del tejido tumoral y se analizó con tecnología de secuenciación de ARN. Aunque los datos originales contienen más de 22,000 21 genes, conservamos 10 genes de XNUMX grupos de genes altamente coexpresados (metagenes) que se identificaron, validaron en cohortes de expresión génica disponibles públicamente y se correlacionaron con el pronóstico.

Las historias clínicas se almacenan en formato CSV. Cada fila corresponde a un paciente y las columnas contienen información sobre los pacientes, incluidos los datos demográficos, el estadio del tumor y el estado de supervivencia.

Para los datos genómicos, mantenemos 21 genes de 10 grupos de genes altamente coexpresados (metagenes) que se identificaron, validaron en cohortes de expresión génica disponibles públicamente y se correlacionaron con el pronóstico.

Para los datos de imágenes médicas, creamos características radiómicas 3D a nivel del paciente que explican el tamaño, la forma y los atributos visuales de los tumores observados en las tomografías computarizadas. Para cada estudio de paciente, se realizan los siguientes pasos:

Lea los archivos de corte DICOM 2D para la tomografía computarizada y la segmentación del tumor, combínelos en volúmenes 3D, guarde los volúmenes en formato NIfTI.
Alinee el volumen de TC y la segmentación del tumor para que podamos enfocar el cálculo dentro del tumor.
Calcule las características radiómicas que describen la región del tumor utilizando la biblioteca de piradiómica.
Extraiga 120 características radiómicas de ocho clases, como representaciones estadísticas de la distribución y concurrencia de la intensidad dentro de la región tumoral de interés, y mediciones basadas en la forma que describen el tumor morfológicamente.

Para crear una vista multimodal de un paciente para el entrenamiento del modelo, unimos los vectores de funciones de tres modalidades. Luego procesamos los datos. Primero, normalizamos el rango de características independientes usando la escala de características. Luego, realizamos un análisis de componentes principales (PCA) en las características para reducir la dimensionalidad e identificar las características más discriminatorias que contribuyen con el 95 % de variación en los datos.

Esto da como resultado una reducción de la dimensionalidad de 215 características a 45 componentes principales, que constituyen características para el alumno supervisado.

La solución produce un modelo ML que predice el estado de supervivencia de los pacientes con NSCLC (vivos o muertos) en forma de probabilidad. Además del modelo y la predicción, también generamos informes para explicar el modelo. La canalización de imágenes médicas produce volúmenes de TC de pulmón en 3D y segmentación de tumores con fines de visualización.

Puede aplicar esta solución a los casos de uso de las ciencias biológicas y de la salud.

Clasificación de pagos financieros

Tomar todas las transacciones financieras de una empresa o un consumidor y organizarlas en varias categorías puede ser muy útil. Puede ayudar al usuario a saber cuánto ha gastado en qué categoría, y también puede generar alertas cuando las transacciones o el gasto en una categoría determinada aumentan o disminuyen inesperadamente.

Esta solución demuestra cómo entrenar e implementar un modelo ML para clasificar las transacciones financieras en función de la información de la transacción. Muchos bancos brindan esto como un servicio para brindar a sus usuarios finales una descripción general de sus hábitos de gasto. También puede utilizar esta solución como paso intermedio en la detección de fraudes, personalización o detección de anomalías. Usamos SageMaker para entrenar e implementar un modelo XGBoost con la infraestructura subyacente requerida.

El conjunto de datos sintéticos que utilizamos para demostrar esta solución tiene las siguientes características:

categoría_transacción – La categoría de la transacción, de las siguientes 19 opciones: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Homey Pension and insurances.
receiver_id – Un identificador para la parte receptora. El identificador consta de 16 números.
identificación del remitente – Un identificador para la parte que envía. El identificador consta de 16 números.
cantidad – La cantidad que se transfiere.
fecha y hora – La marca de tiempo de la transacción en formato AAAA-MM-DD HH:MM:SS.

Las primeras cinco observaciones del conjunto de datos son las siguientes:

Para esta solución, utilizamos XGBoost, una implementación popular y eficiente de código abierto del algoritmo de árboles potenciados por gradiente. El aumento de gradiente es un algoritmo de aprendizaje supervisado que intenta predecir con precisión una variable objetivo mediante la combinación de un conjunto de estimaciones de un conjunto de modelos más simples y más débiles. Su implementación está disponible en los algoritmos integrados de SageMaker.

La solución de clasificación de pagos financieros consta de cuatro pasos:

Prepara los datos.
Cree una tienda de funciones.
Cree y entrene un modelo XGBoost.
Implemente un punto final y evalúe el rendimiento del modelo.

Obtenemos el siguiente resultado:

Un modelo XGBoost entrenado basado en nuestro conjunto de datos de ejemplo
Un punto final de SageMaker que puede predecir la categoría de transacción

Después de ejecutar esta solución, debería ver un informe de clasificación similar al siguiente.

Las posibles aplicaciones para su negocio incluyen las siguientes:

Diversas aplicaciones financieras en banca minorista y de inversión
Cuando las transacciones deben clasificarse en cualquier caso de uso (no solo financiero)

Predicción de abandono para clientes de telefonía móvil

Predecir la rotación de clientes es una necesidad comercial muy común. Numerosos estudios muestran que el costo de retener a un cliente existente es mucho menor que adquirir un nuevo cliente. El desafío a menudo proviene de las empresas que tienen dificultades para entender por qué un cliente se está yendo o construyendo un modelo que predice la rotación.

En este ejemplo, los usuarios que son nuevos en ML pueden experimentar cómo se puede desarrollar rápidamente un modelo de predicción de abandono utilizando un conjunto de datos de transacciones de llamadas móviles. Esta solución utiliza SageMaker para entrenar e implementar un modelo XGBoost en un conjunto de datos de perfil de cliente para predecir si es probable que un cliente abandone un operador de telefonía móvil.

El conjunto de datos que utiliza esta solución está disponible públicamente y se menciona en el libro Discovering Knowledge in Data de Daniel T. Larose. El autor lo atribuye al Repositorio Irvine de conjuntos de datos de aprendizaje automático de la Universidad de California.

Este conjunto de datos utiliza los siguientes 21 atributos para describir el perfil de un cliente de un operador móvil estadounidense desconocido.

Estado: el estado de EE. UU. en el que reside el cliente, indicado por una abreviatura de dos letras; por ejemplo, OH o NJ
Duración de la cuenta: el número de días que esta cuenta ha estado activa
Código de área: el código de área de tres dígitos del número de teléfono del cliente correspondiente
Teléfono: el número de teléfono restante de siete dígitos
Plan Int'l: si el cliente tiene un plan de llamadas internacionales: sí/no
Plan VMail: si el cliente tiene una función de correo de voz: sí/no
Mensaje VMail: el número promedio de mensajes de correo de voz por mes
Minutos del día: el número total de minutos de llamadas utilizados durante el día
Llamadas diurnas: el número total de llamadas realizadas durante el día
Cargo por día: el costo facturado de las llamadas durante el día
Eve Mins, Eve Calls, Eve Charge: el costo facturado por las llamadas realizadas durante la noche
Night Mins, Night Calls, Night Charge: el costo facturado por las llamadas realizadas durante la noche
Intl Mins, Intl Calls, Intl Charge: el costo facturado para llamadas internacionales
CustServ Calls: el número de llamadas realizadas al servicio de atención al cliente
Churn?: si el cliente abandonó el servicio: verdadero/falso

Esta solución contiene tres etapas:

Prepara los datos.
Cree y entrene un modelo XGBoost.
Implemente un punto final y evalúe el rendimiento del modelo.

Obtenemos el siguiente resultado:

Un modelo XGBoost entrenado basado en nuestro conjunto de datos de ejemplo para predecir la rotación de usuarios
Un punto final de SageMaker que puede predecir la rotación de usuarios

Este modelo ayuda a calcular cuántos de los 5,000 clientes de telefonía móvil probablemente dejarán de utilizar su operador de telefonía móvil actual.

El siguiente gráfico muestra una distribución de probabilidad de la rotación como resultado del modelo.

Puede aplicar esto a su negocio para los siguientes casos de uso:

Prediga la rotación de clientes en su propio negocio
Clasifique qué clientes pueden abrir su correo electrónico de marketing y quiénes no (clasificación binaria)
Predecir qué estudiantes probablemente abandonarán un curso

Limpiar recursos

Una vez que haya terminado de ejecutar una solución en JumpStart, asegúrese de elegir Eliminar todos los recursos por lo que todos los recursos que has creado en el proceso se eliminan y se detiene tu facturación.

Resumen

Esta publicación le mostró cómo resolver varios problemas comerciales aplicando ML, basado en soluciones JumpStart. Aunque esta publicación se centró en las cinco nuevas soluciones que se agregaron recientemente a JumpStart, hay un total de 23 soluciones disponibles. Lo alentamos a iniciar sesión en Studio y ver las soluciones de JumpStart y comenzar a obtener un valor inmediato de ellas. Para obtener más información, consulte Estudio Amazon SageMaker y Inicio rápido de SageMaker.

Nota: Si no ve todas las cinco soluciones anteriores en la consola de JumpStart de su región de AWS, espere una semana y verifique nuevamente. Los estamos lanzando a varias regiones de manera gradual.

Acerca de los autores

Dr. Raju Penmatcha es un arquitecto de soluciones especializado en IA/ML en plataformas de IA en AWS. Trabaja en el conjunto de servicios de código bajo/sin código en SageMaker que ayuda a los clientes a crear e implementar fácilmente modelos y soluciones de aprendizaje automático. Cuando no está ayudando a los clientes, le gusta viajar a nuevos lugares.

manan shah es gerente de desarrollo de software en Amazon Web Services. Es un entusiasta de ML y se centra en la creación de productos AI/ML sin código/de código bajo. Se esfuerza por empoderar a otras personas técnicas talentosas para que construyan un gran software.

Sello de tiempo: 31 de Octubre de 20221 de noviembre.

Sello de tiempo: 6 de junio de 2023

Resuelva problemas comerciales de principio a fin mediante el aprendizaje automático en las soluciones JumpStart de Amazon SageMaker

Reeditado por Platón

Resumen de la solución

Requisitos previos

Optimización de precios

Predicción de especies de aves

Predicción de supervivencia del cáncer de pulmón

Clasificación de pagos financieros

Predicción de abandono para clientes de telefonía móvil

Limpiar recursos

Resumen

Acerca de los autores

Mas de Aprendizaje automático de AWS

Utilice el CDK de AWS para implementar configuraciones de ciclo de vida de Amazon SageMaker Studio | Servicios web de Amazon

Los pronósticos semanales ahora pueden comenzar el domingo con Amazon Forecast

Amazon SageMaker Automatic Model Tuning ahora proporciona un ajuste de hiperparámetros hasta tres veces más rápido con Hyperband

Acelere el tiempo de obtención de información empresarial con la conexión directa de Amazon SageMaker Data Wrangler a Snowflake | Servicios web de Amazon

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Servicios web de Amazon

Obtenga resultados de búsqueda más inteligentes con el ranking inteligente de Amazon Kendra y el complemento OpenSearch

Detección de fraude en tiempo real mediante los servicios de aprendizaje automático y sin servidor de AWS

Mejora de la estabilidad y flexibilidad de las canalizaciones de ML en Amazon Packaging Innovation con Amazon SageMaker Pipelines

Cree conjuntos de datos listos para el aprendizaje automático desde la tienda de funciones sin conexión de Amazon SageMaker con el SDK de Python de Amazon SageMaker | Servicios web de Amazon

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta