Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Servicios web de Amazon

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Servicios web de Amazon

La capacidad de crear e implementar rápidamente modelos de aprendizaje automático (ML) es cada vez más importante en el mundo actual basado en datos. Sin embargo, crear modelos de ML requiere mucho tiempo, esfuerzo y experiencia especializada. Desde la recopilación y limpieza de datos hasta la ingeniería de funciones, la creación de modelos, el ajuste y la implementación, los desarrolladores suelen tardar meses en completar los proyectos de aprendizaje automático. Y puede resultar difícil encontrar científicos de datos experimentados.

Aquí es donde el conjunto de servicios de aprendizaje automático sin código y con poco código de AWS se convierte en una herramienta esencial. Con sólo unos pocos clics usando Lienzo de Amazon SageMaker, puede aprovechar el poder del ML sin necesidad de escribir ningún código.

Como integrador de sistemas estratégicos con profunda experiencia en ML, Deloitte utiliza las herramientas de ML sin código y con poco código de AWS para construir e implementar de manera eficiente modelos de ML para los clientes de Deloitte y para los activos internos. Estas herramientas permiten a Deloitte desarrollar soluciones de aprendizaje automático sin necesidad de codificar manualmente modelos y canalizaciones. Esto puede ayudar a acelerar los plazos de entrega de proyectos y permitir que Deloitte asuma más trabajo para los clientes.

Las siguientes son algunas razones específicas por las que Deloitte utiliza estas herramientas:

  • Accesibilidad para no programadores – Las herramientas sin código abren la creación de modelos de aprendizaje automático a personas que no son programadores. Los miembros del equipo con solo experiencia en el dominio y muy pocas habilidades de codificación pueden desarrollar modelos de ML.
  • Rápida adopción de nuevas tecnologías. – La disponibilidad y la mejora constante de los modelos listos para usar y AutoML ayudan a garantizar que los usuarios utilicen constantemente tecnología de primera clase.
  • Desarrollo rentable – Las herramientas sin código ayudan a reducir el costo y el tiempo necesarios para el desarrollo del modelo de aprendizaje automático, haciéndolo más accesible para los clientes, lo que puede ayudarlos a lograr un mayor retorno de la inversión.

Además, estas herramientas brindan una solución integral para flujos de trabajo más rápidos, lo que permite lo siguiente:

  • Preparación de datos más rápida – SageMaker Canvas tiene más de 300 transformaciones integradas y la capacidad de utilizar lenguaje natural que puede acelerar la preparación de datos y prepararlos para la creación de modelos.
  • Construcción de modelos más rápida – SageMaker Canvas ofrece modelos listos para usar o AmazonAutoML tecnología que le permite crear modelos personalizados a partir de datos empresariales con solo unos pocos clics. Esto ayuda a acelerar el proceso en comparación con los modelos de codificación desde cero.
  • Implementación más sencilla – SageMaker Canvas ofrece la capacidad de implementar modelos listos para producción en un Amazon Sagmaker punto final con unos pocos clics y al mismo tiempo registrarlo en Registro de modelos de Amazon SageMaker.

Vishveshwara Vasa, CTO de nube para Deloitte, dice:

"A través de los servicios de aprendizaje automático sin código de AWS, como SageMaker Canvas y SageMaker Data Wrangler, en Deloitte Consulting hemos desbloqueado nuevas eficiencias, mejorando la velocidad de desarrollo y la productividad de implementación entre un 30% y un 40% en nuestros proyectos internos y de cara al cliente".

En esta publicación, demostramos el poder de crear un modelo de aprendizaje automático de extremo a extremo sin código utilizando SageMaker Canvas mostrándole cómo crear un modelo de clasificación para predecir si un cliente no pagará un préstamo. Al predecir los incumplimientos de los préstamos con mayor precisión, el modelo puede ayudar a una empresa de servicios financieros a gestionar el riesgo, fijar el precio de los préstamos de manera adecuada, mejorar las operaciones, proporcionar servicios adicionales y obtener una ventaja competitiva. Demostramos cómo SageMaker Canvas puede ayudarle a pasar rápidamente de datos sin procesar a un modelo de clasificación binaria implementado para la predicción de incumplimiento de préstamos.

SageMaker Canvas ofrece capacidades integrales de preparación de datos impulsadas por Wrangler de datos de Amazon SageMaker en el espacio de trabajo de SageMaker Canvas. Esto le permite pasar por todas las fases de un flujo de trabajo de aprendizaje automático estándar, desde la preparación de datos hasta la creación e implementación de modelos, en una única plataforma.

La preparación de datos suele ser la fase que requiere más tiempo del flujo de trabajo de ML. Para reducir el tiempo dedicado a la preparación de datos, SageMaker Canvas le permite preparar sus datos utilizando más de 300 transformaciones integradas. Alternativamente, puedes escribir indicaciones en lenguaje natural, como "eliminar las filas de la columna c que son valores atípicos" y se le presentará el fragmento de código necesario para este paso de preparación de datos. Luego puede agregar esto a su flujo de trabajo de preparación de datos con unos pocos clics. También te mostramos cómo usarlo en esta publicación.

Resumen de la solución

El siguiente diagrama describe la arquitectura de un modelo de clasificación de incumplimiento de préstamos utilizando herramientas de código bajo y sin código de SageMaker.

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Comenzando con un conjunto de datos que tiene detalles sobre los datos de incumplimiento de préstamos en Servicio de almacenamiento simple de Amazon (Amazon S3), utilizamos SageMaker Canvas para obtener información sobre los datos. Luego realizamos ingeniería de características para aplicar transformaciones como codificar características categóricas, eliminar características que no son necesarias y más. A continuación, almacenamos los datos limpios en Amazon S3. Utilizamos el conjunto de datos limpio para crear un modelo de clasificación para predecir los incumplimientos de los préstamos. Entonces tenemos un modelo listo para producción para inferencia.

Requisitos previos

Asegúrese de que lo siguiente requisitos previos están completos y que has habilitado el Lienzos Modelos listos para usar opción al configurar el dominio de SageMaker. Si ya has configurado tu dominio, editar la configuración de tu dominio e ir a Configuración del lienzo para habilitar el Habilitar modelos Canvas listos para usar opción. Además, configurar y crear la aplicación SageMaker Canvas, luego solicitar y habilitar Acceso al modelo Antrópico Claude on lecho rocoso del amazonas.

Conjunto de datos

Utilizamos un conjunto de datos públicos de Kaggle que contiene información sobre préstamos financieros. Cada fila del conjunto de datos representa un único préstamo y las columnas proporcionan detalles sobre cada transacción. Descargue este conjunto de datos y guárdelo en un depósito S3 de su elección. La siguiente tabla enumera los campos del conjunto de datos.

Nombre de columna Tipo de datos Descripción
Person_age Entero Edad de la persona que tomó el préstamo
Person_income Entero Ingresos del prestatario
Person_home_ownership Cordón Estado de propiedad de la vivienda (propia o alquilada)
Person_emp_length Decimal Número de años que están empleados
Loan_intent Cordón Motivo del préstamo (personal, médico, educativo, etc.)
Loan_grade Cordón Grado de préstamo (A – E)
Loan_int_rate Decimal APR
Loan_amnt Entero Importe total del préstamo
Loan_status Entero Objetivo (ya sea que hayan incumplido o no)
Loan_percent_income Decimal Monto del préstamo comparado con el porcentaje de los ingresos.
Cb_person_default_on_file Entero Valores predeterminados anteriores (si los hay)
Cb_person_credit_history_length Cordón Duración de su historial crediticio.

Simplifique la preparación de datos con SageMaker Canvas

La preparación de datos puede requerir hasta el 80% del esfuerzo en proyectos de ML. La preparación adecuada de los datos conduce a un mejor rendimiento del modelo y predicciones más precisas. SageMaker Canvas permite la exploración, transformación y preparación interactiva de datos sin escribir ningún código SQL o Python.

Complete los siguientes pasos para preparar sus datos:

  1. En la consola de SageMaker Canvas, seleccione Preparación de datos en el panel de navegación.
  2. En Crear menú, seleccione Documento.
  3. Nombre del conjunto de datos, ingrese un nombre para su conjunto de datos.
  4. Elige Crear.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
  5. Elija Amazon S3 como fuente de datos y conéctelo al conjunto de datos.
  6. Una vez cargado el conjunto de datos, cree un flujo de datos utilizando ese conjunto de datos.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
  7. Cambie a la pestaña de análisis y cree un Informe de información y calidad de datos.

Este es un paso recomendado para analizar la calidad del conjunto de datos de entrada. El resultado de este informe produce información instantánea basada en ML, como datos sesgados, duplicados en los datos, valores faltantes y mucho más. La siguiente captura de pantalla muestra una muestra del informe generado para el conjunto de datos del préstamo.

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Al generar estos conocimientos en su nombre, SageMaker Canvas le proporciona un conjunto de problemas en los datos que necesitan solución en la fase de preparación de datos. Para elegir los dos problemas principales identificados por SageMaker Canvas, debe codificar las características categóricas y eliminar las filas duplicadas para que la calidad del modelo sea alta. Puede hacer ambas cosas y más en un flujo de trabajo visual con SageMaker Canvas.

  1. Primero, codifique en caliente el loan_intent, loan_gradey person_home_ownership
  2. Puedes soltar el cb_person_cred_history_length columna porque esa columna tiene el menor poder de predicción, como se muestra en el Informe de información y calidad de los datos.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
    SageMaker Canvas agregó recientemente un Chatear con datos opción. Esta característica utiliza el poder de los modelos básicos para interpretar consultas en lenguaje natural y generar código basado en Python para aplicar transformaciones de ingeniería de características. Esta característica funciona con Amazon Bedrock y se puede configurar para que se ejecute completamente en su VPC, de modo que los datos nunca abandonen su entorno.
  3. Para utilizar esta función para eliminar filas duplicadas, elija el signo más junto al Columna de caída transformar, luego elegir Chatear con datos.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
  4. Ingrese su consulta en lenguaje natural (por ejemplo, "Eliminar filas duplicadas del conjunto de datos").
  5. Revise la transformación generada y elija Añadir a pasos para agregar la transformación al flujo.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
  6. Finalmente, exporte el resultado de estas transformaciones a Amazon S3 u opcionalmente Tienda de funciones de Amazon SageMaker para utilizar estas funciones en múltiples proyectos.

También puede agregar otro paso para crear un destino de Amazon S3 para el conjunto de datos a fin de escalar el flujo de trabajo para un conjunto de datos grande. El siguiente diagrama muestra el flujo de datos de SageMaker Canvas después de agregar transformaciones visuales.

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Ha completado todo el paso de ingeniería de funciones y procesamiento de datos utilizando flujos de trabajo visuales en SageMaker Canvas. Esto ayuda a reducir de semanas a días el tiempo que un ingeniero de datos dedica a limpiar y preparar los datos para el desarrollo del modelo. El siguiente paso es construir el modelo ML.

Construya un modelo con SageMaker Canvas

Amazon SageMaker Canvas proporciona un flujo de trabajo de un extremo a otro sin código para crear, analizar, probar e implementar este modelo de clasificación binaria. Complete los siguientes pasos:

  1. Cree un conjunto de datos en SageMaker Canvas.
  2. Especifique la ubicación de S3 que se utilizó para exportar los datos o la ubicación de S3 que se encuentra en el destino del trabajo de SageMaker Canvas.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
    Ahora estás listo para construir el modelo.
  3. Elige fexibles en el panel de navegación y seleccione Nuevo modelo.
  4. Nombra el modelo y selecciona Análisis predictivo como el tipo de modelo.
  5. Elija el conjunto de datos creado en el paso anterior.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
    El siguiente paso es configurar el tipo de modelo.
  6. Elija la columna de destino y el tipo de modelo se establecerá automáticamente como predicción de 2 categorías.
  7. Elija su tipo de construcción, Construcción estándar or Construcción rápida.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
    SageMaker Canvas muestra el tiempo de construcción esperado tan pronto como comience a construir el modelo. La construcción estándar suele tardar entre 2 y 4 horas; puede utilizar la opción de compilación rápida para conjuntos de datos más pequeños, que solo demora entre 2 y 15 minutos. Para este conjunto de datos en particular, debería tomar alrededor de 45 minutos completar la construcción del modelo. SageMaker Canvas lo mantiene informado sobre el progreso del proceso de construcción.
  8. Una vez creado el modelo, puede observar el rendimiento del modelo.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
    SageMaker Canvas proporciona varias métricas como exactitud, precisión y puntuación F1 según el tipo de modelo. La siguiente captura de pantalla muestra la precisión y algunas otras métricas avanzadas de este modelo de clasificación binaria.
  9. El siguiente paso es hacer predicciones de prueba.
    SageMaker Canvas le permite realizar predicciones por lotes en múltiples entradas o una sola predicción para verificar rápidamente la calidad del modelo. La siguiente captura de pantalla muestra una inferencia de ejemplo.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.
  10. El último paso es implementar el modelo entrenado.
    SageMaker Canvas implementa el modelo en los puntos finales de SageMaker y ahora tiene un modelo de producción listo para la inferencia. La siguiente captura de pantalla muestra el punto final implementado.
    Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Una vez implementado el modelo, puede llamarlo a través del SDK de AWS o Interfaz de línea de comandos de AWS (AWS CLI) o realice llamadas API a cualquier aplicación de su elección para predecir con confianza el riesgo de un prestatario potencial. Para obtener más información sobre cómo probar su modelo, consulte Invocar puntos finales en tiempo real.

Limpiar

Para evitar incurrir en cargos adicionales, cerrar sesión en SageMaker Canvas or eliminar el dominio de SageMaker que fue creado. Además, eliminar el punto final del modelo de SageMaker y eliminar el conjunto de datos que se cargó en Amazon S3.

Conclusión

El aprendizaje automático sin código acelera el desarrollo, simplifica la implementación, no requiere habilidades de programación, aumenta la estandarización y reduce los costos. Estos beneficios hicieron que el ML sin código fuera atractivo para Deloitte para mejorar sus ofertas de servicios de ML, y han acortado los plazos de creación de su modelo de ML entre un 30% y un 40%.

Deloitte es un integrador de sistemas global estratégico con más de 17,000 profesionales certificados de AWS en todo el mundo. Continúa elevando el listón mediante la participación en el programa de competencias de AWS con 25 competencias, incluido Machine Learning. Conéctate con Deloitte para comenzar a utilizar las soluciones de código bajo y sin código de AWS para su empresa.


Sobre los autores

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.Chida Sadayappan lidera la práctica de Cloud AI/Machine Learning de Deloitte. Aporta una sólida experiencia en liderazgo intelectual a los compromisos y se destaca al ayudar a los ejecutivos interesados ​​a lograr objetivos de mejora del rendimiento y modernización en todas las industrias que utilizan AI/ML. Chida es un emprendedor tecnológico en serie y un ávido creador de comunidades en los ecosistemas de startups y desarrolladores.

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.Kuldeep Singh, líder global principal de IA/ML en AWS con más de 20 años en tecnología, combina hábilmente su experiencia en ventas y emprendimiento con un profundo conocimiento de IA, ML y ciberseguridad. Se destaca en forjar asociaciones globales estratégicas, impulsando soluciones y estrategias transformadoras en diversas industrias con un enfoque en IA generativa y GSI.

Impulsar la productividad de los desarrolladores: cómo Deloitte utiliza Amazon SageMaker Canvas para el aprendizaje automático sin código o con poco código | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.kasimuthu es un arquitecto de soluciones socio senior que se centra en datos e IA/ML en AWS con sede en Houston, TX. Le apasiona ayudar a los socios y clientes a acelerar su viaje de datos a la nube. Es un asesor confiable en este campo y tiene mucha experiencia diseñando y creando cargas de trabajo escalables, resilientes y de alto rendimiento en la nube. Fuera del trabajo, le gusta pasar tiempo con su familia.

Sello de tiempo:

Mas de Aprendizaje automático de AWS