Stimuler la productivité des développeurs : comment Deloitte utilise Amazon SageMaker Canvas pour l'apprentissage automatique sans code/low code

Republié par Platon

Suiveurs: 0

La capacité de créer et de déployer rapidement des modèles d'apprentissage automatique (ML) devient de plus en plus importante dans le monde actuel axé sur les données. Cependant, la création de modèles ML nécessite beaucoup de temps, d’efforts et d’expertise spécialisée. De la collecte et du nettoyage des données à l'ingénierie des fonctionnalités, en passant par la création de modèles, le réglage et le déploiement, les projets de ML prennent souvent des mois aux développeurs. Et il peut être difficile de trouver des data scientists expérimentés.

C'est là que la suite AWS de services ML low-code et no-code devient un outil essentiel. En quelques clics en utilisant Toile Amazon SageMaker, vous pouvez profiter de la puissance du ML sans avoir besoin d’écrire de code.

En tant qu'intégrateur de systèmes stratégiques possédant une expérience approfondie du ML, Deloitte utilise les outils de ML sans code et à faible code d'AWS pour créer et déployer efficacement des modèles de ML pour les clients de Deloitte et pour les actifs internes. Ces outils permettent à Deloitte de développer des solutions ML sans avoir besoin de coder manuellement les modèles et les pipelines. Cela peut contribuer à accélérer les délais de livraison des projets et permettre à Deloitte d’assumer davantage de travail avec ses clients.

Voici quelques raisons spécifiques pour lesquelles Deloitte utilise ces outils :

Accessibilité pour les non-programmeurs – Les outils sans code ouvrent la création de modèles ML aux non-programmeurs. Les membres de l'équipe possédant uniquement une expertise dans le domaine et très peu de compétences en codage peuvent développer des modèles ML.
Adoption rapide des nouvelles technologies – La disponibilité et l'amélioration constante des modèles prêts à l'emploi et d'AutoML permettent de garantir que les utilisateurs utilisent constamment une technologie de pointe.
Développement rentable – Les outils sans code contribuent à réduire le coût et le temps nécessaires au développement du modèle ML, le rendant plus accessible aux clients, ce qui peut les aider à obtenir un retour sur investissement plus élevé.

De plus, ces outils fournissent une solution complète pour des flux de travail plus rapides, permettant les éléments suivants :

Préparation des données plus rapide – SageMaker Canvas possède plus de 300 transformations intégrées et la possibilité d'utiliser un langage naturel qui peut accélérer la préparation des données et les préparer pour la création de modèles.
Création de modèles plus rapide – SageMaker Canvas propose des modèles prêts à l’emploi ou Amazon AutoML une technologie qui vous permet de créer des modèles personnalisés sur les données d'entreprise en quelques clics seulement. Cela permet d’accélérer le processus par rapport aux modèles de codage à partir de zéro.
Déploiement plus facile – SageMaker Canvas offre la possibilité de déployer des modèles prêts pour la production sur un Amazon Sagmaker point final en quelques clics tout en l'enregistrant dans Registre de modèles Amazon SageMaker.

Vishveshwara Vasa, CTO Cloud pour Deloitte, dit:

« Grâce aux services ML sans code d'AWS tels que SageMaker Canvas et SageMaker Data Wrangler, nous, chez Deloitte Consulting, avons débloqué de nouvelles efficacités, améliorant la vitesse de développement et la productivité du déploiement de 30 à 40 % sur nos projets internes et destinés aux clients. »

Dans cet article, nous démontrons la puissance de la création d'un modèle ML de bout en bout sans code à l'aide de SageMaker Canvas en vous montrant comment créer un modèle de classification pour prédire si un client fera défaut sur un prêt. En prédisant plus précisément les défauts de paiement, le modèle peut aider une société de services financiers à gérer les risques, à tarifer les prêts de manière appropriée, à améliorer ses opérations, à fournir des services supplémentaires et à acquérir un avantage concurrentiel. Nous montrons comment SageMaker Canvas peut vous aider à passer rapidement de données brutes à un modèle de classification binaire déployé pour la prédiction des défauts de paiement.

SageMaker Canvas offre des fonctionnalités complètes de préparation de données optimisées par Gestionnaire de données Amazon SageMaker dans l'espace de travail SageMaker Canvas. Cela vous permet de parcourir toutes les phases d'un flux de travail ML standard, de la préparation des données à la création et au déploiement de modèles, sur une seule plateforme.

La préparation des données est généralement la phase la plus longue du flux de travail ML. Pour réduire le temps consacré à la préparation des données, SageMaker Canvas vous permet de préparer vos données à l'aide de plus de 300 transformations intégrées. Alternativement, vous pouvez écrire des invites en langage naturel, comme « supprimez les lignes de la colonne c qui sont des valeurs aberrantes » et recevez l'extrait de code nécessaire à cette étape de préparation des données. Vous pouvez ensuite l'ajouter à votre workflow de préparation de données en quelques clics. Nous vous montrons également comment l’utiliser dans cet article.

Vue d'ensemble de la solution

Le diagramme suivant décrit l'architecture d'un modèle de classification des prêts par défaut à l'aide des outils low-code et no-code de SageMaker.

Augmenter la productivité des développeurs : comment Deloitte utilise Amazon SageMaker Canvas pour l'apprentissage automatique sans code/low code | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

En commençant par un ensemble de données contenant des détails sur les données sur les défauts de paiement dans Service de stockage simple Amazon (Amazon S3), nous utilisons SageMaker Canvas pour obtenir des informations sur les données. Nous effectuons ensuite l'ingénierie des fonctionnalités pour appliquer des transformations telles que l'encodage des fonctionnalités catégorielles, la suppression des fonctionnalités inutiles, etc. Ensuite, nous stockons les données nettoyées dans Amazon S3. Nous utilisons l'ensemble de données nettoyé pour créer un modèle de classification permettant de prédire les défauts de paiement des prêts. Nous disposons ensuite d’un modèle d’inférence prêt pour la production.

Pré-requis

Assurez-vous que les éléments suivants conditions préalables sont terminés et que vous avez activé le Modèles Canvas prêts à l'emploi option lors de la configuration du domaine SageMaker. Si vous avez déjà configuré votre domaine, modifier les paramètres de votre domaine et aller à Paramètres du canevas pour activer le Activer les modèles Canvas prêts à l’emploi option. De plus, configurez et créer l'application SageMaker Canvas, puis demandez et activez Accès au modèle Anthropic Claude on Socle amazonien.

Ensemble de données

Nous utilisons un ensemble de données publiques de kaggle qui contient des informations sur les prêts financiers. Chaque ligne de l'ensemble de données représente un prêt unique et les colonnes fournissent des détails sur chaque transaction. Téléchargez cet ensemble de données et stockez-le dans un compartiment S3 de votre choix. Le tableau suivant répertorie les champs de l'ensemble de données.

Nom de colonne	Type de données	Description
`Person_age`	Entier	Âge de la personne qui a contracté un prêt
`Person_income`	Entier	Revenu de l'emprunteur
`Person_home_ownership`	Chaîne	Statut de propriétaire (propriétaire ou locataire)
`Person_emp_length`	Décimal	Nombre d'années pendant lesquelles ils sont employés
`Loan_intent`	Chaîne	Raison du prêt (personnel, médical, éducatif, etc.)
`Loan_grade`	Chaîne	Catégorie du prêt (A à E)
`Loan_int_rate`	Décimal	Taux d'intérêt
`Loan_amnt`	Entier	Montant total du prêt
`Loan_status`	Entier	Cible (qu'ils aient fait défaut ou non)
`Loan_percent_income`	Décimal	Montant du prêt par rapport au pourcentage du revenu
`Cb_person_default_on_file`	Entier	Valeurs par défaut précédentes (le cas échéant)
`Cb_person_credit_history_length`	Chaîne	Durée de leur historique de crédit

Simplifiez la préparation des données avec SageMaker Canvas

La préparation des données peut prendre jusqu'à 80 % de l'effort dans les projets ML. Une bonne préparation des données conduit à de meilleures performances du modèle et à des prédictions plus précises. SageMaker Canvas permet l'exploration, la transformation et la préparation interactives des données sans écrire de code SQL ou Python.

Effectuez les étapes suivantes pour préparer vos données :

Sur la console SageMaker Canvas, choisissez Préparation des données dans le volet de navigation.
Sur le Création menu, choisissez Documents.
Pour Nom du jeu de données, entrez un nom pour votre ensemble de données.
Selectionnez Création.
Choisissez Amazon S3 comme source de données et connectez-le à l'ensemble de données.
Une fois l'ensemble de données chargé, créez un flux de données à l'aide de cet ensemble de données.
Passez à l'onglet analyses et créez un Rapport sur la qualité des données et les informations.

Il s'agit d'une étape recommandée pour analyser la qualité de l'ensemble de données d'entrée. Le résultat de ce rapport produit des informations instantanées basées sur le ML, telles que l'asymétrie des données, les doublons dans les données, les valeurs manquantes et bien plus encore. La capture d'écran suivante montre un exemple du rapport généré pour l'ensemble de données de prêt.

En générant ces informations en votre nom, SageMaker Canvas vous fournit un ensemble de problèmes dans les données qui nécessitent une correction lors de la phase de préparation des données. Pour sélectionner les deux principaux problèmes identifiés par SageMaker Canvas, vous devez encoder les caractéristiques catégorielles et supprimer les lignes en double afin que la qualité de votre modèle soit élevée. Vous pouvez faire ces deux choses et bien plus encore dans un flux de travail visuel avec SageMaker Canvas.

Tout d'abord, encodez à chaud le loan_intent, loan_gradeet une person_home_ownership
Vous pouvez laisser tomber le cb_person_cred_history_length car cette colonne a le pouvoir de prédiction le plus faible, comme indiqué dans le rapport Data Quality and Insights.

SageMaker Canvas a récemment ajouté un Discutez avec des données option. Cette fonctionnalité utilise la puissance des modèles de base pour interpréter les requêtes en langage naturel et générer du code basé sur Python pour appliquer des transformations d'ingénierie de fonctionnalités. Cette fonctionnalité est optimisée par Amazon Bedrock et peut être configurée pour s'exécuter entièrement dans votre VPC afin que les données ne quittent jamais votre environnement.
Pour utiliser cette fonctionnalité afin de supprimer les lignes en double, choisissez le signe plus à côté du Déposer la colonne transformer, puis choisir Discutez avec des données.
Saisissez votre requête en langage naturel (par exemple, « Supprimer les lignes en double de l'ensemble de données »).
Passez en revue la transformation générée et choisissez Ajouter aux étapes pour ajouter la transformation au flux.
Enfin, exportez le résultat de ces transformations vers Amazon S3 ou éventuellement Magasin de fonctionnalités Amazon SageMaker pour utiliser ces fonctionnalités sur plusieurs projets.

Vous pouvez également ajouter une autre étape pour créer une destination Amazon S3 pour l'ensemble de données afin de faire évoluer le flux de travail pour un ensemble de données volumineux. Le diagramme suivant montre le flux de données SageMaker Canvas après l'ajout de transformations visuelles.

Vous avez terminé toute l'étape de traitement des données et d'ingénierie des fonctionnalités à l'aide de flux de travail visuels dans SageMaker Canvas. Cela permet de réduire de quelques semaines à quelques jours le temps qu'un ingénieur de données consacre au nettoyage et à la préparation des données pour le développement du modèle. L'étape suivante consiste à créer le modèle ML.

Construire un modèle avec SageMaker Canvas

Amazon SageMaker Canvas fournit un flux de travail de bout en bout sans code pour créer, analyser, tester et déployer ce modèle de classification binaire. Effectuez les étapes suivantes :

Créez un ensemble de données dans SageMaker Canvas.
Spécifiez soit l'emplacement S3 qui a été utilisé pour exporter les données, soit l'emplacement S3 qui se trouve sur la destination de la tâche SageMaker Canvas.

Vous êtes maintenant prêt à créer le modèle.
Selectionnez Des modèles photo dans le volet de navigation et choisissez Nouveau modèle.
Nommez le modèle et sélectionnez Analyse prédictive comme type de modèle.
Choisissez l'ensemble de données créé à l'étape précédente.

L'étape suivante consiste à configurer le type de modèle.
Choisissez la colonne cible et le type de modèle sera automatiquement défini comme Prédiction à 2 catégories.
Choisissez votre type de build, Construction standard or Construction rapide.

SageMaker Canvas affiche le temps de construction prévu dès que vous commencez à créer le modèle. La construction standard prend généralement entre 2 et 4 heures ; vous pouvez utiliser l'option de création rapide pour des ensembles de données plus petits, ce qui ne prend que 2 à 15 minutes. Pour cet ensemble de données particulier, la création du modèle devrait prendre environ 45 minutes. SageMaker Canvas vous tient informé de la progression du processus de construction.
Une fois le modèle construit, vous pouvez examiner ses performances.

SageMaker Canvas fournit diverses mesures telles que l'exactitude, la précision et le score F1 en fonction du type de modèle. La capture d'écran suivante montre la précision et quelques autres mesures avancées pour ce modèle de classification binaire.
L'étape suivante consiste à faire des prédictions de test.
SageMaker Canvas vous permet de faire des prédictions par lots sur plusieurs entrées ou une seule prédiction pour vérifier rapidement la qualité du modèle. La capture d'écran suivante montre un exemple d'inférence.
La dernière étape consiste à déployer le modèle formé.
SageMaker Canvas déploie le modèle sur les points de terminaison SageMaker et vous disposez désormais d'un modèle de production prêt pour l'inférence. La capture d'écran suivante montre le point de terminaison déployé.

Une fois le modèle déployé, vous pouvez l'appeler via le kit AWS SDK ou Interface de ligne de commande AWS (AWS CLI) ou effectuez des appels API vers n'importe quelle application de votre choix pour prédire en toute confiance le risque d'un emprunteur potentiel. Pour plus d'informations sur le test de votre modèle, reportez-vous à Invoquer des points de terminaison en temps réel.

Nettoyer

Pour éviter d'encourir des frais supplémentaires, déconnectez-vous de SageMaker Canvas or supprimer le domaine SageMaker qui a été créé. En plus, supprimer le point de terminaison du modèle SageMaker ainsi que supprimer l'ensemble de données qui a été téléchargé sur Amazon S3.

Conclusion

Le ML sans code accélère le développement, simplifie le déploiement, ne nécessite pas de compétences en programmation, augmente la standardisation et réduit les coûts. Ces avantages ont rendu le ML sans code attrayant pour Deloitte pour améliorer ses offres de services ML, et ils ont raccourci les délais de création de leur modèle ML de 30 à 40 %.

Deloitte est un intégrateur de systèmes stratégique mondial comptant plus de 17,000 XNUMX praticiens AWS certifiés à travers le monde. Il continue de relever la barre en participant au programme de compétences AWS avec 25 compétences, dont le Machine Learning. Connectez-vous avec Deloitte pour commencer à utiliser les solutions AWS no-code et low-code dans votre entreprise.

À propos des auteurs

Chida Sadayappan dirige la pratique Cloud AI/Machine Learning de Deloitte. Il apporte une solide expérience de leadership éclairé aux engagements et s'épanouit en aidant les dirigeants à atteindre leurs objectifs d'amélioration des performances et de modernisation dans tous les secteurs en utilisant l'IA/ML. Chida est un entrepreneur technologique en série et un fervent bâtisseur de communauté dans les écosystèmes de startups et de développeurs.

Kuldeep Singh, l'un des principaux leaders mondiaux de l'IA/ML chez AWS avec plus de 20 ans d'expérience dans la technologie, combine habilement son expertise en vente et en entrepreneuriat avec une compréhension approfondie de l'IA, du ML et de la cybersécurité. Il excelle dans la création de partenariats stratégiques mondiaux, dans la conduite de solutions et de stratégies de transformation dans divers secteurs, en mettant l'accent sur l'IA générative et les GSI.

Kasi Muthu est un architecte de solutions partenaire senior axé sur les données et l'IA/ML chez AWS basé à Houston, Texas. Il se passionne pour aider les partenaires et les clients à accélérer leur parcours de données cloud. Il est un conseiller de confiance dans ce domaine et possède une vaste expérience en matière d'architecture et de création de charges de travail évolutives, résilientes et performantes dans le cloud. En dehors du travail, il aime passer du temps avec sa famille.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/boosting-developer-productivity-how-deloitte-uses-amazon-sagemaker-canvas-for-no-code-low-code-machine-learning/

Horodatage: 1 décembre 2023

Horodatage: Le 31 octobre 2022

Augmenter la productivité des développeurs : comment Deloitte utilise Amazon SageMaker Canvas pour l'apprentissage automatique sans code/low code | Services Web Amazon

Republié par Platon

Vue d'ensemble de la solution

Pré-requis

Ensemble de données

Simplifiez la préparation des données avec SageMaker Canvas

Construire un modèle avec SageMaker Canvas

Nettoyer

Conclusion

À propos des auteurs

Plus de Apprentissage automatique AWS

Utiliser AWS CDK pour déployer les configurations de cycle de vie d'Amazon SageMaker Studio | Services Web Amazon

Métriques pour évaluer la modération de contenu dans Amazon Rekognition et d'autres services de modération de contenu

Détectez les transactions frauduleuses à l'aide de l'apprentissage automatique avec Amazon SageMaker

Recherchez en toute sécurité des données non structurées sur les systèmes de fichiers Windows avec le connecteur Amazon Kendra pour Amazon FSx pour Windows File Server

AWS Panorama prend désormais en charge NVIDIA JetPack SDK 4.6.2

Mettez en surbrillance le texte pendant qu'il est prononcé à l'aide d'Amazon Polly | Services Web Amazon

Automatisez et implémentez le contrôle de version pour les FAQ d'Amazon Kendra

Prise en charge d'un nouveau format de données étendu dans Amazon Kendra

Inférence ML rentable avec des modèles multi-framework sur Amazon SageMaker

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte