Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart

Amazon SageMaker JumpStart fournit des modèles open source pré-entraînés pour un large éventail de types de problèmes afin de vous aider à démarrer avec l'apprentissage automatique (ML). JumpStart fournit également des modèles de solution qui configurent l'infrastructure pour les cas d'utilisation courants, ainsi que des exemples de blocs-notes exécutables pour le ML avec Amazon Sage Maker.

En tant qu'utilisateur professionnel, vous pouvez effectuer les opérations suivantes avec les solutions JumpStart :

  • Explorez les solutions et évaluez celles qui correspondent le mieux aux besoins de votre entreprise.
  • Lancez des solutions en un seul clic Amazon SageMakerStudio. Cela lance un AWS CloudFormation modèle pour créer les ressources requises.
  • Modifiez la solution pour répondre à vos besoins en accédant aux ressources de notebook et de modèle sous-jacentes.
  • Supprimez les ressources acquises une fois terminé.

Cet article se concentre sur les cinq solutions ML récemment ajoutées pour relever cinq défis commerciaux différents. Au moment d'écrire ces lignes, JumpStart propose 23 solutions commerciales allant de la détection de fraude dans les transactions financières à la reconnaissance de l'écriture manuscrite. Le nombre de solutions proposées via JumpStart augmente régulièrement à mesure que de nouvelles solutions y sont ajoutées.

Vue d'ensemble de la solution

Les cinq nouvelles solutions sont les suivantes :

  • Optimisation des prix – Propose des modèles ML personnalisables pour vous aider à prendre des décisions optimales pour fixer le prix de votre produit ou service afin d'atteindre votre objectif commercial, comme la maximisation des revenus, des bénéfices ou d'autres mesures personnalisées.
  • Prédiction des espèces d’oiseaux – Montre comment vous pouvez entraîner et affiner un modèle de détection d’objets. Il démontre le réglage du modèle grâce à l'augmentation de l'image de formation et montre les améliorations de précision qui se produisent au fil des itérations (époques) de la tâche de formation.
  • Prédiction de survie au cancer du poumon – Montre comment vous pouvez transmettre des caractéristiques radiomiques 2D et 3D et des données démographiques sur un patient à un algorithme ML pour prédire les chances de survie d'un patient atteint d'un cancer du poumon. Les résultats de cette prédiction peuvent aider les prestataires à prendre les mesures proactives appropriées.
  • Classification des paiements financiers – Montre comment entraîner et déployer un modèle ML pour classer les transactions financières en fonction des informations sur les transactions. Vous pouvez également utiliser cette solution comme étape intermédiaire dans la détection de fraudes, de personnalisation ou de détection d’anomalies.
  • Prédiction du taux de désabonnement pour les clients de téléphonie mobile – Montre comment développer rapidement un modèle de prédiction du désabonnement à l’aide d’un ensemble de données de transactions d’appels mobiles. Il s'agit d'un exemple simple pour les utilisateurs qui débutent dans le ML.

Pré-requis

Pour utiliser ces solutions, assurez-vous d'avoir accès à Studio avec un rôle d'exécution qui vous permet d'exécuter la fonctionnalité SageMaker. Pour votre rôle d'utilisateur dans Studio, assurez-vous que le Projets SageMaker et JumpStart l'option est activée.

Dans les sections suivantes, nous passons en revue chacune des cinq nouvelles solutions et discutons en détail de leur fonctionnement, ainsi que de quelques recommandations sur la manière dont vous pouvez les utiliser pour vos propres besoins professionnels.

Optimisation des prix

Les entreprises aiment utiliser différents leviers pour obtenir les meilleurs résultats. Par exemple, le prix d’un produit ou d’un service est un levier qu’une entreprise peut contrôler. La question est de savoir comment décider à quel prix fixer un produit ou un service, afin de maximiser un objectif commercial tel que le profit ou les revenus.

Cette solution fournit des modèles ML personnalisables pour vous aider à prendre des décisions optimales pour fixer le prix de votre produit ou service afin d'atteindre votre objectif, comme la maximisation des revenus, des bénéfices ou d'autres mesures personnalisées. La solution utilise des approches de ML et d'inférence causale pour apprendre les relations prix-volume à partir de données historiques, et est capable de faire des recommandations de prix dynamiques en temps réel pour optimiser les mesures objectives personnalisées.

La capture d'écran suivante montre les exemples de données d'entrée.

La solution comprend trois parties :

  • Estimation de l’élasticité-prix – Ceci est estimé par inférence causale via un algorithme double ML
  • Prévisions de volumes – Ceci est prévu à l’aide de l’algorithme Prophet
  • Optimisation des prix – Ceci est réalisé par une simulation de simulation à travers différents scénarios de prix

La solution fournit le prix recommandé pour le lendemain afin de maximiser les revenus. En outre, les résultats incluent l'élasticité-prix estimée, qui est une valeur indiquant l'effet du prix sur le volume, et un modèle de prévision, capable de prévoir le volume du jour suivant. Le graphique suivant montre comment un modèle causal intégrant l'élasticité-prix calculée fonctionne bien mieux dans une analyse de simulation (avec de grands écarts par rapport au comportement des prix) qu'un modèle prédictif qui utilise Prophet pour prévoir le volume à l'aide de données de séries chronologiques.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Vous pouvez appliquer cette solution à votre entreprise pour les cas d'utilisation suivants :

  • Déterminer le prix optimal des marchandises pour un magasin de détail
  • Estimer l'effet des bons de réduction sur les achats des clients
  • Prédire l'effet de diverses méthodes d'incitation dans toute entreprise

Prédiction des espèces d'oiseaux

Il existe aujourd’hui plusieurs applications de vision par ordinateur (CV) pour les entreprises. L'une de ces applications est la détection d'objets, où un algorithme ML détecte l'emplacement d'un objet dans une image en dessinant un cadre de délimitation autour de lui et identifie le type d'objet dont il s'agit. Apprendre à appliquer un modèle de détection d'objets et à l'affiner peut être d'une grande valeur pour une organisation qui a des besoins en CV.

Cette solution fournit un exemple de la manière de traduire les spécifications du cadre de délimitation lors de la fourniture d'images à l'algorithme SageMaker. Cette solution montre également comment améliorer un modèle de détection d'objets en ajoutant des images d'entraînement retournées horizontalement (images miroir).

Un cahier est fourni pour expérimenter les défis de détection d'objets lorsqu'il y a un grand nombre de classes (200 espèces d'oiseaux). Le cahier montre également comment tracer les améliorations de précision qui se produisent au fil des époques du travail de formation. L'image suivante montre des exemples d'images de l'ensemble de données sur les oiseaux.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Cette solution contient cinq étapes :

  1. Préparez les données, y compris le téléchargement et RecordIO génération de fichiers.
  2. Créez et entraînez un modèle de détection d'objets.
  3. Déployez un point de terminaison et évaluez les performances du modèle.
  4. Créez et entraînez à nouveau un modèle de détection d'objets avec l'ensemble de données étendu.
  5. Déployez un point de terminaison et évaluez les performances du modèle étendu.

Vous obtenez ce qui suit en sortie :

  • Résultats de détection d'objets avec des boîtes de liaison par rapport à votre image de test
  • Un modèle de détection d'objets entraînés
  • Un modèle de détection d'objets entraînés avec un ensemble de données étendu (inversé) supplémentaire
  • Deux points de terminaison distincts déployés avec un de chaque modèle

Le graphique suivant montre l'amélioration du modèle par rapport aux itérations (époques) du modèle pendant l'entraînement.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Les exemples suivants sont issus de deux images de test.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Vous pouvez appliquer cette solution à votre entreprise pour les cas d'utilisation suivants :

  • Détecter des objets sur un tapis roulant dans une industrie de l'emballage
  • Détecter les garnitures d'une pizza
  • Mettre en œuvre des applications opérationnelles de la chaîne d'approvisionnement qui impliquent la détection d'objets

Prédiction de la survie au cancer du poumon

La COVID-19 a attiré beaucoup plus d’attention sur les problèmes médicaux liés aux poumons. Cela a également mis beaucoup de pression sur les hôpitaux, les médecins, les infirmières et les radiologues. Imaginez une possibilité où vous pourriez appliquer le ML comme un outil puissant pour assister les médecins et les aider à accélérer leur travail. Dans cette solution, nous montrons comment les caractéristiques radiomiques 2D et 3D et les données démographiques des patients peuvent être intégrées à un algorithme ML pour prédire les chances de survie d'un patient au cancer du poumon. Les résultats de cette prédiction peuvent aider les prestataires à prendre des mesures proactives appropriées.

Cette solution montre comment créer un pipeline ML évolutif pour l'ensemble de données radiogénomiques sur le cancer du poumon non à petites cellules (NSCLC), qui comprend des données de séquençage d'ARN, des données cliniques (reflétant les données DSE) et des images médicales. L'utilisation de plusieurs types de données pour créer un modèle de machine est appelée multimodal ML. Cette solution prédit les résultats de survie des patients diagnostiqués avec un cancer du poumon non à petites cellules.

L'image suivante montre un exemple des données d'entrée de l'ensemble de données radiogénomiques sur le cancer du poumon non à petites cellules (NSCLC).

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Dans le cadre de la solution, l’ARN total a été extrait du tissu tumoral et analysé à l’aide de la technologie de séquençage de l’ARN. Bien que les données originales contiennent plus de 22,000 21 gènes, nous conservons 10 gènes provenant de XNUMX groupes de gènes hautement coexprimés (métagènes) qui ont été identifiés, validés dans des cohortes d'expression génique accessibles au public et corrélés au pronostic.

Les dossiers cliniques sont stockés au format CSV. Chaque ligne correspond à un patient et les colonnes contiennent des informations sur les patients, notamment les données démographiques, le stade de la tumeur et l'état de survie.

Pour les données génomiques, nous conservons 21 gènes provenant de 10 groupes de gènes hautement coexprimés (métagènes) qui ont été identifiés, validés dans des cohortes d'expression génique accessibles au public et corrélés au pronostic.

Pour les données d'imagerie médicale, nous créons des caractéristiques radiomiques 3D au niveau du patient qui expliquent la taille, la forme et les attributs visuels des tumeurs observées lors des tomodensitogrammes. Pour chaque étude de patient, les étapes suivantes sont effectuées :

  1. Lisez les fichiers de tranches DICOM 2D pour le scanner et la segmentation de la tumeur, combinez-les avec des volumes 3D, enregistrez les volumes au format NIfTI.
  2. Alignez le volume CT et la segmentation de la tumeur afin que nous puissions concentrer le calcul à l'intérieur de la tumeur.
  3. Calculez les caractéristiques radiomiques décrivant la région tumorale à l’aide de la bibliothèque pyradiomique.
  4. Extrayez 120 caractéristiques radiomiques de huit classes, telles que des représentations statistiques de la distribution et de la cooccurrence de l'intensité dans la région tumorale d'intérêt, ainsi que des mesures basées sur la forme décrivant la morphologie de la tumeur.

Pour créer une vue multimodale d'un patient pour la formation de modèles, nous joignons les vecteurs de caractéristiques de trois modalités. Nous traitons ensuite les données. Tout d’abord, nous normalisons la gamme de fonctionnalités indépendantes à l’aide de la mise à l’échelle des fonctionnalités. Ensuite, nous effectuons une analyse en composantes principales (ACP) sur les caractéristiques pour réduire la dimensionnalité et identifier les caractéristiques les plus discriminantes qui contribuent à 95 % de la variance des données.

Cela se traduit par une réduction de dimensionnalité de 215 caractéristiques jusqu'à 45 composantes principales, qui constituent des caractéristiques pour l'apprenant supervisé.

La solution produit un modèle ML qui prédit l’état de survie des patients NSCLC (morts ou vivants) sous forme de probabilité. Outre le modèle et la prédiction, nous générons également des rapports pour expliquer le modèle. Le pipeline d’imagerie médicale produit des volumes de tomodensitométrie pulmonaire 3D et une segmentation des tumeurs à des fins de visualisation.

Vous pouvez appliquer cette solution aux cas d’utilisation des soins de santé et des sciences de la vie.

Classification des paiements financiers

Prendre toutes les transactions financières d’une entreprise ou d’un consommateur et les organiser en différentes catégories peut être très utile. Il peut aider l'utilisateur à savoir combien il a dépensé dans quelle catégorie, et il peut également déclencher des alertes lorsque les transactions ou les dépenses dans une catégorie donnée augmentent ou diminuent de manière inattendue.

Cette solution montre comment former et déployer un modèle ML pour classer les transactions financières en fonction des informations sur les transactions. De nombreuses banques proposent ce service pour donner à leurs utilisateurs finaux un aperçu de leurs habitudes de dépenses. Vous pouvez également utiliser cette solution comme étape intermédiaire dans la détection de fraudes, de personnalisation ou de détection d’anomalies. Nous utilisons SageMaker pour former et déployer un modèle XGBoost avec l'infrastructure sous-jacente requise.

L'ensemble de données synthétiques que nous présentons pour démontrer cette solution présente les caractéristiques suivantes :

  • catégorie_transaction – La catégorie de la transaction, parmi les 19 options suivantes : Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Homeet une Pension and insurances.
  • receiver_id – Un identifiant pour le destinataire. L'identifiant est composé de 16 chiffres.
  • expéditeur_id – Un identifiant pour l’expéditeur. L'identifiant est composé de 16 chiffres.
  • montant – Le montant transféré.
  • horodatage – L'horodatage de la transaction au format AAAA-MM-JJ HH:MM:SS.

Les cinq premières observations de l'ensemble de données sont les suivantes :

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Pour cette solution, nous utilisons XGBoost, une implémentation open source populaire et efficace de l'algorithme des arbres boostés par gradient. Le gradient boosting est un algorithme d'apprentissage supervisé qui tente de prédire avec précision une variable cible en combinant un ensemble d'estimations provenant d'un ensemble de modèles plus simples et plus faibles. Son implémentation est disponible dans les algorithmes intégrés de SageMaker.

La solution de classification des paiements financiers comprend quatre étapes :

  1. Préparez les données.
  2. Créez un magasin de fonctionnalités.
  3. Créez et entraînez un modèle XGBoost.
  4. Déployez un point de terminaison et évaluez les performances du modèle.

Nous obtenons la sortie suivante :

  • Un modèle XGBoost entraîné basé sur notre exemple d'ensemble de données
  • Un point de terminaison SageMaker capable de prédire la catégorie de transaction

Après avoir exécuté cette solution, vous devriez voir un rapport de classification similaire au suivant.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Les applications possibles pour votre entreprise sont les suivantes :

  • Diverses applications financières dans la banque de détail et d'investissement
  • Lorsque les transactions doivent être classées dans n'importe quel cas d'utilisation (pas seulement financier)

Prédiction du taux de désabonnement pour les clients de téléphonie mobile

Prédire le taux de désabonnement des clients est un besoin commercial très courant. De nombreuses études montrent que le coût de la fidélisation d’un client existant est bien inférieur à celui de l’acquisition d’un nouveau client. Le défi vient souvent du fait que les entreprises ont du mal à comprendre pourquoi un client se désabonne ou à construire un modèle qui prédit le désabonnement.

Dans cet exemple, les utilisateurs qui débutent dans le ML peuvent découvrir comment un modèle de prédiction de désabonnement peut être rapidement développé à l'aide d'un ensemble de données de transactions d'appels mobiles. Cette solution utilise SageMaker pour former et déployer un modèle XGBoost sur un ensemble de données de profil client afin de prédire si un client est susceptible de quitter un opérateur de téléphonie mobile.

L'ensemble de données utilisé par cette solution est accessible au public et est mentionné dans le livre Discovering Knowledge in Data de Daniel T. Larose. Il est attribué par l’auteur au référentiel Irvine d’ensembles de données d’apprentissage automatique de l’Université de Californie.

Cet ensemble de données utilise les 21 attributs suivants pour décrire le profil d'un client d'un opérateur mobile américain inconnu.

  • État : l'État américain dans lequel réside le client, indiqué par une abréviation à deux lettres ; par exemple, OH ou NJ
  • Durée du compte : le nombre de jours pendant lesquels ce compte a été actif
  • Indicatif régional : l'indicatif régional à trois chiffres du numéro de téléphone du client correspondant
  • Téléphone : le numéro de téléphone à sept chiffres restant
  • Forfait Int'l : si le client dispose d'un forfait d'appels internationaux : oui/non
  • Forfait VMail : si le client dispose d'une fonctionnalité de messagerie vocale : oui/non
  • Message VMail : le nombre moyen de messages vocaux par mois
  • Day Mins : le nombre total de minutes d'appel utilisées pendant la journée
  • Appels journaliers : le nombre total d'appels passés pendant la journée
  • Day Charge : le coût facturé des appels de jour
  • Eve Mins, Eve Calls, Eve Charge : le coût facturé pour les appels passés en soirée
  • Minutes de nuit, appels de nuit, frais de nuit : le coût facturé pour les appels passés pendant la nuit
  • Intl Mins, Intl Calls, Intl Charge : le coût facturé pour les appels internationaux
  • CustServ Calls : le nombre d'appels passés au service client
  • Churn ? : si le client a quitté le service : vrai/faux

Cette solution comporte trois étapes :

  1. Préparez les données.
  2. Créez et entraînez un modèle XGBoost.
  3. Déployez un point de terminaison et évaluez les performances du modèle.

Nous obtenons la sortie suivante :

  • Un modèle XGBoost entraîné basé sur notre exemple d'ensemble de données pour prédire le taux de désabonnement des utilisateurs
  • Un point de terminaison SageMaker capable de prédire le taux de désabonnement des utilisateurs

Ce modèle permet d'estimer combien des 5,000 XNUMX clients de téléphonie mobile sont susceptibles de cesser d'utiliser leur opérateur de téléphonie mobile actuel.

Le graphique suivant montre une distribution de probabilité du taux de désabonnement en tant que résultat du modèle.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Vous pouvez appliquer cela à votre entreprise pour les cas d’utilisation suivants :

  • Prévoyez le taux de désabonnement des clients dans votre propre entreprise
  • Classez quels clients peuvent ouvrir votre e-mail marketing et lesquels ne le feront pas (classification binaire)
  • Prédire quels étudiants sont susceptibles d'abandonner un cours

Nettoyer les ressources

Une fois que vous avez terminé d'exécuter une solution dans JumpStart, assurez-vous de choisir Supprimer toutes les ressources ainsi toutes les ressources que vous avez créées au cours du processus sont supprimées et votre facturation est arrêtée.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Résumé

Cet article vous a montré comment résoudre divers problèmes commerciaux en appliquant le ML, basé sur les solutions JumpStart. Bien que cet article se concentre sur les cinq nouvelles solutions récemment ajoutées à JumpStart, il existe au total 23 solutions disponibles. Nous vous encourageons à vous connecter à Studio, à examiner vous-mêmes les solutions JumpStart et à commencer à en tirer une valeur immédiate. Pour plus d'informations, reportez-vous à Amazon SageMakerStudio ainsi que SageMaker JumpStart.

Remarque : Si vous ne voyez pas toutes les cinq solutions ci-dessus dans la console JumpStart de votre région AWS, veuillez attendre une semaine et vérifier à nouveau. Nous les diffusons progressivement dans diverses régions.


À propos des auteurs

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Dr Raju Penmatcha est un architecte de solutions spécialisé en IA/ML dans les plateformes d'IA chez AWS. Il travaille sur la suite de services low-code/no-code de SageMaker qui aide les clients à créer et déployer facilement des modèles et des solutions d'apprentissage automatique. Lorsqu'il n'aide pas les clients, il aime voyager vers de nouveaux endroits.

Résolvez les problèmes commerciaux de bout en bout grâce à l'apprentissage automatique dans les solutions Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Recherche verticale. Aï.Manan Shah est responsable du développement logiciel chez Amazon Web Services. Il est un passionné de ML et se concentre sur la création de produits IA/ML sans code/low-code. Il s'efforce de donner à d'autres personnes techniques talentueuses les moyens de créer d'excellents logiciels.

Horodatage:

Plus de Apprentissage automatique AWS