Surmontez le défi du démarrage à froid de l'apprentissage automatique dans la détection de fraude à l'aide du détecteur de fraude Amazon

Republié par Platon

Suiveurs: 0

Alors que de plus en plus d'entreprises augmentent leur présence en ligne pour mieux servir leurs clients, de nouveaux modèles de fraude apparaissent constamment. Dans le paysage numérique en constante évolution d'aujourd'hui, où les fraudeurs deviennent de plus en plus sophistiqués dans leurs tactiques, la détection et la prévention de ces activités frauduleuses sont devenues primordiales pour les entreprises et les institutions financières.

Les systèmes traditionnels de détection de fraude basés sur des règles sont limités dans leur capacité à itérer rapidement car ils s'appuient sur des règles et des seuils prédéfinis pour signaler les activités potentiellement frauduleuses. Ces systèmes peuvent générer un grand nombre de faux positifs, augmentant considérablement le volume d'enquêtes manuelles effectuées par l'équipe antifraude. De plus, les humains sont également sujets aux erreurs et ont une capacité limitée à traiter de grandes quantités de données, ce qui rend les efforts manuels pour détecter la fraude chronophages, ce qui peut entraîner des transactions frauduleuses manquées, des pertes accrues et des atteintes à la réputation.

L'apprentissage automatique (ML) joue un rôle crucial dans la détection de la fraude, car il peut analyser rapidement et avec précision de gros volumes de données pour identifier les modèles anormaux et les tendances de fraude possibles. Les performances du modèle de fraude ML dépendent fortement de la qualité des données sur lesquelles il est formé et, en particulier pour les modèles supervisés, des données étiquetées précises sont cruciales. En ML, un manque de données historiques significatives pour former un modèle est appelé le problème de démarrage à froid.

Dans le monde de la détection des fraudes, voici quelques scénarios traditionnels de démarrage à froid :

Construire un modèle de fraude précis sans avoir un historique des transactions ou des cas de fraude
Être capable de distinguer avec précision l'activité légitime de la fraude pour les nouveaux clients et comptes
Paiements à risque à une adresse ou à un bénéficiaire jamais vus auparavant par le système anti-fraude

Il existe plusieurs façons de résoudre ces scénarios. Par exemple, vous pouvez utiliser des modèles génériques, connus sous le nom de modèles universels, qui sont généralement formés sur des plateformes de partage de données sur la fraude comme les consortiums de fraude. Le défi de cette approche est qu'aucune entreprise n'est égale et que les vecteurs d'attaques frauduleuses changent constamment.

Une autre option consiste à utiliser un modèle de détection d'anomalies non supervisé pour surveiller et signaler les comportements inhabituels parmi les événements clients. Le défi de cette approche est que tous les événements de fraude ne sont pas des anomalies, et toutes les anomalies ne sont pas en effet de la fraude. Par conséquent, vous pouvez vous attendre à des taux de faux positifs plus élevés.

Dans cet article, nous montrons comment vous pouvez démarrer rapidement un modèle ML de prévention de la fraude en temps réel avec un peu 100 événements en utilisant le Détecteur de fraude Amazon nouvelle fonctionnalité, Démarrage à froid, réduisant ainsi considérablement la barrière d'accès aux modèles ML personnalisés pour de nombreuses organisations qui n'ont tout simplement pas le temps ou la capacité de collecter et d'étiqueter avec précision de grands ensembles de données. De plus, nous expliquons comment, en utilisant les événements stockés d'Amazon Fraud Detector, vous pouvez examiner les résultats et étiqueter correctement les événements pour recycler vos modèles, améliorant ainsi l'efficacité des mesures de prévention de la fraude au fil du temps.

Vue d'ensemble de la solution

Amazon Fraud Detector est un service de détection de fraude entièrement géré qui automatise la détection des activités potentiellement frauduleuses en ligne. Vous pouvez utiliser Amazon Fraud Detector pour créer des modèles de détection de fraude personnalisés à l'aide de votre propre ensemble de données historiques, ajouter une logique de décision à l'aide du moteur de règles intégré et orchestrer des flux de travail de décision sur les risques d'un simple clic.

Auparavant, vous deviez fournir plus de 10,000 400 événements étiquetés avec au moins 100 exemples de fraude pour former un modèle. Avec la sortie de la fonctionnalité Cold Start, vous pouvez former rapidement un modèle avec un minimum de 50 événements et au moins 99 classés comme frauduleux. Par rapport aux exigences initiales en matière de données, cela représente une réduction de 87 % des données historiques et une réduction de XNUMX % des exigences en matière d'étiquetage.

La nouvelle fonctionnalité Cold Start fournit des méthodes intelligentes pour enrichir, étendre et modéliser les risques de petits ensembles de données. De plus, Amazon Fraud Detector effectue des attributions d'étiquettes et un échantillonnage pour les événements sans étiquette.

Les expériences réalisées avec des ensembles de données publics montrent qu'en abaissant les limites à 50 fraudes et à seulement 100 événements, vous pouvez créer des modèles de fraude ML qui surpassent systématiquement les modèles non supervisés et semi-supervisés.

Performances du modèle de démarrage à froid

La capacité d'un modèle ML à généraliser et à faire des prédictions précises sur des données invisibles est affectée par la qualité et la diversité de l'ensemble de données d'apprentissage. Pour les modèles Cold Start, ce n'est pas différent. Vous devez avoir des processus en place au fur et à mesure que davantage de données sont collectées pour étiqueter correctement ces événements et recycler les modèles, ce qui conduit finalement à une performance optimale du modèle.

Avec une exigence de données inférieure, l'instabilité des performances rapportées augmente en raison de la variance accrue du modèle et de la taille limitée des données de test. Pour vous aider à établir les bonnes attentes en matière de performances du modèle, outre l'AUC du modèle, Amazon Fraud Detector signale également des métriques de plage d'incertitude. Le tableau suivant définit ces métriques.

.	.	ASC
.	.	<0.6	0.6 – 0.8	> = 0.8
Intervalle d'incertitude AUC	> 0.3	Les performances du modèle sont très faibles et peuvent varier considérablement. Attendez-vous à de faibles performances de détection des fraudes.	Les performances du modèle sont faibles et peuvent varier considérablement. Attendez-vous à des performances de détection de fraude limitées.	Les performances du modèle peuvent varier considérablement.
	0.1 – 0.3	Les performances du modèle sont très faibles et peuvent varier considérablement. Attendez-vous à de faibles performances de détection des fraudes.	Les performances du modèle sont faibles et peuvent varier considérablement. Attendez-vous à des performances de détection de fraude limitées.	Les performances du modèle peuvent varier considérablement.
	<0.1	Les performances du modèle sont très faibles. Attendez-vous à de faibles performances de détection des fraudes.	Les performances du modèle sont faibles. Attendez-vous à des performances de détection de fraude limitées.	Pas d'avertissement

Former un modèle de démarrage à froid

La formation d'un modèle de fraude Cold Start est identique à la formation de tout autre modèle Amazon Fraud Detector ; ce qui diffère, c'est la taille du jeu de données. Vous pouvez trouver des exemples d'ensembles de données pour la formation Cold Start dans notre Repo GitHub. Pour former un modèle personnalisé Amazon Fraud Detector, vous pouvez suivre nos travaux pratiques tutoriel. Vous pouvez soit utiliser le Tutoriel de la console Amazon Fraud Detector au sein de l’ Tutoriel SDK pour construire, former et déployer un modèle de détection de fraude.

Une fois votre modèle formé, vous pouvez examiner les métriques de performances, puis le déployer en modifiant son statut en Actif. Pour en savoir plus sur les scores de modèle et les mesures de performances, consultez Scores des modèles ainsi que Métriques de performance du modèle. À ce stade, vous pouvez maintenant ajouter votre modèle à votre détecteur, ajouter règles commerciales pour interpréter les scores de risque générés par le modèle et faire des prédictions en temps réel à l'aide du ObtenirEventPrediction API.

Amélioration continue du modèle Fraud ML et boucle de rétroaction

Avec la fonctionnalité Amazon Fraud Detector Cold Start, vous pouvez démarrer rapidement un point de terminaison de détecteur de fraude et commencer à protéger vos entreprises immédiatement. Cependant, de nouveaux modèles de fraude émergent constamment, il est donc essentiel de recycler les modèles Cold Start avec des données plus récentes pour améliorer la précision et l'efficacité des prédictions au fil du temps.

Pour vous aider à itérer sur vos modèles, Amazon Fraud Detector stocke automatiquement tous les événements envoyés au service pour inférence. Vous pouvez modifier ou valider l'activation de l'indicateur d'ingestion d'événement au niveau du type d'événement, comme illustré dans la capture d'écran suivante.

Relevez le défi du démarrage à froid du machine learning dans la détection des fraudes à l'aide d'Amazon Fraud Detector PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Avec la fonction d'événements stockés, vous pouvez utiliser le kit SDK Amazon Fraud Detector pour accéder par programme à un événement, examiner les métadonnées de l'événement et l'explication de la prédiction, et prendre une décision éclairée en matière de risque. De plus, vous pouvez étiqueter l'événement pour le recyclage futur du modèle et l'amélioration continue du modèle. Le diagramme suivant montre un exemple de ce workflow.

Relevez le défi du démarrage à froid du machine learning dans la détection des fraudes à l'aide d'Amazon Fraud Detector PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Dans les extraits de code suivants, nous illustrons le processus d'étiquetage d'un événement stocké :

Pour effectuer une prédiction de fraude en temps réel sur un événement, appelez l'API GetEventPrediction :

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

Réponse de l'API :

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

Comme indiqué dans la réponse, en fonction de la règle du moteur de décision correspondante, l'événement doit être envoyé pour examen manuel par l'équipe de lutte contre la fraude. En rassemblant les métadonnées d'explication de prédiction, vous pouvez obtenir des informations sur l'impact de chaque variable d'événement sur le score de prédiction de fraude du modèle.

Pour recueillir ces informations, nous utilisons le get_event_prediction_metada API:

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

Réponse de l'API :

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

Grâce à ces informations, l'analyste de la fraude peut prendre une décision éclairée en matière de risque concernant l'événement en question et mettre à jour l'étiquette de l'événement.

Pour mettre à jour le libellé de l'événement, appelez le update_event_label API:

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

Réponse API

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

Enfin, vous pouvez vérifier si le libellé de l'événement a été correctement mis à jour.

Pour vérifier le libellé de l'événement, appelez le get_event API:

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

Réponse API

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

Nettoyer

Pour éviter d'encourir des frais futurs, supprimez les ressources créées pour la solution.

Conclusion

Cet article a montré comment démarrer rapidement un système de prévention de la fraude en temps réel avec seulement 100 événements à l'aide de la nouvelle fonctionnalité Cold Start d'Amazon Fraud Detector. Nous avons discuté de la manière dont vous pouvez utiliser les événements stockés pour examiner les résultats, étiqueter correctement les événements et recycler vos modèles, améliorant ainsi l'efficacité des mesures de prévention de la fraude au fil du temps.

Les services AWS entièrement gérés tels qu'Amazon Fraud Detector aident à réduire le temps que les entreprises passent à analyser le comportement des utilisateurs pour identifier les fraudes sur leurs plateformes et se concentrer davantage sur la création de valeur commerciale. Pour en savoir plus sur la façon dont Amazon Fraud Detector peut aider votre entreprise, visitez Détecteur de fraude Amazon.

À propos des auteurs

Marcel Pividal est un architecte mondial de solutions de services d'IA senior au sein de l'organisation spécialisée mondiale. Marcel a plus de 20 ans d'expérience dans la résolution de problèmes commerciaux grâce à la technologie pour les FinTechs, les fournisseurs de paiement, l'industrie pharmaceutique et les agences gouvernementales. Ses domaines d'intérêt actuels sont la gestion des risques, la prévention de la fraude et la vérification de l'identité.

Julia Xu est chercheur scientifique chez Amazon Fraud Detector. Elle est passionnée par la résolution des problèmes des clients à l'aide de techniques d'apprentissage automatique. Dans ses temps libres, elle aime faire de la randonnée, peindre et explorer de nouveaux cafés.

Guilhermé Ricci est Senior Solution Architect chez AWS, aidant les startups à moderniser et optimiser les coûts de leurs applications. Avec plus de 10 ans d'expérience auprès d'entreprises du secteur financier, il travaille actuellement avec l'équipe de spécialistes AI/ML.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
Frapper l'avenir avec Adryenn Ashley. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

Horodatage: 17 avril 2023

Horodatage: 10 Mar 2023

Republié par Platon

Utiliser Amazon SageMaker Data Wrangler dans Amazon SageMaker Studio avec une configuration de cycle de vie par défaut

Réduisez la consommation d'énergie de vos charges de travail de machine learning jusqu'à 90 % grâce aux accélérateurs spécialement conçus par AWS | Services Web Amazon

Améliorez vos assistants en libre-service avec de nouvelles fonctionnalités d'IA générative dans Amazon Lex | Services Web Amazon

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte