Overvind Machine Learning Cold Start-udfordringen i svindeldetektion ved hjælp af Amazon Fraud Detector

Genudgivet af Platon

Abonnenter: 0

Efterhånden som flere virksomheder øger deres online tilstedeværelse for at betjene deres kunder bedre, opstår der konstant nye svindelmønstre. I dagens stadigt udviklende digitale landskab, hvor svindlere bliver mere sofistikerede i deres taktik, er det blevet altafgørende for virksomheder og finansielle institutioner at opdage og forhindre sådanne svigagtige aktiviteter.

Traditionelle regelbaserede svindeldetektionssystemer er begrænset i deres evne til hurtigt at gentage, da de er afhængige af foruddefinerede regler og tærskler for at markere potentielt svigagtig aktivitet. Disse systemer kan generere et stort antal falske positiver, hvilket markant øger mængden af manuelle undersøgelser udført af svindelteamet. Desuden er mennesker også fejltilbøjelige og har begrænset kapacitet til at behandle store mængder data, hvilket gør manuelle bestræbelser på at opdage svindel tidskrævende, hvilket kan resultere i mistede svigagtige transaktioner, øgede tab og skade på omdømme.

Machine learning (ML) spiller en afgørende rolle i at opdage svindel, fordi den hurtigt og præcist kan analysere store mængder data for at identificere unormale mønstre og mulige svindeltendenser. ML-svindelmodellens ydeevne afhænger i høj grad af kvaliteten af de data, den er trænet i, og specifikt for de overvågede modeller er nøjagtige mærkede data afgørende. I ML kaldes mangel på væsentlige historiske data til at træne en model for koldstartsproblem.

I verden af afsløring af svindel er følgende nogle traditionelle koldstartsscenarier:

Opbygning af en nøjagtig svigmodel, mens den mangler en historie med transaktioner eller svigsager
At være i stand til præcist at skelne legitim aktivitet fra bedrageri for nye kunder og konti
Risikobesluttende betalinger til en adresse eller modtager, som svindelsystemet aldrig har set før

Der er flere måder at løse disse scenarier på. For eksempel kan du bruge generiske modeller, kendt som one-size-fits-all-modeller, som typisk trænes oven på svindeldatadelingsplatforme som svindelkonsortier. Udfordringen med denne tilgang er, at ingen virksomhed er ens, og svindelangrebsvektorer ændrer sig konstant.

En anden mulighed er at bruge en uovervåget anomalidetektionsmodel til at overvåge og synliggøre usædvanlig adfærd blandt kundebegivenheder. Udfordringen med denne tilgang er, at ikke alle svighændelser er uregelmæssigheder, og ikke alle uregelmæssigheder er faktisk svig. Derfor kan du forvente højere falske positive rater.

I dette indlæg viser vi, hvordan du hurtigt kan starte en ML-model for forebyggelse af svindel i realtid med lidt som 100 hændelser ved hjælp af Amazon svindeldetektor ny funktion, Koldstart, og derved dramatisk sænke adgangsbarrieren til tilpassede ML-modeller for mange organisationer, der simpelthen ikke har tid eller evne til at indsamle og nøjagtigt mærke store datasæt. Desuden diskuterer vi, hvordan du ved at bruge lagrede hændelser fra Amazon Fraud Detector kan gennemgå resultaterne og mærke hændelserne korrekt for at genoptræne dine modeller og derved forbedre effektiviteten af foranstaltninger til forebyggelse af bedrageri over tid.

Løsningsoversigt

Amazon Fraud Detector er en fuldt administreret svindeldetektionstjeneste, der automatiserer registrering af potentielt svigagtige aktiviteter online. Du kan bruge Amazon Fraud Detector til at bygge tilpassede svindeldetektionsmodeller ved hjælp af dit eget historiske datasæt, tilføje beslutningslogik ved hjælp af den indbyggede regelmotor og orkestrere risikobeslutningsarbejdsgange med et klik på en knap.

Tidligere skulle du give over 10,000 mærkede begivenheder med mindst 400 eksempler på svindel for at træne en model. Med udgivelsen af Cold Start-funktionen kan du hurtigt træne en model med minimum 100 hændelser og mindst 50 klassificeret som svindel. Sammenlignet med oprindelige datakrav er dette en reduktion på 99 % i historiske data og en 87 % reduktion i etiketkrav.

Den nye Cold Start-funktion giver intelligente metoder til berigelse, udvidelse og risikomodellering af små datasæt. Desuden udfører Amazon Fraud Detector etikettildelinger og prøveudtagning for umærkede begivenheder.

Eksperimenter udført med offentlige datasæt viser, at ved at sænke grænserne til 50 svindel og kun 100 hændelser kan du bygge svindel-ML-modeller, der konsekvent overgår uovervågede og semi-overvågede modeller.

Cold Start model ydeevne

En ML-models evne til at generalisere og lave nøjagtige forudsigelser på usete data påvirkes af kvaliteten og mangfoldigheden af træningsdatasættet. For Cold Start-modeller er dette ikke anderledes. Du bør have processer på plads, da der indsamles flere data for korrekt at mærke disse hændelser og genoptræne modellerne, hvilket i sidste ende fører til en optimal modelydelse.

Med et lavere datakrav øges ustabiliteten af rapporteret ydeevne på grund af modellens øgede varians og den begrænsede testdatastørrelse. For at hjælpe dig med at opbygge den rigtige forventning om modelydelse, rapporterer Amazon Fraud Detector foruden model-AUC også måleværdier for usikkerhedsområde. Følgende tabel definerer disse metrics.

.	.	AUC
.	.	<0.6	0.6 - 0.8	> = 0.8
AUC usikkerhedsinterval	> 0.3	Modellens ydeevne er meget lav og kan variere meget. Forvent lav ydelse til registrering af svindel.	Modellens ydeevne er lav og kan variere meget. Forvent begrænset ydelse til registrering af svindel.	Modellens ydeevne kan variere meget.
	0.1 - 0.3	Modellens ydeevne er meget lav og kan variere betydeligt. Forvent lav ydelse til registrering af svindel.	Modellens ydeevne er lav og kan variere betydeligt. Forvent begrænset ydelse til registrering af svindel.	Modellens ydeevne kan variere betydeligt.
	<0.1	Modellens ydeevne er meget lav. Forvent lav ydelse til registrering af svindel.	Modellens ydeevne er lav. Forvent begrænset ydelse til registrering af svindel.	Ingen advarsel

Træn en koldstart-model

At træne en Cold Start-svindelmodel er identisk med at træne enhver anden Amazon Fraud Detector-model; det der adskiller sig er datasættets størrelse. Du kan finde eksempeldatasæt til Cold Start-træning i vores GitHub repo. For at træne en tilpasset Amazon Fraud Detector-model kan du følge vores hands-on tutorial. Du kan enten bruge Amazon Fraud Detector konsol tutorial eller SDK tutorial at bygge, træne og implementere en model for opdagelse af bedrageri.

Når din model er trænet, kan du gennemgå præstationsmålinger og derefter implementere den ved at ændre dens status til Aktiv . For at lære mere om modelscore og præstationsmålinger, se Modelscore , Modelpræstationsmålinger. På dette tidspunkt kan du nu tilføje din model til din detektor, tilføj forretningsregler at fortolke de risikoscore, som modellen udsender, og lave forudsigelser i realtid ved hjælp af GetEventPrediction API.

Fraud ML model løbende forbedring og feedback loop

Med Amazon Fraud Detector Cold Start-funktionen kan du hurtigt starte et svindeldetektorendepunkt og begynde at beskytte dine virksomheder med det samme. Der dukker dog konstant nye svindelmønstre op, så det er afgørende at genoptræne Cold Start-modeller med nyere data for at forbedre nøjagtigheden og effektiviteten af forudsigelserne over tid.

For at hjælpe dig med at iterere på dine modeller gemmer Amazon Fraud Detector automatisk alle hændelser, der sendes til tjenesten til slutning. Du kan ændre eller validere, at flaget for indtagelse af hændelser er slået til på hændelsestypeniveau, som vist på det følgende skærmbillede.

Overcome the machine learning cold start challenge in fraud detection using Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Med funktionen lagrede hændelser kan du bruge Amazon Fraud Detector SDK til programmæssigt at få adgang til en hændelse, gennemgå hændelsesmetadata og forudsigelsesforklaringen og træffe en informeret risikobeslutning. Desuden kan du mærke begivenheden til fremtidig modelomskoling og løbende modelforbedring. Følgende diagram viser et eksempel på denne arbejdsgang.

Overcome the machine learning cold start challenge in fraud detection using Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertical Search. Ai.

I følgende kodestykker demonstrerer vi processen til at mærke en lagret hændelse:

For at lave en forudsigelse af svindel i realtid på en begivenhed skal du kalde GetEventPrediction API:

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

API-svar:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

Som det fremgår af svaret, skal hændelsen, baseret på den matchede beslutningsmotor-regel, sendes til manuel gennemgang af svindelteamet. Ved at indsamle metadata for forudsigelsesforklaringen kan du få indsigt i, hvordan hver hændelsesvariabel påvirkede modellens prædiktionsscore for svindel.

For at indsamle disse indsigter bruger vi get_event_prediction_metada API'er:

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

API-svar:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

Med denne indsigt kan svindelanalytikeren træffe en informeret risikobeslutning om den pågældende begivenhed og opdatere begivenhedsetiketten.

For at opdatere begivenhedsetiketten ring til update_event_label API'er:

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

API-svar

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

Som et sidste trin kan du bekræfte, om hændelsesetiketten blev opdateret korrekt.

For at bekræfte begivenhedsetiketten skal du ringe til get_event API'er:

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

API-svar

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

Ryd op

For at undgå fremtidige gebyrer skal du slette de ressourcer, der er oprettet til løsningen.

Konklusion

Dette indlæg demonstrerede, hvordan du hurtigt kan starte et svindelforebyggelsessystem i realtid med få som 100 hændelser ved hjælp af Amazon Fraud Detectors nye Cold Start-funktion. Vi diskuterede, hvordan du kan bruge lagrede hændelser til at gennemgå resultater og mærke hændelserne korrekt og genoptræne dine modeller, hvilket forbedrer effektiviteten af foranstaltninger til forebyggelse af bedrageri over tid.

Fuldt administrerede AWS-tjenester såsom Amazon Fraud Detector hjælper med at reducere den tid, virksomheder bruger på at analysere brugeradfærd for at identificere svindel på deres platforme og fokusere mere på at skabe forretningsværdi. For at lære mere om, hvordan Amazon Fraud Detector kan hjælpe din virksomhed, kan du besøge Amazon svindeldetektor.

Om forfatterne

Marcel Pividal er en Global Sr. AI Services Solutions Architect i den verdensomspændende specialistorganisation. Marcel har mere end 20 års erfaring med at løse forretningsproblemer gennem teknologi for FinTechs, betalingsudbydere, apoteker og offentlige myndigheder. Hans nuværende fokusområder er risikostyring, bedrageriforebyggelse og identitetsbekræftelse.

Julia Xu er forsker med Amazon Fraud Detector. Hun brænder for at løse kundernes udfordringer ved hjælp af maskinlæringsteknikker. I sin fritid nyder hun at vandre, male og udforske nye kaffebarer.

Guilherme Ricci er Senior Solution Architect hos AWS, der hjælper startups med at modernisere og optimere omkostningerne ved deres applikationer. Med over 10 års erfaring med virksomheder i den finansielle sektor, arbejder han i øjeblikket sammen med teamet af AI/ML-specialister.

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
Udmøntning af fremtiden med Adryenn Ashley. Adgang her.
Kilde: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

Tidsstempel: April 17, 2023

Tidsstempel: Mar 10, 2023

Genudgivet af Platon

Brug Amazon SageMaker Data Wrangler i Amazon SageMaker Studio med en standard livscykluskonfiguration

Reducer energiforbruget af dine maskinlæringsopgaver med op til 90 % med AWS specialbyggede acceleratorer | Amazon Web Services

Løft dine selvbetjeningsassistenter med nye generative AI-funktioner i Amazon Lex | Amazon Web Services

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto