Overvinn maskinlæringsutfordringen med kaldstart i svindeloppdagelse ved hjelp av Amazons svindeldetektor

Publisert av Platon

Følgere: 0

Etter hvert som flere virksomheter øker sin tilstedeværelse på nettet for å betjene kundene sine bedre, dukker det stadig opp nye svindelmønstre. I dagens stadig utviklende digitale landskap, hvor svindlere blir mer sofistikerte i taktikken sin, har det blitt avgjørende for selskaper og finansinstitusjoner å oppdage og forhindre slike uredelige aktiviteter.

Tradisjonelle regelbaserte svindeldeteksjonssystemer er begrenset i deres evne til å raskt gjenta seg ettersom de er avhengige av forhåndsdefinerte regler og terskler for å flagge potensielt uredelig aktivitet. Disse systemene kan generere et stort antall falske positiver, og øke volumet av manuelle undersøkelser som utføres av svindelteamet betydelig. I tillegg er mennesker også utsatt for feil og har begrenset kapasitet til å behandle store datamengder, noe som gjør manuelle forsøk på å oppdage svindel tidkrevende, noe som kan resultere i tapte uredelige transaksjoner, økte tap og skade på omdømmet.

Maskinlæring (ML) spiller en avgjørende rolle for å oppdage svindel fordi den raskt og nøyaktig kan analysere store datamengder for å identifisere unormale mønstre og mulige svindeltrender. Ytelsen til ML-svindelmodellen er sterkt avhengig av kvaliteten på dataene den er trent på, og spesifikt for de overvåkede modellene er nøyaktige merkede data avgjørende. I ML kalles mangel på betydelige historiske data for å trene en modell kaldstart problem.

I verden av svindeldeteksjon er følgende noen tradisjonelle kaldstartscenarier:

Bygge en nøyaktig svindelmodell mens den mangler en historie med transaksjoner eller svindelsaker
Å kunne nøyaktig skille legitim aktivitet fra svindel for nye kunder og kontoer
Risikoavgjørende betalinger til en adresse eller mottaker som svindelsystemet aldri har sett før

Det er flere måter å løse disse scenariene på. Du kan for eksempel bruke generiske modeller, kjent som one-size-fits-all-modeller, som vanligvis trenes på toppen av svindeldatadelingsplattformer som svindelkonsortier. Utfordringen med denne tilnærmingen er at ingen virksomhet er like, og svindelangrepsvektorer endres hele tiden.

Et annet alternativ er å bruke en uovervåket anomalideteksjonsmodell for å overvåke og synliggjøre uvanlig atferd blant kundehendelser. Utfordringen med denne tilnærmingen er at ikke alle svindelhendelser er uregelmessigheter, og ikke alle uregelmessigheter er faktisk svindel. Derfor kan du forvente høyere falske positive priser.

I dette innlegget viser vi hvordan du raskt kan starte opp en ML-modell for svindelforebygging i sanntid med litt som 100 hendelser ved å bruke Amazon-svindeldetektor ny funksjon, Kald start, og reduserer derved dramatisk adgangsbarrieren til tilpassede ML-modeller for mange organisasjoner som rett og slett ikke har tid eller evne til å samle inn og merke store datasett nøyaktig. Dessuten diskuterer vi hvordan du ved å bruke lagrede hendelser fra Amazon Fraud Detector kan gjennomgå resultater og merke hendelsene riktig for å omskolere modellene dine, og dermed forbedre effektiviteten av svindelforebyggende tiltak over tid.

Løsningsoversikt

Amazon Fraud Detector er en fullstendig administrert svindeldeteksjonstjeneste som automatiserer oppdagelse av potensielt uredelige aktiviteter på nettet. Du kan bruke Amazon Fraud Detector til å bygge tilpassede svindeldeteksjonsmodeller ved å bruke ditt eget historiske datasett, legge til beslutningslogikk ved hjelp av den innebygde regelmotoren og orkestrere arbeidsflyter for risikobeslutninger med et klikk på en knapp.

Tidligere måtte du gi over 10,000 400 merkede arrangementer med minst 100 eksempler på svindel for å trene en modell. Med utgivelsen av Cold Start-funksjonen kan du raskt trene en modell med minimum 50 hendelser og minst 99 klassifisert som svindel. Sammenlignet med opprinnelige datakrav er dette en reduksjon på 87 % i historiske data og en XNUMX % reduksjon i etikettkrav.

Den nye Cold Start-funksjonen gir intelligente metoder for å berike, utvide og risikomodellere små sett med data. Dessuten utfører Amazon Fraud Detector etiketttildelinger og prøvetaking for umerkede hendelser.

Eksperimenter utført med offentlige datasett viser at ved å senke grensene til 50 svindel og bare 100 hendelser, kan du bygge svindel-ML-modeller som konsekvent overgår uovervåkede og semi-overvåkede modeller.

Kaldstartmodellytelse

Evnen til en ML-modell til å generalisere og lage nøyaktige spådommer på usynlige data påvirkes av kvaliteten og mangfoldet til opplæringsdatasettet. For Cold Start-modeller er dette ikke annerledes. Du bør ha prosesser på plass ettersom mer data samles inn for å merke disse hendelsene korrekt og omskolere modellene, noe som til slutt fører til optimal modellytelse.

Med et lavere datakrav øker ustabiliteten til rapportert ytelse på grunn av den økte variansen til modellen og den begrensede størrelsen på testdata. For å hjelpe deg med å bygge den rette forventningen til modellytelse, rapporterer Amazon Fraud Detector i tillegg til modell-AUC også beregninger for usikkerhetsområde. Tabellen nedenfor definerer disse beregningene.

.	.	AUC
.	.	<0.6	0.6 - 0.8	> = 0.8
AUC usikkerhetsintervall	> 0.3	Modellytelsen er svært lav og kan variere mye. Forvent lav ytelse for svindeldeteksjon.	Modellytelsen er lav og kan variere mye. Forvent begrenset ytelse for oppdagelse av svindel.	Modellytelsen kan variere mye.
	0.1 - 0.3	Modellytelsen er svært lav og kan variere betydelig. Forvent lav ytelse for svindeldeteksjon.	Modellytelsen er lav og kan variere betydelig. Forvent begrenset ytelse for oppdagelse av svindel.	Modellytelsen kan variere betydelig.
	<0.1	Modellytelsen er svært lav. Forvent lav ytelse for svindeldeteksjon.	Modellytelsen er lav. Forvent begrenset ytelse for oppdagelse av svindel.	Ingen advarsel

Tren en kaldstartmodell

Trening av en kaldstartsvindelmodell er identisk med å trene enhver annen Amazon-svindeldetektormodell; det som skiller er datasettstørrelsen. Du kan finne eksempeldatasett for Cold Start-trening i vår GitHub repo. For å trene en tilpasset modell for Amazon Fraud Detector, kan du følge vår hands-on tutorial. Du kan enten bruke Opplæring for Amazon Fraud Detector-konsoll eller SDK-opplæring å bygge, trene og distribuere en svindeldeteksjonsmodell.

Etter at modellen din er opplært, kan du se gjennom ytelsesberegninger og deretter implementere den ved å endre statusen til Aktiv. For å lære mer om modellpoeng og ytelsesberegninger, se Modellscore og Modell ytelsesberegninger. På dette tidspunktet kan du nå legge til modellen din til detektoren din, legg til forretningsregler å tolke risikoskårene som modellen gir ut, og lage sanntidsprediksjoner ved å bruke GetEventPrediction API.

Fraud ML-modellen kontinuerlig forbedring og tilbakemeldingssløyfe

Med Amazon Fraud Detector Cold Start-funksjonen kan du raskt starte opp et svindeldetektorendepunkt og begynne å beskytte virksomhetene dine umiddelbart. Imidlertid dukker det stadig opp nye svindelmønstre, så det er avgjørende å omskolere Cold Start-modeller med nyere data for å forbedre nøyaktigheten og effektiviteten til spådommene over tid.

For å hjelpe deg å iterere på modellene dine, lagrer Amazon Fraud Detector automatisk alle hendelser som sendes til tjenesten for slutning. Du kan endre eller validere at flagget for inntak av hendelser er på på hendelsestypenivå, som vist i følgende skjermbilde.

Overvinn kaldstartutfordringen med maskinlæring i svindeloppdagelse ved å bruke Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Med funksjonen for lagrede hendelser kan du bruke Amazon Fraud Detector SDK til å programmere tilgang til en hendelse, gjennomgå metadataene for hendelsen og prediksjonsforklaringen og ta en informert risikobeslutning. I tillegg kan du merke arrangementet for fremtidig modellomskolering og kontinuerlig modellforbedring. Følgende diagram viser et eksempel på denne arbeidsflyten.

Overvinn kaldstartutfordringen med maskinlæring i svindeloppdagelse ved å bruke Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

I følgende kodebiter demonstrerer vi prosessen for å merke en lagret hendelse:

For å gjøre en svindelprediksjon i sanntid på en hendelse, ring GetEventPrediction API:

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

API-svar:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

Som det fremgår av svaret, basert på samsvarende beslutningsmotorregel, bør hendelsen sendes til manuell vurdering av svindelteamet. Ved å samle metadataene for prediksjonsforklaringen kan du få innsikt i hvordan hver hendelsesvariabel påvirket modellens svindelprediksjonsscore.

For å samle inn denne innsikten bruker vi get_event_prediction_metada API:

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

API-svar:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

Med denne innsikten kan svindelanalytikeren ta en informert risikobeslutning om den aktuelle hendelsen og oppdatere hendelsesetiketten.

For å oppdatere hendelsesetiketten ring update_event_label API:

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

API-svar

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

Som et siste trinn kan du bekrefte om hendelsesetiketten ble riktig oppdatert.

For å bekrefte hendelsesetiketten, ring get_event API:

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

API-svar

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

Rydd opp

For å unngå fremtidige kostnader, slett ressursene som er opprettet for løsningen.

konklusjonen

Dette innlegget demonstrerte hvordan du raskt kan starte opp et svindelforebyggingssystem i sanntid med noen få som 100 hendelser ved å bruke Amazon Fraud Detectors nye Cold Start-funksjon. Vi diskuterte hvordan du kan bruke lagrede hendelser til å gjennomgå resultater og merke hendelsene korrekt og trene modellene dine på nytt, og forbedre effektiviteten av svindelforebyggende tiltak over tid.

Fullt administrerte AWS-tjenester som Amazon Fraud Detector bidrar til å redusere tiden bedrifter bruker på å analysere brukeratferd for å identifisere svindel på plattformene deres og fokusere mer på å øke forretningsverdien. For å lære mer om hvordan Amazon Fraud Detector kan hjelpe bedriften din, besøk Amazon svindeldetektor.

Om forfatterne

Marcel Pividal er en Global Sr. AI Services Solutions Architect i den verdensomspennende spesialistorganisasjonen. Marcel har mer enn 20 års erfaring med å løse forretningsproblemer gjennom teknologi for FinTechs, betalingsleverandører, apotek og offentlige etater. Hans nåværende fokusområder er risikostyring, svindelforebygging og identitetsverifisering.

Julia Xu er en forsker med Amazon Fraud Detector. Hun brenner for å løse kundeutfordringer ved hjelp av maskinlæringsteknikker. På fritiden liker hun å gå tur, male og utforske nye kaffebarer.

Guilherme Ricci er en senior løsningsarkitekt hos AWS, og hjelper startups med å modernisere og optimalisere kostnadene for applikasjonene deres. Med over 10 års erfaring med selskaper i finanssektoren jobber han for tiden sammen med teamet av AI/ML-spesialister.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
Minting the Future med Adryenn Ashley. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

Tidstempel: April 17, 2023

Tidstempel: Mar 10, 2023

Publisert av Platon

Bruk Amazon SageMaker Data Wrangler i Amazon SageMaker Studio med en standard livssykluskonfigurasjon

Reduser energiforbruket til maskinlæringsarbeidsmengdene dine med opptil 90 % med spesialbygde AWS-akseleratorer | Amazon Web Services

Hev selvbetjeningsassistentene dine med nye generative AI-funksjoner i Amazon Lex | Amazon Web Services

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn