Automatiser afsløring af pantdokumentsvindel ved hjælp af en ML-model og forretningsdefinerede regler med Amazon-svindeldetektor: Del 3

Genudgivet af Platon

Abonnenter: 0

I første indlæg af denne tredelte serie præsenterede vi en løsning, der demonstrerer, hvordan du kan automatisere registrering af dokumentmanipulation og bedrageri i stor skala ved hjælp af AWS AI og maskinlæringstjenester (ML) til en brugssituation for pantebreve.

I andet indlæg, diskuterede vi en tilgang til at udvikle en deep learning-baseret computervisionsmodel til at opdage og fremhæve forfalskede billeder i realkreditgarantier.

I dette indlæg præsenterer vi en løsning til at automatisere afsløring af realkreditdokumentsvindel ved hjælp af en ML-model og forretningsdefinerede regler med Amazon svindeldetektor.

Løsningsoversigt

Vi bruger Amazon Fraud Detector, en fuldt administreret svindeldetektionstjeneste, til at automatisere opdagelsen af svigagtige aktiviteter. Med en målsætning om at forbedre svigforudsigelsesnøjagtigheden ved proaktivt at identificere dokumentsvindel, samtidig med at forsikringsnøjagtigheden forbedres, hjælper Amazon Fraud Detector dig med at bygge tilpassede svigdetektionsmodeller ved hjælp af et historisk datasæt, konfigurere tilpasset beslutningslogik ved hjælp af den indbyggede regelmotor og orkestrere risikobeslutninger arbejdsgange med et klik på en knap.

Følgende diagram repræsenterer hvert trin i en pipeline til opdagelse af svindel med pantebreve.

Konceptuel arkitektur

Vi vil nu dække den tredje komponent i pipeline for opdagelse af svindel med realkreditdokumenter. Trinene til at implementere denne komponent er som følger:

Upload historiske data til Amazon Simple Storage Service (Amazon S3).
Vælg dine muligheder og træne modellen.
Opret modellen.
Gennemgå modellens ydeevne.
Implementer modellen.
Lav en detektor.
Tilføj regler for at fortolke modelresultater.
Implementer API'et til at lave forudsigelser.

Forudsætninger

Følgende er forudsætningstrin for denne løsning:

Tilmeld dig en AWS-konto.
Konfigurer tilladelser, der giver din AWS-konto adgang til Amazon Fraud Detector.
Indsaml de historiske svindeldata, der skal bruges til at træne svindeldetektormodellen med følgende krav:
1. Data skal være i CSV-format og have overskrifter.
2. Der kræves to overskrifter: EVENT_TIMESTAMP , EVENT_LABEL.
3. Data skal ligge i Amazon S3 i en AWS-region, der understøttes af tjenesten.
4. Det anbefales stærkt at køre en dataprofil, før du træner (brug en automatiseret dataprofiler til Amazon Fraud Detector).
5. Det anbefales at bruge mindst 3-6 måneders data.
6. Det tager tid for svindel at modnes; data, der er 1-3 måneder gamle, anbefales (ikke for nye).
7. Nogle NULL-værdier og manglende værdier er acceptable (men for mange, og variablen ignoreres, som diskuteret i Manglende eller forkert variabeltype).

Upload historiske data til Amazon S3

Når du har de tilpassede historiske datafiler til at træne en svigdetektormodel, skal du oprette en S3-bøtte og uploade dataene til bøtten.

Vælg muligheder og træne modellen

Det næste skridt i retning af at opbygge og træne en svigdetektormodel er at definere den forretningsaktivitet (begivenhed), der skal evalueres for svig. At definere en hændelse involverer indstilling af variablerne i dit datasæt, en enhed, der starter hændelsen, og etiketterne, der klassificerer hændelsen.

Udfør følgende trin for at definere en docfraud-hændelse for at opdage dokumentsvindel, som er initieret af enhedens ansøger-pant, med henvisning til en ny realkreditansøgning:

På Amazon Fraud Detector-konsollen skal du vælge Events i navigationsruden.
Vælg Opret.
Under Begivenhedstypedetaljer, gå ind docfraud som hændelsestypenavn, og indtast eventuelt en beskrivelse af hændelsen.
Vælg Opret enhed.
På Opret enhed side, indtast applicant_mortgage som enhedstypenavn, og indtast eventuelt en beskrivelse af enhedstypen.
Vælg Opret enhed.
Under Hændelsesvariable, For Vælg, hvordan denne hændelses variabler skal defineres, vælg Vælg variabler fra et træningsdatasæt.
Til IAM rolle, vælg Opret IAM-rolle.
På Opret IAM-rolle side, indtast navnet på S3-bøtten med dine eksempeldata og vælg Opret rolle.
Til Dataplacering, skal du indtaste stien til dine historiske data. Dette er S3 URI-stien, som du gemte efter upload af de historiske data. Stien ligner S3://your-bucket-name/example dataset filename.csv.
Vælg Upload.

Variabler repræsenterer dataelementer, som du vil bruge i en svigforudsigelse. Disse variabler kan tages fra hændelsesdatasættet, som du forberedte til træning af din model, fra din Amazon Fraud Detector-models risikoscore-output, eller fra Amazon SageMaker modeller. For mere information om variabler taget fra hændelsesdatasættet, se Hent krav til hændelsesdatasæt ved hjælp af Data Models Explorer.

Under Etiketter – valgfri, For Etiketter, vælg Opret nye etiketter.
På Opret etiket side, indtast fraud som navnet. Denne etiket svarer til den værdi, der repræsenterer den svigagtige pantansøgning i eksempeldatasættet.
Vælg Opret etiket.
Opret en anden etiket kaldet legit. Denne etiket svarer til den værdi, der repræsenterer den legitime pantansøgning i eksempeldatasættet.
Vælg Opret begivenhedstype.

Følgende skærmbillede viser vores begivenhedstypedetaljer.

Begivenhedstypedetaljer

Følgende skærmbillede viser vores variabler.

Modelvariabler

Følgende skærmbillede viser vores etiketter.

Etiketter

Opret modellen

Når du har indlæst de historiske data og valgt de nødvendige muligheder for at træne en model, skal du udføre følgende trin for at oprette en model:

På Amazon Fraud Detector-konsollen skal du vælge Modeller i navigationsruden.
Vælg Tilføj model, og vælg derefter Opret model.
På Definer modeldetaljer side, indtast mortgage_fraud_detection_model som modellens navn og en valgfri beskrivelse af modellen.
Til Model type, Vælg Online svindelindsigt model.
Til Begivenhedstype, vælg docfraud. Dette er den begivenhedstype, du oprettede tidligere.
I Historiske hændelsesdata sektion, skal du angive følgende oplysninger:
1. Til Hændelsesdatakilde, vælg Hændelsesdata gemt uploadet til S3 (eller AFD).
2. Til IAM rolle, vælg den rolle, du oprettede tidligere.
3. Til Træningsdataplacering, indtast S3 URI-stien til din eksempeldatafil.
Vælg Næste.
I Model input sektion, lad alle afkrydsningsfelter være markeret. Som standard bruger Amazon Fraud Detector alle variabler fra dit historiske hændelsesdatasæt som modelinput.
I Etiketklassificering afsnit, for Svigetiketter, vælg fraud, som svarer til den værdi, der repræsenterer svigagtige hændelser i eksempeldatasættet.
Til Legitime etiketter, vælg legit, som svarer til den værdi, der repræsenterer legitime hændelser i eksempeldatasættet.
Til Umærkede begivenheder, behold standardvalget Ignorer hændelser uden etiketter for dette eksempeldatasæt.
Vælg Næste.
Gennemgå dine indstillinger, og vælg derefter Opret og træne model.

Amazon Fraud Detector opretter en model og begynder at træne en ny version af modellen.

På Modelversioner side, den Status kolonne angiver status for modeltræning. Modeltræning, der bruger eksempeldatasættet, tager cirka 45 minutter at gennemføre. Status ændres til Klar til at implementere efter modeltræningen er afsluttet.

Gennemgå modellens ydeevne

Når modeltræningen er afsluttet, validerer Amazon Fraud Detector modellens ydeevne ved hjælp af 15 % af dine data, som ikke blev brugt til at træne modellen, og giver forskellige værktøjer, herunder et scorefordelingsdiagram og forvirringsmatrix, til at vurdere modellens ydeevne.

For at se modellens ydeevne skal du udføre følgende trin:

På Amazon Fraud Detector-konsollen skal du vælge Modeller i navigationsruden.
Vælg den model, du lige har trænet (sample_fraud_detection_model), vælg derefter 1.0. Dette er den version, som Amazon Fraud Detector er lavet af din model.
Gennemgå Model ydeevne samlet score og alle andre målinger, som Amazon Fraud Detector genererede for denne model.

Model ydeevne

Implementer modellen

Når du har gennemgået præstationsmålingerne for din trænede model og er klar til at bruge den, genererer forudsigelser om svindel, kan du implementere modellen:

På Amazon Fraud Detector-konsollen skal du vælge Modeller i navigationsruden.
Vælg model sample_fraud_detection_model, og vælg derefter den specifikke modelversion, du vil implementere. For dette indlæg, vælg 1.0.
På Modelversion side, på handlinger menu, vælg Implementer modelversion.

På Modelversioner side, den Status viser status for implementeringen. Status ændres til Aktiv når implementeringen er færdig. Dette indikerer, at modelversionen er aktiveret og tilgængelig til at generere svindelforudsigelser.

Lav en detektor

Efter du har implementeret modellen, bygger du en detektor til docfraud hændelsestype og tilføje den implementerede model. Udfør følgende trin:

På Amazon Fraud Detector-konsollen skal du vælge Detektorer i navigationsruden.
Vælg Opret detektor.
På Definer detektordetaljer side, indtast fraud_detector for detektornavnet, og indtast eventuelt en beskrivelse af detektoren, såsom min prøvesvindeldetektor.
Til Hændelsestype, vælg docfraud. Dette er den begivenhed, du oprettede tidligere.
Vælg Næste.

Tilføj regler til fortolkning

Når du har oprettet Amazon Fraud Detector-modellen, kan du bruge Amazon Fraud Detector-konsollen eller applikationsprogrammeringsgrænsefladen (API) til at definere forretningsdrevne regler (betingelser, der fortæller Amazon Fraud Detector, hvordan modellens præstationsscore skal fortolkes, når der evalueres for forudsigelse af svindel) . For at tilpasse sig pantegarantiprocessen kan du oprette regler for at markere realkreditansøgninger i henhold til de risikoniveauer, der er forbundet og kortlagt som svig, legitim, eller hvis der er behov for en gennemgang.

For eksempel vil du måske automatisk afvise realkreditansøgninger med en høj risiko for svindel under hensyntagen til parametre som manipulerede billeder af de nødvendige dokumenter, manglende dokumenter som lønsedler eller indkomstkrav og så videre. På den anden side kan visse applikationer have brug for et menneske i løkken for at træffe effektive beslutninger.

Amazon Fraud Detector bruger den aggregerede værdi (beregnet ved at kombinere et sæt råvariabler) og råværdien (værdien angivet for variablen) til at generere modelscorerne. Modelscorerne kan være mellem 0-1000, hvor 0 angiver lav svindelrisiko og 1000 angiver høj svindelrisiko.

For at tilføje de respektive forretningsdrevne regler skal du udføre følgende trin:

På Amazon Fraud Detector-konsollen skal du vælge Regler i navigationsruden.
Vælg Tilføj regel.
I Definer en regel sektion, indtast svindel for regelnavnet og indtast eventuelt en beskrivelse.
Til Udtryk, indtast regeludtrykket ved hjælp af Amazon Fraud Detectors forenklede regeludtrykssprog $docdraud_insightscore >= 900
Til Resultater, vælg Opret et nyt resultat (Et resultat er resultatet af en svigforudsigelse og returneres, hvis reglen matcher under en evaluering).
I Opret et nyt resultat sektion, indtast afvisning som resultatnavn og en valgfri beskrivelse.
Vælg Gem resultatet
Vælg Tilføj regel for at køre regelvalideringskontrollen og gemme reglen.
Efter det er oprettet, laver Amazon Fraud Detector følgende high_risk regel tilgængelig til brug i din detektor.
1. Regelnavn: fraud
2. Resultat: decline
3. Ekspression: $docdraud_insightscore >= 900
Vælg Tilføj en anden regel, og vælg derefter Opret regel fanen for at tilføje yderligere 2 regler som nedenfor:
Opret en low_risk regel med følgende detaljer:
1. Regelnavn: legit
2. Resultat: approve
3. Ekspression: $docdraud_insightscore <= 500
Opret en medium_risk regel med følgende detaljer:
1. Regelnavn: review needed
2. Resultat: review
3. Ekspression: $docdraud_insightscore <= 900 and docdraud_insightscore >=500

Disse værdier er eksempler brugt til dette indlæg. Når du opretter regler for din egen detektor, skal du bruge værdier, der passer til din model og brugssituation.

Når du har oprettet alle tre regler, skal du vælge Næste.

Tilknyttede regler

Implementer API'et til at lave forudsigelser

Efter at de regelbaserede handlinger er blevet udløst, kan du implementere en Amazon Fraud Detector API til at evaluere låneansøgningerne og forudsige potentiel svindel. Forudsigelserne kan udføres i en batch eller realtid.

Implementer Amazon Fraud Detector API

Integrer din SageMaker-model (valgfrit)

Hvis du allerede har en model for opdagelse af bedrageri i SageMaker, kan du integrere den med Amazon Fraud Detector for at få dine foretrukne resultater.

Dette indebærer, at du kan bruge både SageMaker og Amazon Fraud Detector-modeller i din applikation til at opdage forskellige typer svindel. For eksempel kan din applikation bruge Amazon Fraud Detector-modellen til at vurdere svindelrisikoen på kundekonti og samtidig bruge din PageMaker-model til at kontrollere, om der er risiko for kontokompromis.

Ryd op

For at undgå at pådrage sig fremtidige gebyrer skal du slette de ressourcer, der er oprettet til løsningen, inklusive følgende:

S3 spand
Amazon Fraud Detector-endepunkt

Konklusion

Dette indlæg ledte dig gennem en automatiseret og skræddersyet løsning til at opdage bedrageri i realkreditlånsprocessen. Denne løsning giver dig mulighed for at opdage svigagtige forsøg tættere på tidspunktet for bedrageri og hjælper forsikringsgivere med en effektiv beslutningsproces. Ydermere giver fleksibiliteten i implementeringen dig mulighed for at definere forretningsdrevne regler for at klassificere og indfange de svigagtige forsøg tilpasset specifikke forretningsbehov.

For mere information om at bygge en ende-til-ende løsning til opdagelse af svindel med pantebreve henvises til del 1 , del 2 i denne serie.

Om forfatterne

Anup Ravindranath er en Senior Solutions Architect hos Amazon Web Services (AWS) med base i Toronto, Canada, og arbejder med Financial Services-organisationer. Han hjælper kunder med at transformere deres forretninger og innovere på cloud.

Automate mortgage document fraud detection using an ML model and business-defined rules with Amazon Fraud Detector: Part 3 | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Vinnie Saini er Senior Solutions Architect hos Amazon Web Services (AWS) baseret i Toronto, Canada. Hun har hjulpet Financial Services-kunder med at transformere sig i skyen med AI- og ML-drevne løsninger, der er lagt på stærke grundpiller i Architectural Excellence.

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
PlatoESG. Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
Kilde: https://aws.amazon.com/blogs/machine-learning/automate-mortgage-document-fraud-detection-using-an-ml-model-and-business-defined-rules-with-amazon-fraud-detector-part-3/

Tidsstempel: Februar 7, 2024

Tidsstempel: Oktober 17, 2023

Automatiser afsløring af svindel med pantebreve ved hjælp af en ML-model og forretningsdefinerede regler med Amazon Fraud Detector: Del 3 | Amazon Web Services

Genudgivet af Platon

Løsningsoversigt

Forudsætninger

Upload historiske data til Amazon S3

Vælg muligheder og træne modellen

Opret modellen

Gennemgå modellens ydeevne

Implementer modellen

Lav en detektor

Tilføj regler til fortolkning

Implementer API'et til at lave forudsigelser

Integrer din SageMaker-model (valgfrit)

Ryd op

Konklusion

Om forfatterne

Mere fra AWS maskinindlæring

Integrer Amazon SageMaker Data Wrangler med MLOps arbejdsgange

Sikre Amazon SageMaker Studio forudindstillede URL'er Del 1: Grundlæggende infrastruktur

Fremme opdagelse af funktioner og genbrug på tværs af din organisation ved hjælp af Amazon SageMaker Feature Store og dens metadatafunktion på funktionsniveau

Intelligent dokumentbehandling med AWS AI-tjenester: Del 2

Kom godt i gang med Amazon Titan Text Embeddings V2: En ny state-of-the-art indlejringsmodel på Amazon Bedrock | Amazon Web Services

Visualiser en Amazon Comprehend-analyse med en ordsky i Amazon QuickSight | Amazon Web Services

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto