I første indlæg af denne tredelte serie præsenterede vi en løsning, der demonstrerer, hvordan du kan automatisere registrering af dokumentmanipulation og bedrageri i stor skala ved hjælp af AWS AI og maskinlæringstjenester (ML) til en brugssituation for pantebreve.
I andet indlæg, diskuterede vi en tilgang til at udvikle en deep learning-baseret computervisionsmodel til at opdage og fremhæve forfalskede billeder i realkreditgarantier.
I dette indlæg præsenterer vi en løsning til at automatisere afsløring af realkreditdokumentsvindel ved hjælp af en ML-model og forretningsdefinerede regler med Amazon svindeldetektor.
Løsningsoversigt
Vi bruger Amazon Fraud Detector, en fuldt administreret svindeldetektionstjeneste, til at automatisere opdagelsen af svigagtige aktiviteter. Med en målsætning om at forbedre svigforudsigelsesnøjagtigheden ved proaktivt at identificere dokumentsvindel, samtidig med at forsikringsnøjagtigheden forbedres, hjælper Amazon Fraud Detector dig med at bygge tilpassede svigdetektionsmodeller ved hjælp af et historisk datasæt, konfigurere tilpasset beslutningslogik ved hjælp af den indbyggede regelmotor og orkestrere risikobeslutninger arbejdsgange med et klik på en knap.
Følgende diagram repræsenterer hvert trin i en pipeline til opdagelse af svindel med pantebreve.
Vi vil nu dække den tredje komponent i pipeline for opdagelse af svindel med realkreditdokumenter. Trinene til at implementere denne komponent er som følger:
- Upload historiske data til Amazon Simple Storage Service (Amazon S3).
- Vælg dine muligheder og træne modellen.
- Opret modellen.
- Gennemgå modellens ydeevne.
- Implementer modellen.
- Lav en detektor.
- Tilføj regler for at fortolke modelresultater.
- Implementer API'et til at lave forudsigelser.
Forudsætninger
Følgende er forudsætningstrin for denne løsning:
- Tilmeld dig en AWS-konto.
- Konfigurer tilladelser, der giver din AWS-konto adgang til Amazon Fraud Detector.
- Indsaml de historiske svindeldata, der skal bruges til at træne svindeldetektormodellen med følgende krav:
- Data skal være i CSV-format og have overskrifter.
- Der kræves to overskrifter:
EVENT_TIMESTAMP
,EVENT_LABEL
. - Data skal ligge i Amazon S3 i en AWS-region, der understøttes af tjenesten.
- Det anbefales stærkt at køre en dataprofil, før du træner (brug en automatiseret dataprofiler til Amazon Fraud Detector).
- Det anbefales at bruge mindst 3-6 måneders data.
- Det tager tid for svindel at modnes; data, der er 1-3 måneder gamle, anbefales (ikke for nye).
- Nogle NULL-værdier og manglende værdier er acceptable (men for mange, og variablen ignoreres, som diskuteret i Manglende eller forkert variabeltype).
Upload historiske data til Amazon S3
Når du har de tilpassede historiske datafiler til at træne en svigdetektormodel, skal du oprette en S3-bøtte og uploade dataene til bøtten.
Vælg muligheder og træne modellen
Det næste skridt i retning af at opbygge og træne en svigdetektormodel er at definere den forretningsaktivitet (begivenhed), der skal evalueres for svig. At definere en hændelse involverer indstilling af variablerne i dit datasæt, en enhed, der starter hændelsen, og etiketterne, der klassificerer hændelsen.
Udfør følgende trin for at definere en docfraud-hændelse for at opdage dokumentsvindel, som er initieret af enhedens ansøger-pant, med henvisning til en ny realkreditansøgning:
- På Amazon Fraud Detector-konsollen skal du vælge Events i navigationsruden.
- Vælg Opret.
- Under Begivenhedstypedetaljer, gå ind
docfraud
som hændelsestypenavn, og indtast eventuelt en beskrivelse af hændelsen. - Vælg Opret enhed.
- På Opret enhed side, indtast
applicant_mortgage
som enhedstypenavn, og indtast eventuelt en beskrivelse af enhedstypen. - Vælg Opret enhed.
- Under Hændelsesvariable, For Vælg, hvordan denne hændelses variabler skal defineres, vælg Vælg variabler fra et træningsdatasæt.
- Til IAM rolle, vælg Opret IAM-rolle.
- På Opret IAM-rolle side, indtast navnet på S3-bøtten med dine eksempeldata og vælg Opret rolle.
- Til Dataplacering, skal du indtaste stien til dine historiske data. Dette er S3 URI-stien, som du gemte efter upload af de historiske data. Stien ligner
S3://your-bucket-name/example dataset filename.csv
. - Vælg Upload.
Variabler repræsenterer dataelementer, som du vil bruge i en svigforudsigelse. Disse variabler kan tages fra hændelsesdatasættet, som du forberedte til træning af din model, fra din Amazon Fraud Detector-models risikoscore-output, eller fra Amazon SageMaker modeller. For mere information om variabler taget fra hændelsesdatasættet, se Hent krav til hændelsesdatasæt ved hjælp af Data Models Explorer.
- Under Etiketter – valgfri, For Etiketter, vælg Opret nye etiketter.
- På Opret etiket side, indtast
fraud
som navnet. Denne etiket svarer til den værdi, der repræsenterer den svigagtige pantansøgning i eksempeldatasættet. - Vælg Opret etiket.
- Opret en anden etiket kaldet
legit
. Denne etiket svarer til den værdi, der repræsenterer den legitime pantansøgning i eksempeldatasættet. - Vælg Opret begivenhedstype.
Følgende skærmbillede viser vores begivenhedstypedetaljer.
Følgende skærmbillede viser vores variabler.
Følgende skærmbillede viser vores etiketter.
Opret modellen
Når du har indlæst de historiske data og valgt de nødvendige muligheder for at træne en model, skal du udføre følgende trin for at oprette en model:
- På Amazon Fraud Detector-konsollen skal du vælge Modeller i navigationsruden.
- Vælg Tilføj model, og vælg derefter Opret model.
- På Definer modeldetaljer side, indtast
mortgage_fraud_detection_model
som modellens navn og en valgfri beskrivelse af modellen. - Til Model type, Vælg Online svindelindsigt model.
- Til Begivenhedstype, vælg
docfraud
. Dette er den begivenhedstype, du oprettede tidligere. - I Historiske hændelsesdata sektion, skal du angive følgende oplysninger:
- Til Hændelsesdatakilde, vælg Hændelsesdata gemt uploadet til S3 (eller AFD).
- Til IAM rolle, vælg den rolle, du oprettede tidligere.
- Til Træningsdataplacering, indtast S3 URI-stien til din eksempeldatafil.
- Vælg Næste.
- I Model input sektion, lad alle afkrydsningsfelter være markeret. Som standard bruger Amazon Fraud Detector alle variabler fra dit historiske hændelsesdatasæt som modelinput.
- I Etiketklassificering afsnit, for Svigetiketter, vælg
fraud
, som svarer til den værdi, der repræsenterer svigagtige hændelser i eksempeldatasættet. - Til Legitime etiketter, vælg
legit
, som svarer til den værdi, der repræsenterer legitime hændelser i eksempeldatasættet. - Til Umærkede begivenheder, behold standardvalget Ignorer hændelser uden etiketter for dette eksempeldatasæt.
- Vælg Næste.
- Gennemgå dine indstillinger, og vælg derefter Opret og træne model.
Amazon Fraud Detector opretter en model og begynder at træne en ny version af modellen.
På Modelversioner side, den Status kolonne angiver status for modeltræning. Modeltræning, der bruger eksempeldatasættet, tager cirka 45 minutter at gennemføre. Status ændres til Klar til at implementere efter modeltræningen er afsluttet.
Gennemgå modellens ydeevne
Når modeltræningen er afsluttet, validerer Amazon Fraud Detector modellens ydeevne ved hjælp af 15 % af dine data, som ikke blev brugt til at træne modellen, og giver forskellige værktøjer, herunder et scorefordelingsdiagram og forvirringsmatrix, til at vurdere modellens ydeevne.
For at se modellens ydeevne skal du udføre følgende trin:
- På Amazon Fraud Detector-konsollen skal du vælge Modeller i navigationsruden.
- Vælg den model, du lige har trænet (
sample_fraud_detection_model
), vælg derefter 1.0. Dette er den version, som Amazon Fraud Detector er lavet af din model. - Gennemgå Model ydeevne samlet score og alle andre målinger, som Amazon Fraud Detector genererede for denne model.
Implementer modellen
Når du har gennemgået præstationsmålingerne for din trænede model og er klar til at bruge den, genererer forudsigelser om svindel, kan du implementere modellen:
- På Amazon Fraud Detector-konsollen skal du vælge Modeller i navigationsruden.
- Vælg model
sample_fraud_detection_model
, og vælg derefter den specifikke modelversion, du vil implementere. For dette indlæg, vælg 1.0. - På Modelversion side, på handlinger menu, vælg Implementer modelversion.
På Modelversioner side, den Status viser status for implementeringen. Status ændres til Aktiv når implementeringen er færdig. Dette indikerer, at modelversionen er aktiveret og tilgængelig til at generere svindelforudsigelser.
Lav en detektor
Efter du har implementeret modellen, bygger du en detektor til docfraud
hændelsestype og tilføje den implementerede model. Udfør følgende trin:
- På Amazon Fraud Detector-konsollen skal du vælge Detektorer i navigationsruden.
- Vælg Opret detektor.
- På Definer detektordetaljer side, indtast
fraud_detector
for detektornavnet, og indtast eventuelt en beskrivelse af detektoren, såsom min prøvesvindeldetektor. - Til Hændelsestype, vælg
docfraud
. Dette er den begivenhed, du oprettede tidligere. - Vælg Næste.
Tilføj regler til fortolkning
Når du har oprettet Amazon Fraud Detector-modellen, kan du bruge Amazon Fraud Detector-konsollen eller applikationsprogrammeringsgrænsefladen (API) til at definere forretningsdrevne regler (betingelser, der fortæller Amazon Fraud Detector, hvordan modellens præstationsscore skal fortolkes, når der evalueres for forudsigelse af svindel) . For at tilpasse sig pantegarantiprocessen kan du oprette regler for at markere realkreditansøgninger i henhold til de risikoniveauer, der er forbundet og kortlagt som svig, legitim, eller hvis der er behov for en gennemgang.
For eksempel vil du måske automatisk afvise realkreditansøgninger med en høj risiko for svindel under hensyntagen til parametre som manipulerede billeder af de nødvendige dokumenter, manglende dokumenter som lønsedler eller indkomstkrav og så videre. På den anden side kan visse applikationer have brug for et menneske i løkken for at træffe effektive beslutninger.
Amazon Fraud Detector bruger den aggregerede værdi (beregnet ved at kombinere et sæt råvariabler) og råværdien (værdien angivet for variablen) til at generere modelscorerne. Modelscorerne kan være mellem 0-1000, hvor 0 angiver lav svindelrisiko og 1000 angiver høj svindelrisiko.
For at tilføje de respektive forretningsdrevne regler skal du udføre følgende trin:
- På Amazon Fraud Detector-konsollen skal du vælge Regler i navigationsruden.
- Vælg Tilføj regel.
- I Definer en regel sektion, indtast svindel for regelnavnet og indtast eventuelt en beskrivelse.
- Til Udtryk, indtast regeludtrykket ved hjælp af Amazon Fraud Detectors forenklede regeludtrykssprog
$docdraud_insightscore >= 900
- Til Resultater, vælg Opret et nyt resultat (Et resultat er resultatet af en svigforudsigelse og returneres, hvis reglen matcher under en evaluering).
- I Opret et nyt resultat sektion, indtast afvisning som resultatnavn og en valgfri beskrivelse.
- Vælg Gem resultatet
- Vælg Tilføj regel for at køre regelvalideringskontrollen og gemme reglen.
- Efter det er oprettet, laver Amazon Fraud Detector følgende
high_risk
regel tilgængelig til brug i din detektor.- Regelnavn:
fraud
- Resultat:
decline
- Ekspression:
$docdraud_insightscore >= 900
- Regelnavn:
- Vælg Tilføj en anden regel, og vælg derefter Opret regel fanen for at tilføje yderligere 2 regler som nedenfor:
- Opret en
low_risk
regel med følgende detaljer:- Regelnavn:
legit
- Resultat:
approve
- Ekspression:
$docdraud_insightscore <= 500
- Regelnavn:
- Opret en
medium_risk
regel med følgende detaljer:- Regelnavn:
review needed
- Resultat:
review
- Ekspression:
$docdraud_insightscore <= 900 and docdraud_insightscore >=500
- Regelnavn:
Disse værdier er eksempler brugt til dette indlæg. Når du opretter regler for din egen detektor, skal du bruge værdier, der passer til din model og brugssituation.
- Når du har oprettet alle tre regler, skal du vælge Næste.
Implementer API'et til at lave forudsigelser
Efter at de regelbaserede handlinger er blevet udløst, kan du implementere en Amazon Fraud Detector API til at evaluere låneansøgningerne og forudsige potentiel svindel. Forudsigelserne kan udføres i en batch eller realtid.
Integrer din SageMaker-model (valgfrit)
Hvis du allerede har en model for opdagelse af bedrageri i SageMaker, kan du integrere den med Amazon Fraud Detector for at få dine foretrukne resultater.
Dette indebærer, at du kan bruge både SageMaker og Amazon Fraud Detector-modeller i din applikation til at opdage forskellige typer svindel. For eksempel kan din applikation bruge Amazon Fraud Detector-modellen til at vurdere svindelrisikoen på kundekonti og samtidig bruge din PageMaker-model til at kontrollere, om der er risiko for kontokompromis.
Ryd op
For at undgå at pådrage sig fremtidige gebyrer skal du slette de ressourcer, der er oprettet til løsningen, inklusive følgende:
- S3 spand
- Amazon Fraud Detector-endepunkt
Konklusion
Dette indlæg ledte dig gennem en automatiseret og skræddersyet løsning til at opdage bedrageri i realkreditlånsprocessen. Denne løsning giver dig mulighed for at opdage svigagtige forsøg tættere på tidspunktet for bedrageri og hjælper forsikringsgivere med en effektiv beslutningsproces. Ydermere giver fleksibiliteten i implementeringen dig mulighed for at definere forretningsdrevne regler for at klassificere og indfange de svigagtige forsøg tilpasset specifikke forretningsbehov.
For mere information om at bygge en ende-til-ende løsning til opdagelse af svindel med pantebreve henvises til del 1 , del 2 i denne serie.
Om forfatterne
Anup Ravindranath er en Senior Solutions Architect hos Amazon Web Services (AWS) med base i Toronto, Canada, og arbejder med Financial Services-organisationer. Han hjælper kunder med at transformere deres forretninger og innovere på cloud.
Vinnie Saini er Senior Solutions Architect hos Amazon Web Services (AWS) baseret i Toronto, Canada. Hun har hjulpet Financial Services-kunder med at transformere sig i skyen med AI- og ML-drevne løsninger, der er lagt på stærke grundpiller i Architectural Excellence.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
- PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
- PlatoESG. Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
- PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/automate-mortgage-document-fraud-detection-using-an-ml-model-and-business-defined-rules-with-amazon-fraud-detector-part-3/
- :har
- :er
- :ikke
- :hvor
- $OP
- 100
- 15 %
- 7
- 900
- a
- Om
- acceptabel
- adgang
- Ifølge
- Konto
- Konti
- aktioner
- aktiviteter
- aktivitet
- tilføje
- Yderligere
- Derudover
- Efter
- AI
- tilpasse
- Alle
- tillader
- allerede
- Amazon
- Amazon svindeldetektor
- Amazon Web Services
- Amazon Web Services (AWS)
- an
- ,
- En anden
- enhver
- api
- Anvendelse
- applikationer
- tilgang
- passende
- cirka
- arkitektonisk
- arkitektur
- ER
- AS
- vurdere
- forbundet
- At
- Forsøg på
- automatisere
- Automatiseret
- automatisk
- til rådighed
- undgå
- AWS
- baseret
- BE
- været
- før
- begynder
- jf. nedenstående
- mellem
- både
- bygge
- Bygning
- indbygget
- virksomhed
- virksomheder
- men
- .
- by
- beregnet
- kaldet
- CAN
- Canada
- fange
- tilfælde
- vis
- Ændringer
- afgifter
- Chart
- kontrollere
- afkrydset
- Vælg
- klassificering
- Klassificere
- klik
- tættere
- Cloud
- Kolonne
- kombinerer
- fuldføre
- komponent
- kompromis
- computer
- Computer Vision
- konceptuelle
- betingelser
- forvirring
- Overvejer
- Konsol
- svarer
- dækker
- skabe
- oprettet
- skaber
- skik
- kunde
- Kunder
- tilpassede
- data
- beslutning
- Beslutningstagning
- afgørelser
- Afvis
- dyb
- Standard
- definere
- definere
- demonstrerer
- indsætte
- indsat
- implementering
- beskrivelse
- detaljer
- opdage
- Detektion
- udvikle
- diagram
- forskellige
- drøftet
- fordeling
- dokumentet
- dokumenter
- drevet
- i løbet af
- hver
- tidligere
- Effektiv
- elementer
- ende til ende
- Engine (Motor)
- Indtast
- enhed
- evaluere
- evaluere
- evaluering
- begivenhed
- begivenheder
- eksempel
- eksempler
- Excellence
- udtryk
- File (Felt)
- Filer
- finansielle
- finansielle tjenesteydelser
- Fleksibilitet
- efter
- følger
- Til
- smedet
- format
- grundlæggende
- bedrageri
- bedrageri afsløring
- svigagtig
- fra
- fuldt ud
- fremtiden
- generere
- genereret
- hånd
- Have
- he
- headers
- hjælpe
- hjælper
- Høj
- Fremhæv
- stærkt
- historisk
- Hvordan
- How To
- http
- HTTPS
- menneskelig
- identificere
- if
- billeder
- implementering
- Forbedre
- forbedring
- in
- Herunder
- Indkomst
- forkert
- angiver
- oplysninger
- indledt
- innovere
- indgange
- integrere
- grænseflade
- involverer
- IT
- jpg
- lige
- Holde
- etiket
- Etiketter
- grim
- Sprog
- læring
- mindst
- Forlade
- legitim
- udlån
- niveauer
- ligesom
- logik
- Lav
- maskine
- machine learning
- lave
- maerker
- Making
- lykkedes
- mange
- tændstikker
- Matrix
- modne
- Kan..
- Metrics
- minutter
- mangler
- ML
- model
- modeller
- måned
- mere
- Pant
- skal
- my
- navn
- Navigation
- Behov
- behov
- behov
- Ny
- næste
- nu
- objektiv
- Hændelse
- of
- Gammel
- on
- Indstillinger
- or
- organisationer
- Andet
- vores
- Resultat
- udgange
- samlet
- egen
- side
- brød
- parametre
- del
- sti
- ydeevne
- udføres
- Tilladelser
- søjler
- pipeline
- plato
- Platon Data Intelligence
- PlatoData
- Indlæg
- potentiale
- forudsige
- forudsigelse
- Forudsigelser
- foretrækkes
- forberedt
- forudsætning
- præsentere
- forelagt
- behandle
- Profil
- Programmering
- give
- forudsat
- giver
- Raw
- klar
- ægte
- realtid
- nylige
- anbefales
- henvise
- region
- repræsentere
- repræsenterer
- påkrævet
- Krav
- Ressourcer
- dem
- resultere
- Resultater
- gennemgå
- revideret
- Risiko
- roller
- Herske
- regler
- Kør
- sagemaker
- prøve
- Gem
- gemt
- Scale
- score
- Anden
- Sektion
- se
- valgt
- valg
- senior
- Series
- tjeneste
- Tjenester
- sæt
- indstilling
- indstillinger
- hun
- Shows
- lignende
- Simpelt
- samtidigt
- So
- løsninger
- Løsninger
- specifikke
- Stage
- Status
- Trin
- Steps
- opbevaring
- opbevaret
- stærk
- sådan
- Understøttet
- taget
- tager
- fortælle
- at
- deres
- derefter
- Disse
- Tredje
- denne
- tre
- Gennem
- tid
- til
- også
- værktøjer
- toronto
- mod
- Tog
- uddannet
- Kurser
- Transform
- udløst
- typen
- typer
- tegningsgaranti
- uploadet
- Uploading
- brug
- brug tilfælde
- anvendte
- bruger
- ved brug af
- validering
- værdi
- Værdier
- variabel
- forskellige
- udgave
- versioner
- Specifikation
- vision
- gik
- ønsker
- var
- we
- web
- webservices
- hvornår
- som
- mens
- vilje
- med
- arbejdsgange
- arbejder
- Du
- Din
- zephyrnet