på første innlegg av denne tredelte serien, presenterte vi en løsning som demonstrerer hvordan du kan automatisere oppdagelse av dokumentmanipulering og svindel i stor skala ved å bruke AWS AI og maskinlæringstjenester (ML) for en boliglånsgaranti.
på andre innlegg, diskuterte vi en tilnærming for å utvikle en dyp læringsbasert datasynsmodell for å oppdage og fremheve forfalskede bilder i boliglånsforsikring.
I dette innlegget presenterer vi en løsning for å automatisere oppdagelse av svindel med pantelån ved å bruke en ML-modell og forretningsdefinerte regler med Amazon-svindeldetektor.
Løsningsoversikt
Vi bruker Amazon Fraud Detector, en fullstendig administrert svindeldeteksjonstjeneste, for å automatisere oppdagelsen av uredelige aktiviteter. Med et mål om å forbedre prediksjonsnøyaktighetene ved å proaktivt identifisere dokumentsvindel, samtidig som forsikringsnøyaktighetene forbedres, hjelper Amazon Fraud Detector deg med å bygge tilpassede modeller for svindeldeteksjon ved å bruke et historisk datasett, konfigurere tilpasset beslutningslogikk ved hjelp av den innebygde regelmotoren og orkestrere risikobeslutninger arbeidsflyter med et klikk på en knapp.
Følgende diagram representerer hvert trinn i en pipeline for oppdagelse av svindel med pantelån.
Vi vil nå dekke den tredje komponenten i pipeline for oppdagelse av svindel med pantelån. Trinnene for å distribuere denne komponenten er som følger:
- Last opp historiske data til Amazon enkel lagringstjeneste (Amazon S3).
- Velg alternativene dine og tren modellen.
- Lag modellen.
- Gjennomgå modellens ytelse.
- Implementere modellen.
- Lag en detektor.
- Legg til regler for å tolke modellpoeng.
- Distribuer API for å lage spådommer.
Forutsetninger
Følgende er nødvendige trinn for denne løsningen:
- Registrer deg for en AWS-konto.
- Sett opp tillatelser som lar AWS-kontoen din få tilgang til Amazon Fraud Detector.
- Samle inn de historiske svindeldataene som skal brukes til å trene svindeldetektormodellen, med følgende krav:
- Data må være i CSV-format og ha overskrifter.
- To overskrifter kreves:
EVENT_TIMESTAMP
ogEVENT_LABEL
. - Data må ligge i Amazon S3 i en AWS-region som støttes av tjenesten.
- Det anbefales sterkt å kjøre en dataprofil før du trener (bruk en automatisert dataprofiler for Amazon Fraud Detector).
- Det anbefales å bruke minst 3–6 måneder med data.
- Det tar tid før svindel modnes; data som er 1–3 måneder gamle anbefales (ikke for nylig).
- Noen NULL-er og manglende verdier er akseptable (men for mange og variabelen ignoreres, som diskutert i Manglende eller feil variabeltype).
Last opp historiske data til Amazon S3
Etter at du har de tilpassede historiske datafilene for å trene en svindeldetektormodell, oppretter du en S3-bøtte og laster opp dataene til bøtten.
Velg alternativer og tren modellen
Det neste trinnet mot å bygge og trene en svindeldetektormodell er å definere forretningsaktiviteten (hendelsen) som skal evalueres for svindelen. Å definere en hendelse innebærer å angi variablene i datasettet ditt, en enhet som starter hendelsen og etikettene som klassifiserer hendelsen.
Fullfør følgende trinn for å definere en dokumentsvindelhendelse for å oppdage dokumentsvindel, som er initiert av enhetens søkerpant, med henvisning til en ny boliglånssøknad:
- Velg på Amazon Fraud Detector-konsollen hendelser i navigasjonsruten.
- Velg Opprett.
- Under Hendelsestypedetaljer, Tast inn
docfraud
som hendelsestypenavn, og skriv eventuelt inn en beskrivelse av hendelsen. - Velg Opprett entitet.
- På Opprett entitet side, skriv inn
applicant_mortgage
som enhetstypenavn, og skriv eventuelt inn en beskrivelse av enhetstypen. - Velg Opprett entitet.
- Under HendelsesvariablerFor Velg hvordan du vil definere denne hendelsens variabler, velg Velg variabler fra et treningsdatasett.
- Til IAM-rolle, velg Lag IAM-rolle.
- På Lag IAM-rolle side, skriv inn navnet på S3-bøtten med eksempeldataene dine og velg Skape rolle.
- Til Dataplassering, skriv inn banen til dine historiske data. Dette er S3 URI-banen du lagret etter å ha lastet opp de historiske dataene. Stien er lik
S3://your-bucket-name/example dataset filename.csv
. - Velg Last opp.
Variabler representerer dataelementer du vil bruke i en svindelprediksjon. Disse variablene kan hentes fra hendelsesdatasettet du forberedte for opplæring av modellen din, fra Amazon Fraud Detector-modellens risikopoengutdata, eller fra Amazon SageMaker modeller. For mer informasjon om variabler hentet fra hendelsesdatasettet, se Få hendelsesdatasettkrav ved å bruke datamodellutforskeren.
- Under Etiketter – valgfrittFor etiketter, velg Opprett nye etiketter.
- På Lag etikett side, skriv inn
fraud
som navnet. Denne etiketten tilsvarer verdien som representerer den falske lånesøknaden i eksempeldatasettet. - Velg Lag etikett.
- Lag en andre etikett kalt
legit
. Denne etiketten tilsvarer verdien som representerer den legitime lånesøknaden i eksempeldatasettet. - Velg Opprett hendelsestype.
Følgende skjermbilde viser vår hendelsestypedetaljer.
Følgende skjermbilde viser variablene våre.
Følgende skjermbilde viser etikettene våre.
Lag modellen
Etter at du har lastet inn de historiske dataene og valgt de nødvendige alternativene for å trene en modell, fullfører du følgende trinn for å lage en modell:
- Velg på Amazon Fraud Detector-konsollen Modeller i navigasjonsruten.
- Velg Legg til modell, og velg deretter Lag modell.
- På Definer modelldetaljer side, skriv inn
mortgage_fraud_detection_model
som modellens navn og en valgfri beskrivelse av modellen. - Til Modell type, Velg Online svindelinnsikt modell.
- Til Arrangementstype, velg
docfraud
. Dette er hendelsestypen du opprettet tidligere. - på Historiske hendelsesdata oppgi følgende informasjon:
- Til Hendelsesdatakilde, velg Hendelsesdata lagret lastet opp til S3 (eller AFD).
- Til IAM-rolle, velg rollen du opprettet tidligere.
- Til Treningsdataplassering, skriv inn S3 URI-banen til eksempeldatafilen.
- Velg neste.
- på Modellinnganger la alle avmerkingsbokser være merket av. Som standard bruker Amazon Fraud Detector alle variabler fra ditt historiske hendelsesdatasett som modellinndata.
- på Etikettklassifisering seksjon, for Svindeletiketter, velg
fraud
, som tilsvarer verdien som representerer uredelige hendelser i eksempeldatasettet. - Til Legitime etiketter, velg
legit
, som tilsvarer verdien som representerer legitime hendelser i eksempeldatasettet. - Til Umerkede hendelser, behold standardvalget Ignorer hendelser uten etikett for dette eksempeldatasettet.
- Velg neste.
- Se gjennom innstillingene dine, og velg deretter Lage og trene modell.
Amazon Fraud Detector lager en modell og begynner å trene opp en ny versjon av modellen.
På Modellversjoner side, status kolonnen indikerer status for modelltrening. Modellopplæring som bruker eksempeldatasettet tar omtrent 45 minutter å fullføre. Status endres til Klar til distribusjon etter at modellopplæringen er fullført.
Gjennomgå modellens ytelse
Etter at modellopplæringen er fullført, validerer Amazon Fraud Detector modellytelsen ved å bruke 15 % av dataene dine som ikke ble brukt til å trene modellen, og tilbyr ulike verktøy, inkludert et poengfordelingsdiagram og forvirringsmatrise, for å vurdere modellens ytelse.
For å se modellens ytelse, fullfør følgende trinn:
- Velg på Amazon Fraud Detector-konsollen Modeller i navigasjonsruten.
- Velg modellen du nettopp har trent (
sample_fraud_detection_model
), og velg deretter 1.0. Dette er versjonen Amazon Fraud Detector laget av modellen din. - Gjennomgå Modellytelse samlet poengsum og alle andre beregninger som Amazon Fraud Detector genererte for denne modellen.
Distribuer modellen
Etter at du har gjennomgått ytelsesberegningene til den trente modellen din og er klar til å bruke den genererer svindelforutsigelser, kan du distribuere modellen:
- Velg på Amazon Fraud Detector-konsollen Modeller i navigasjonsruten.
- Velg modell
sample_fraud_detection_model
, og velg deretter den spesifikke modellversjonen du vil distribuere. For dette innlegget, velg 1.0. - På Modellversjon side, på handlinger meny, velg Distribuer modellversjon.
På Modellversjoner side, status viser statusen til distribusjonen. Status endres til Aktiv når distribusjonen er fullført. Dette indikerer at modellversjonen er aktivert og tilgjengelig for å generere svindelforutsigelser.
Lag en detektor
Etter at du har distribuert modellen, bygger du en detektor for docfraud
hendelsestype og legg til den distribuerte modellen. Fullfør følgende trinn:
- Velg på Amazon Fraud Detector-konsollen detektorer i navigasjonsruten.
- Velg Lag detektor.
- På Definer detektordetaljer side, skriv inn
fraud_detector
for detektornavnet, og skriv eventuelt inn en beskrivelse for detektoren, for eksempel min prøvesvindeldetektor. - Til Arrangementstype, velg
docfraud
. Dette er hendelsen du opprettet tidligere. - Velg neste.
Legg til regler for å tolke
Etter at du har opprettet Amazon Fraud Detector-modellen, kan du bruke Amazon Fraud Detector-konsollen eller applikasjonsprogrammeringsgrensesnittet (API) for å definere forretningsdrevne regler (betingelser som forteller Amazon Fraud Detector hvordan man tolker modellytelsespoeng når man evaluerer for svindelprediksjon) . For å samsvare med pantegarantiprosessen, kan du lage regler for å flagge boliglånsøknader i henhold til risikonivåene som er knyttet til og kartlagt som svindel, legitimt eller hvis det er behov for en gjennomgang.
For eksempel vil du kanskje automatisk avslå søknader om boliglån med høy risiko for svindel, med tanke på parametere som tuklet bilder av de nødvendige dokumentene, manglende dokumenter som lønnsslipper eller inntektskrav, og så videre. På den annen side kan enkelte applikasjoner trenge et menneske i løkken for å ta effektive beslutninger.
Amazon Fraud Detector bruker den aggregerte verdien (beregnet ved å kombinere et sett med råvariabler) og råverdien (verdien gitt for variabelen) for å generere modellskårene. Modellskårene kan være mellom 0–1000, der 0 indikerer lav svindelrisiko og 1000 indikerer høy svindelrisiko.
For å legge til de respektive forretningsdrevne reglene, fullfør følgende trinn:
- Velg på Amazon Fraud Detector-konsollen Regler i navigasjonsruten.
- Velg Legg til regel.
- på Definer en regel seksjon, skriv inn svindel for regelnavnet, og eventuelt skriv inn en beskrivelse.
- Til Uttrykk, skriv inn regeluttrykket ved å bruke Amazon Fraud Detectors forenklede regeluttrykksspråk
$docdraud_insightscore >= 900
- Til Resultater, velg Lag et nytt resultat (Et utfall er resultatet fra en svindelprediksjon og returneres hvis regelen samsvarer under en evaluering.)
- på Lag et nytt resultat seksjon, skriv inn avvisning som resultatnavn og en valgfri beskrivelse.
- Velg Lagre resultatet
- Velg Legg til regel for å kjøre regelvalideringskontrollen og lagre regelen.
- Etter at den er opprettet, lager Amazon Fraud Detector følgende
high_risk
regel tilgjengelig for bruk i detektoren din.- Regelnavn:
fraud
- Utfall:
decline
- Uttrykk:
$docdraud_insightscore >= 900
- Regelnavn:
- Velg Legg til en annen regel, og velg deretter Lag regel fanen for å legge til ytterligere 2 regler som nedenfor:
- Lag en
low_risk
regel med følgende detaljer:- Regelnavn:
legit
- Utfall:
approve
- Uttrykk:
$docdraud_insightscore <= 500
- Regelnavn:
- Lag en
medium_risk
regel med følgende detaljer:- Regelnavn:
review needed
- Utfall:
review
- Uttrykk:
$docdraud_insightscore <= 900 and docdraud_insightscore >=500
- Regelnavn:
Disse verdiene er eksempler brukt for dette innlegget. Når du lager regler for din egen detektor, bruk verdier som passer for din modell og brukstilfelle.
- Etter at du har laget alle tre reglene, velg neste.
Distribuer API for å lage spådommer
Etter at de regelbaserte handlingene er utløst, kan du distribuere en Amazon Fraud Detector API for å evaluere lånesøknadene og forutsi potensiell svindel. Forutsigelsene kan utføres i en batch eller sanntid.
Integrer SageMaker-modellen din (valgfritt)
Hvis du allerede har en svindeldeteksjonsmodell i SageMaker, kan du integrere den med Amazon Fraud Detector for dine foretrukne resultater.
Dette innebærer at du kan bruke både SageMaker og Amazon Fraud Detector-modeller i applikasjonen din for å oppdage ulike typer svindel. For eksempel kan applikasjonen din bruke Amazon Fraud Detector-modellen for å vurdere svindelrisikoen for kundekontoer, og samtidig bruke PageMaker-modellen din for å se etter risiko for kontokompromittering.
Rydd opp
For å unngå å pådra seg fremtidige kostnader, slett ressursene som er opprettet for løsningen, inkludert følgende:
- S3 bøtte
- Amazon Fraud Detector-endepunkt
konklusjonen
Dette innlegget ledet deg gjennom en automatisert og tilpasset løsning for å oppdage svindel i boliglånsprosessen. Denne løsningen lar deg oppdage svindelforsøk nærmere tidspunktet for svindel og hjelper underwriters med en effektiv beslutningsprosess. I tillegg lar fleksibiliteten til implementeringen deg definere forretningsdrevne regler for å klassifisere og fange opp svindelforsøkene tilpasset spesifikke forretningsbehov.
For mer informasjon om å bygge en ende-til-ende løsning for oppdagelse av svindel med pantelån, se Del 1 og Del 2 i denne serien.
Om forfatterne
Anup Ravindranath er Senior Solutions Architect hos Amazon Web Services (AWS) med base i Toronto, Canada og jobber med Financial Services-organisasjoner. Han hjelper kunder med å transformere virksomhetene sine og innovere på skyen.
Vinnie Saini er Senior Solutions Architect hos Amazon Web Services (AWS) med base i Toronto, Canada. Hun har hjulpet Financial Services-kunder med å transformere seg på skyen, med AI- og ML-drevne løsninger lagt på sterke grunnpilarer for Architectural Excellence.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
- PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
- PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
- PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/automate-mortgage-document-fraud-detection-using-an-ml-model-and-business-defined-rules-with-amazon-fraud-detector-part-3/
- : har
- :er
- :ikke
- :hvor
- $OPP
- 100
- 15%
- 7
- 900
- a
- Om oss
- akseptabelt
- adgang
- Ifølge
- Logg inn
- kontoer
- handlinger
- Aktiviteter
- aktivitet
- legge til
- Ytterligere
- I tillegg
- Etter
- AI
- justere
- Alle
- tillater
- allerede
- Amazon
- Amazon-svindeldetektor
- Amazon Web Services
- Amazon Web Services (AWS)
- an
- og
- En annen
- noen
- api
- Søknad
- søknader
- tilnærming
- hensiktsmessig
- ca
- arkitektonisk
- arkitektur
- ER
- AS
- vurdere
- assosiert
- At
- forsøk
- automatisere
- Automatisert
- automatisk
- tilgjengelig
- unngå
- AWS
- basert
- BE
- vært
- før du
- begynner
- under
- mellom
- både
- bygge
- Bygning
- innebygd
- virksomhet
- bedrifter
- men
- knapp
- by
- beregnet
- som heter
- CAN
- Canada
- fangst
- saken
- viss
- Endringer
- avgifter
- Figur
- sjekk
- sjekket
- Velg
- klassifisering
- Klassifisere
- klikk
- nærmere
- Cloud
- Kolonne
- kombinere
- fullføre
- komponent
- kompromiss
- datamaskin
- Datamaskin syn
- konseptuelle
- forhold
- forvirring
- vurderer
- Konsoll
- tilsvarer
- dekker
- skape
- opprettet
- skaper
- skikk
- kunde
- Kunder
- tilpasset
- dato
- avgjørelse
- Beslutningstaking
- avgjørelser
- Avslå
- dyp
- Misligholde
- definere
- definere
- demonstrerer
- utplassere
- utplassert
- distribusjon
- beskrivelse
- detaljer
- oppdage
- Gjenkjenning
- utvikle
- diagram
- forskjellig
- diskutert
- distribusjon
- dokument
- dokumenter
- drevet
- under
- hver enkelt
- Tidligere
- Effektiv
- elementer
- ende til ende
- Motor
- Enter
- enhet
- evaluere
- evaluere
- evaluering
- Event
- hendelser
- eksempel
- eksempler
- Excellence
- uttrykk
- filet
- Filer
- finansiell
- finansielle tjenester
- fleksibilitet
- etter
- følger
- Til
- smidd
- format
- grunn
- svindel
- svindeloppdagelse
- uredelig
- fra
- fullt
- framtid
- generere
- generert
- hånd
- Ha
- he
- overskrifter
- hjelpe
- hjelper
- Høy
- Uthev
- svært
- historisk
- Hvordan
- Hvordan
- http
- HTTPS
- menneskelig
- identifisering
- if
- bilder
- gjennomføring
- forbedre
- bedre
- in
- Inkludert
- Inntekt
- feil
- indikerer
- informasjon
- initiert
- innovere
- innganger
- integrere
- Interface
- innebærer
- IT
- jpg
- bare
- Hold
- Etiketten
- etiketter
- laid
- Språk
- læring
- minst
- Permisjon
- legitim
- utlån
- nivåer
- i likhet med
- logikk
- Lav
- maskin
- maskinlæring
- gjøre
- GJØR AT
- Making
- fikk til
- mange
- fyrstikker
- Matrix
- moden
- Kan..
- Metrics
- minutter
- mangler
- ML
- modell
- modeller
- måneder
- mer
- Boliglån
- må
- my
- navn
- Navigasjon
- Trenger
- nødvendig
- behov
- Ny
- neste
- nå
- Målet
- forekomst
- of
- Gammel
- on
- alternativer
- or
- organisasjoner
- Annen
- vår
- Utfallet
- utganger
- samlet
- egen
- side
- brød
- parametere
- del
- banen
- ytelse
- utført
- tillatelser
- søyler
- rørledning
- plato
- Platon Data Intelligence
- PlatonData
- Post
- potensiell
- forutsi
- prediksjon
- Spådommer
- trekkes
- forberedt
- forutsetning
- presentere
- presentert
- prosess
- Profil
- Programmering
- gi
- forutsatt
- gir
- Raw
- klar
- ekte
- sanntids
- nylig
- anbefales
- referere
- region
- representere
- representerer
- påkrevd
- Krav
- Ressurser
- de
- resultere
- Resultater
- anmeldelse
- anmeldt
- Risiko
- Rolle
- Regel
- regler
- Kjør
- sagemaker
- sample
- Spar
- lagret
- Skala
- Resultat
- Sekund
- Seksjon
- se
- valgt
- utvalg
- senior
- Serien
- tjeneste
- Tjenester
- sett
- innstilling
- innstillinger
- hun
- Viser
- lignende
- Enkelt
- samtidig
- So
- løsning
- Solutions
- spesifikk
- Scene
- status
- Trinn
- Steps
- lagring
- lagret
- sterk
- slik
- Støttes
- tatt
- tar
- fortelle
- Det
- De
- deres
- deretter
- Disse
- Tredje
- denne
- tre
- Gjennom
- tid
- til
- også
- verktøy
- toronto
- mot
- Tog
- trent
- Kurs
- Transform
- utløst
- typen
- typer
- writing
- lastet opp
- Opplasting
- bruke
- bruk sak
- brukt
- bruker
- ved hjelp av
- validering
- verdi
- Verdier
- variabel
- ulike
- versjon
- versjoner
- Se
- syn
- gikk
- ønsker
- var
- we
- web
- webtjenester
- når
- hvilken
- mens
- vil
- med
- arbeidsflyt
- arbeid
- Du
- Din
- zephyrnet