Automatiser oppdagelse av svindel med boliglån ved hjelp av en ML-modell og forretningsdefinerte regler med Amazon-svindeldetektor: Del 3

Publisert av Platon

Følgere: 0

på første innlegg av denne tredelte serien, presenterte vi en løsning som demonstrerer hvordan du kan automatisere oppdagelse av dokumentmanipulering og svindel i stor skala ved å bruke AWS AI og maskinlæringstjenester (ML) for en boliglånsgaranti.

på andre innlegg, diskuterte vi en tilnærming for å utvikle en dyp læringsbasert datasynsmodell for å oppdage og fremheve forfalskede bilder i boliglånsforsikring.

I dette innlegget presenterer vi en løsning for å automatisere oppdagelse av svindel med pantelån ved å bruke en ML-modell og forretningsdefinerte regler med Amazon-svindeldetektor.

Løsningsoversikt

Vi bruker Amazon Fraud Detector, en fullstendig administrert svindeldeteksjonstjeneste, for å automatisere oppdagelsen av uredelige aktiviteter. Med et mål om å forbedre prediksjonsnøyaktighetene ved å proaktivt identifisere dokumentsvindel, samtidig som forsikringsnøyaktighetene forbedres, hjelper Amazon Fraud Detector deg med å bygge tilpassede modeller for svindeldeteksjon ved å bruke et historisk datasett, konfigurere tilpasset beslutningslogikk ved hjelp av den innebygde regelmotoren og orkestrere risikobeslutninger arbeidsflyter med et klikk på en knapp.

Følgende diagram representerer hvert trinn i en pipeline for oppdagelse av svindel med pantelån.

Konseptuell arkitektur

Vi vil nå dekke den tredje komponenten i pipeline for oppdagelse av svindel med pantelån. Trinnene for å distribuere denne komponenten er som følger:

Last opp historiske data til Amazon enkel lagringstjeneste (Amazon S3).
Velg alternativene dine og tren modellen.
Lag modellen.
Gjennomgå modellens ytelse.
Implementere modellen.
Lag en detektor.
Legg til regler for å tolke modellpoeng.
Distribuer API for å lage spådommer.

Forutsetninger

Følgende er nødvendige trinn for denne løsningen:

Registrer deg for en AWS-konto.
Sett opp tillatelser som lar AWS-kontoen din få tilgang til Amazon Fraud Detector.
Samle inn de historiske svindeldataene som skal brukes til å trene svindeldetektormodellen, med følgende krav:
1. Data må være i CSV-format og ha overskrifter.
2. To overskrifter kreves: EVENT_TIMESTAMP og EVENT_LABEL.
3. Data må ligge i Amazon S3 i en AWS-region som støttes av tjenesten.
4. Det anbefales sterkt å kjøre en dataprofil før du trener (bruk en automatisert dataprofiler for Amazon Fraud Detector).
5. Det anbefales å bruke minst 3–6 måneder med data.
6. Det tar tid før svindel modnes; data som er 1–3 måneder gamle anbefales (ikke for nylig).
7. Noen NULL-er og manglende verdier er akseptable (men for mange og variabelen ignoreres, som diskutert i Manglende eller feil variabeltype).

Last opp historiske data til Amazon S3

Etter at du har de tilpassede historiske datafilene for å trene en svindeldetektormodell, oppretter du en S3-bøtte og laster opp dataene til bøtten.

Velg alternativer og tren modellen

Det neste trinnet mot å bygge og trene en svindeldetektormodell er å definere forretningsaktiviteten (hendelsen) som skal evalueres for svindelen. Å definere en hendelse innebærer å angi variablene i datasettet ditt, en enhet som starter hendelsen og etikettene som klassifiserer hendelsen.

Fullfør følgende trinn for å definere en dokumentsvindelhendelse for å oppdage dokumentsvindel, som er initiert av enhetens søkerpant, med henvisning til en ny boliglånssøknad:

Velg på Amazon Fraud Detector-konsollen hendelser i navigasjonsruten.
Velg Opprett.
Under Hendelsestypedetaljer, Tast inn docfraud som hendelsestypenavn, og skriv eventuelt inn en beskrivelse av hendelsen.
Velg Opprett entitet.
På Opprett entitet side, skriv inn applicant_mortgage som enhetstypenavn, og skriv eventuelt inn en beskrivelse av enhetstypen.
Velg Opprett entitet.
Under HendelsesvariablerFor Velg hvordan du vil definere denne hendelsens variabler, velg Velg variabler fra et treningsdatasett.
Til IAM-rolle, velg Lag IAM-rolle.
På Lag IAM-rolle side, skriv inn navnet på S3-bøtten med eksempeldataene dine og velg Skape rolle.
Til Dataplassering, skriv inn banen til dine historiske data. Dette er S3 URI-banen du lagret etter å ha lastet opp de historiske dataene. Stien er lik S3://your-bucket-name/example dataset filename.csv.
Velg Last opp.

Variabler representerer dataelementer du vil bruke i en svindelprediksjon. Disse variablene kan hentes fra hendelsesdatasettet du forberedte for opplæring av modellen din, fra Amazon Fraud Detector-modellens risikopoengutdata, eller fra Amazon SageMaker modeller. For mer informasjon om variabler hentet fra hendelsesdatasettet, se Få hendelsesdatasettkrav ved å bruke datamodellutforskeren.

Under Etiketter – valgfrittFor etiketter, velg Opprett nye etiketter.
På Lag etikett side, skriv inn fraud som navnet. Denne etiketten tilsvarer verdien som representerer den falske lånesøknaden i eksempeldatasettet.
Velg Lag etikett.
Lag en andre etikett kalt legit. Denne etiketten tilsvarer verdien som representerer den legitime lånesøknaden i eksempeldatasettet.
Velg Opprett hendelsestype.

Følgende skjermbilde viser vår hendelsestypedetaljer.

Hendelsestypedetaljer

Følgende skjermbilde viser variablene våre.

Modellvariabler

Følgende skjermbilde viser etikettene våre.

etiketter

Lag modellen

Etter at du har lastet inn de historiske dataene og valgt de nødvendige alternativene for å trene en modell, fullfører du følgende trinn for å lage en modell:

Velg på Amazon Fraud Detector-konsollen Modeller i navigasjonsruten.
Velg Legg til modell, og velg deretter Lag modell.
På Definer modelldetaljer side, skriv inn mortgage_fraud_detection_model som modellens navn og en valgfri beskrivelse av modellen.
Til Modell type, Velg Online svindelinnsikt modell.
Til Arrangementstype, velg docfraud. Dette er hendelsestypen du opprettet tidligere.
på Historiske hendelsesdata oppgi følgende informasjon:
1. Til Hendelsesdatakilde, velg Hendelsesdata lagret lastet opp til S3 (eller AFD).
2. Til IAM-rolle, velg rollen du opprettet tidligere.
3. Til Treningsdataplassering, skriv inn S3 URI-banen til eksempeldatafilen.
Velg neste.
på Modellinnganger la alle avmerkingsbokser være merket av. Som standard bruker Amazon Fraud Detector alle variabler fra ditt historiske hendelsesdatasett som modellinndata.
på Etikettklassifisering seksjon, for Svindeletiketter, velg fraud, som tilsvarer verdien som representerer uredelige hendelser i eksempeldatasettet.
Til Legitime etiketter, velg legit, som tilsvarer verdien som representerer legitime hendelser i eksempeldatasettet.
Til Umerkede hendelser, behold standardvalget Ignorer hendelser uten etikett for dette eksempeldatasettet.
Velg neste.
Se gjennom innstillingene dine, og velg deretter Lage og trene modell.

Amazon Fraud Detector lager en modell og begynner å trene opp en ny versjon av modellen.

På Modellversjoner side, status kolonnen indikerer status for modelltrening. Modellopplæring som bruker eksempeldatasettet tar omtrent 45 minutter å fullføre. Status endres til Klar til distribusjon etter at modellopplæringen er fullført.

Gjennomgå modellens ytelse

Etter at modellopplæringen er fullført, validerer Amazon Fraud Detector modellytelsen ved å bruke 15 % av dataene dine som ikke ble brukt til å trene modellen, og tilbyr ulike verktøy, inkludert et poengfordelingsdiagram og forvirringsmatrise, for å vurdere modellens ytelse.

For å se modellens ytelse, fullfør følgende trinn:

Velg på Amazon Fraud Detector-konsollen Modeller i navigasjonsruten.
Velg modellen du nettopp har trent (sample_fraud_detection_model), og velg deretter 1.0. Dette er versjonen Amazon Fraud Detector laget av modellen din.
Gjennomgå Modellytelse samlet poengsum og alle andre beregninger som Amazon Fraud Detector genererte for denne modellen.

Modellytelse

Distribuer modellen

Etter at du har gjennomgått ytelsesberegningene til den trente modellen din og er klar til å bruke den genererer svindelforutsigelser, kan du distribuere modellen:

Velg på Amazon Fraud Detector-konsollen Modeller i navigasjonsruten.
Velg modell sample_fraud_detection_model, og velg deretter den spesifikke modellversjonen du vil distribuere. For dette innlegget, velg 1.0.
På Modellversjon side, på handlinger meny, velg Distribuer modellversjon.

På Modellversjoner side, status viser statusen til distribusjonen. Status endres til Aktiv når distribusjonen er fullført. Dette indikerer at modellversjonen er aktivert og tilgjengelig for å generere svindelforutsigelser.

Lag en detektor

Etter at du har distribuert modellen, bygger du en detektor for docfraud hendelsestype og legg til den distribuerte modellen. Fullfør følgende trinn:

Velg på Amazon Fraud Detector-konsollen detektorer i navigasjonsruten.
Velg Lag detektor.
På Definer detektordetaljer side, skriv inn fraud_detector for detektornavnet, og skriv eventuelt inn en beskrivelse for detektoren, for eksempel min prøvesvindeldetektor.
Til Arrangementstype, velg docfraud. Dette er hendelsen du opprettet tidligere.
Velg neste.

Legg til regler for å tolke

Etter at du har opprettet Amazon Fraud Detector-modellen, kan du bruke Amazon Fraud Detector-konsollen eller applikasjonsprogrammeringsgrensesnittet (API) for å definere forretningsdrevne regler (betingelser som forteller Amazon Fraud Detector hvordan man tolker modellytelsespoeng når man evaluerer for svindelprediksjon) . For å samsvare med pantegarantiprosessen, kan du lage regler for å flagge boliglånsøknader i henhold til risikonivåene som er knyttet til og kartlagt som svindel, legitimt eller hvis det er behov for en gjennomgang.

For eksempel vil du kanskje automatisk avslå søknader om boliglån med høy risiko for svindel, med tanke på parametere som tuklet bilder av de nødvendige dokumentene, manglende dokumenter som lønnsslipper eller inntektskrav, og så videre. På den annen side kan enkelte applikasjoner trenge et menneske i løkken for å ta effektive beslutninger.

Amazon Fraud Detector bruker den aggregerte verdien (beregnet ved å kombinere et sett med råvariabler) og råverdien (verdien gitt for variabelen) for å generere modellskårene. Modellskårene kan være mellom 0–1000, der 0 indikerer lav svindelrisiko og 1000 indikerer høy svindelrisiko.

For å legge til de respektive forretningsdrevne reglene, fullfør følgende trinn:

Velg på Amazon Fraud Detector-konsollen Regler i navigasjonsruten.
Velg Legg til regel.
på Definer en regel seksjon, skriv inn svindel for regelnavnet, og eventuelt skriv inn en beskrivelse.
Til Uttrykk, skriv inn regeluttrykket ved å bruke Amazon Fraud Detectors forenklede regeluttrykksspråk $docdraud_insightscore >= 900
Til Resultater, velg Lag et nytt resultat (Et utfall er resultatet fra en svindelprediksjon og returneres hvis regelen samsvarer under en evaluering.)
på Lag et nytt resultat seksjon, skriv inn avvisning som resultatnavn og en valgfri beskrivelse.
Velg Lagre resultatet
Velg Legg til regel for å kjøre regelvalideringskontrollen og lagre regelen.
Etter at den er opprettet, lager Amazon Fraud Detector følgende high_risk regel tilgjengelig for bruk i detektoren din.
1. Regelnavn: fraud
2. Utfall: decline
3. Uttrykk: $docdraud_insightscore >= 900
Velg Legg til en annen regel, og velg deretter Lag regel fanen for å legge til ytterligere 2 regler som nedenfor:
Lag en low_risk regel med følgende detaljer:
1. Regelnavn: legit
2. Utfall: approve
3. Uttrykk: $docdraud_insightscore <= 500
Lag en medium_risk regel med følgende detaljer:
1. Regelnavn: review needed
2. Utfall: review
3. Uttrykk: $docdraud_insightscore <= 900 and docdraud_insightscore >=500

Disse verdiene er eksempler brukt for dette innlegget. Når du lager regler for din egen detektor, bruk verdier som passer for din modell og brukstilfelle.

Etter at du har laget alle tre reglene, velg neste.

Tilknyttede regler

Distribuer API for å lage spådommer

Etter at de regelbaserte handlingene er utløst, kan du distribuere en Amazon Fraud Detector API for å evaluere lånesøknadene og forutsi potensiell svindel. Forutsigelsene kan utføres i en batch eller sanntid.

Implementer Amazon Fraud Detector API

Integrer SageMaker-modellen din (valgfritt)

Hvis du allerede har en svindeldeteksjonsmodell i SageMaker, kan du integrere den med Amazon Fraud Detector for dine foretrukne resultater.

Dette innebærer at du kan bruke både SageMaker og Amazon Fraud Detector-modeller i applikasjonen din for å oppdage ulike typer svindel. For eksempel kan applikasjonen din bruke Amazon Fraud Detector-modellen for å vurdere svindelrisikoen for kundekontoer, og samtidig bruke PageMaker-modellen din for å se etter risiko for kontokompromittering.

Rydd opp

For å unngå å pådra seg fremtidige kostnader, slett ressursene som er opprettet for løsningen, inkludert følgende:

S3 bøtte
Amazon Fraud Detector-endepunkt

konklusjonen

Dette innlegget ledet deg gjennom en automatisert og tilpasset løsning for å oppdage svindel i boliglånsprosessen. Denne løsningen lar deg oppdage svindelforsøk nærmere tidspunktet for svindel og hjelper underwriters med en effektiv beslutningsprosess. I tillegg lar fleksibiliteten til implementeringen deg definere forretningsdrevne regler for å klassifisere og fange opp svindelforsøkene tilpasset spesifikke forretningsbehov.

For mer informasjon om å bygge en ende-til-ende løsning for oppdagelse av svindel med pantelån, se Del 1 og Del 2 i denne serien.

Om forfatterne

Anup Ravindranath er Senior Solutions Architect hos Amazon Web Services (AWS) med base i Toronto, Canada og jobber med Financial Services-organisasjoner. Han hjelper kunder med å transformere virksomhetene sine og innovere på skyen.

Automatiser svindeloppdagelse av boliglån ved hjelp av en ML-modell og forretningsdefinerte regler med Amazon Fraud Detector: Del 3 | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Vinnie Saini er Senior Solutions Architect hos Amazon Web Services (AWS) med base i Toronto, Canada. Hun har hjulpet Financial Services-kunder med å transformere seg på skyen, med AI- og ML-drevne løsninger lagt på sterke grunnpilarer for Architectural Excellence.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/automate-mortgage-document-fraud-detection-using-an-ml-model-and-business-defined-rules-with-amazon-fraud-detector-part-3/

Tidstempel: Februar 7, 2024

Tidstempel: Oktober 17, 2023

Automatiser svindeloppdagelse av boliglån ved hjelp av en ML-modell og forretningsdefinerte regler med Amazon Fraud Detector: Del 3 | Amazon Web Services

Publisert av Platon

Løsningsoversikt

Forutsetninger

Last opp historiske data til Amazon S3

Velg alternativer og tren modellen

Lag modellen

Gjennomgå modellens ytelse

Distribuer modellen

Lag en detektor

Legg til regler for å tolke

Distribuer API for å lage spådommer

Integrer SageMaker-modellen din (valgfritt)

Rydd opp

konklusjonen

Om forfatterne

Mer fra AWS maskinlæring

Integrer Amazon SageMaker Data Wrangler med MLOps arbeidsflyter

Sikre Amazon SageMaker Studio forhåndsinnstilte URL-er Del 1: Grunnleggende infrastruktur

Fremme funksjonsoppdagelse og gjenbruk på tvers av organisasjonen din ved å bruke Amazon SageMaker Feature Store og dens metadatafunksjon på funksjonsnivå

Intelligent dokumentbehandling med AWS AI-tjenester: Del 2

Kom i gang med Amazon Titan Text Embeddings V2: En ny state-of-the-art innebyggingsmodell på Amazon Bedrock | Amazon Web Services

Visualiser en Amazon Comprehend-analyse med en ordsky i Amazon QuickSight | Amazon Web Services

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn