I första inlägget i den här tredelade serien presenterade vi en lösning som visar hur du kan automatisera upptäckt av dokumentmanipulering och bedrägerier i stor skala med hjälp av AWS AI och maskininlärningstjänster (ML) för ett användningsfall för hypoteksgarantier.
I andra inlägget, diskuterade vi ett tillvägagångssätt för att utveckla en djupinlärningsbaserad datorseendemodell för att upptäcka och lyfta fram förfalskade bilder i hypoteksgarantier.
I det här inlägget presenterar vi en lösning för att automatisera upptäckt av bedrägerier i inteckningsdokument med hjälp av en ML-modell och affärsdefinierade regler med Amazon bedrägeri detektor.
Lösningsöversikt
Vi använder Amazon Fraud Detector, en fullständigt hanterad bedrägeriupptäcktstjänst, för att automatisera upptäckten av bedrägliga aktiviteter. Med en målsättning att förbättra noggrannheten i bedrägeriförutsägelser genom att proaktivt identifiera dokumentbedrägerier, samtidigt som emissionsprecisionen förbättras, hjälper Amazon Fraud Detector dig att bygga skräddarsydda modeller för bedrägeriupptäckt med hjälp av en historisk datauppsättning, konfigurera anpassad beslutslogik med den inbyggda regelmotorn och orkestrera riskbeslut arbetsflöden med ett klick på en knapp.
Följande diagram representerar varje steg i en pipeline för upptäckt av inteckningsdokumentsbedrägerier.
Vi kommer nu att täcka den tredje komponenten i pipelinen för upptäckt av hypoteksdokumentbedrägerier. Stegen för att distribuera den här komponenten är följande:
- Ladda upp historisk data till Amazon enkel lagringstjänst (Amazon S3).
- Välj dina alternativ och träna modellen.
- Skapa modellen.
- Granska modellens prestanda.
- Distribuera modellen.
- Skapa en detektor.
- Lägg till regler för att tolka modellpoäng.
- Distribuera API:et för att göra förutsägelser.
Förutsättningar
Följande är nödvändiga steg för denna lösning:
- Registrera dig för ett AWS-konto.
- Ställ in behörigheter som tillåter ditt AWS-konto att komma åt Amazon Fraud Detector.
- Samla in historiska bedrägeridata som ska användas för att träna bedrägeridetektormodellen, med följande krav:
- Data måste vara i CSV-format och ha rubriker.
- Två rubriker krävs:
EVENT_TIMESTAMP
ochEVENT_LABEL
. - Data måste finnas i Amazon S3 i en AWS-region som stöds av tjänsten.
- Det rekommenderas starkt att köra en dataprofil innan du tränar (använd en automatiserad dataprofilerare för Amazon Fraud Detector).
- Det rekommenderas att använda minst 3–6 månaders data.
- Det tar tid för bedrägerier att mogna; data som är 1–3 månader gamla rekommenderas (inte för färska).
- Vissa NULL-värden och saknade värden är acceptabla (men för många och variabeln ignoreras, som diskuteras i Variabeltyp saknas eller är felaktig).
Ladda upp historisk data till Amazon S3
När du har de anpassade historiska datafilerna för att träna en bedrägeridetektormodell skapar du en S3-hink och laddar upp data till hinken.
Välj alternativ och träna modellen
Nästa steg mot att bygga och utbilda en bedrägeridetektormodell är att definiera den affärsaktivitet (händelse) som ska utvärderas för bedrägeri. Att definiera en händelse innebär att ställa in variablerna i din datauppsättning, en enhet som initierar händelsen och etiketterna som klassificerar händelsen.
Utför följande steg för att definiera en dokumentbedrägerihändelse för att upptäcka dokumentbedrägeri, som initieras av den ansökande enhetens inteckning, med hänvisning till en ny inteckningsansökan:
- Välj på Amazon Fraud Detector-konsolen Händelser i navigeringsfönstret.
- Välja Skapa.
- Enligt Information om händelsetyp, stiga på
docfraud
som händelsetypsnamn och ange eventuellt en beskrivning av händelsen. - Välja Skapa enhet.
- På Skapa enhet sida, ange
applicant_mortgage
som enhetstypsnamn och, valfritt, ange en beskrivning av enhetstypen. - Välja Skapa enhet.
- Enligt Händelsevariabler, För Välj hur du definierar händelsens variablerväljer Välj variabler från ett träningsdataset.
- För IAM-rollväljer Skapa IAM-roll.
- På Skapa IAM-roll sida, ange namnet på S3-hinken med dina exempeldata och välj Skapa roll.
- För Dataläge, ange sökvägen till dina historiska data. Detta är S3 URI-sökvägen som du sparade efter att ha laddat upp historiska data. Vägen liknar
S3://your-bucket-name/example dataset filename.csv
. - Välja Ladda.
Variabler representerar dataelement som du vill använda i en bedrägeriförutsägelse. Dessa variabler kan hämtas från händelsedataset som du förberedde för att träna din modell, från din Amazon Fraud Detector-modells riskpoängresultat, eller från Amazon SageMaker modeller. För mer information om variabler hämtade från händelsedataset, se Hämta krav för händelsedatauppsättningar med hjälp av datamodellutforskaren.
- Enligt Etiketter – valfritt, För Etiketterväljer Skapa nya etiketter.
- På Skapa etikett sida, ange
fraud
som namnet. Denna etikett motsvarar värdet som representerar den bedrägliga inteckningsansökan i exemplets datauppsättning. - Välja Skapa etikett.
- Skapa en andra etikett som heter
legit
. Den här etiketten motsvarar värdet som representerar den legitima låneansökan i exemplets datauppsättning. - Välja Skapa händelsetyp.
Följande skärmdump visar information om vår händelsetyp.
Följande skärmdump visar våra variabler.
Följande skärmdump visar våra etiketter.
Skapa modellen
När du har laddat historiska data och valt de nödvändiga alternativen för att träna en modell, slutför du följande steg för att skapa en modell:
- Välj på Amazon Fraud Detector-konsolen Modeller i navigeringsfönstret.
- Välja Lägg till modell, och välj sedan Skapa modell.
- På Definiera modelldetaljer sida, ange
mortgage_fraud_detection_model
som modellens namn och en valfri beskrivning av modellen. - För Modell typ, Välj den Onlinebedrägeriinsikter modell.
- För Event typväljer
docfraud
. Det här är händelsetypen som du skapade tidigare. - I Historiska händelsedata avsnittet, ge följande information:
- För Händelsedatakällaväljer Händelsedata lagrad laddad upp till S3 (eller AFD).
- För IAM-roll, välj rollen som du skapade tidigare.
- För Plats för träningsdata, ange S3 URI-sökvägen till din exempeldatafil.
- Välja Nästa.
- I Modellingångar lämna alla kryssrutor markerade. Som standard använder Amazon Fraud Detector alla variabler från din historiska händelsedatauppsättning som modellindata.
- I Etikettklassificering avsnitt, för Bedrägerietiketterväljer
fraud
, vilket motsvarar värdet som representerar bedrägliga händelser i exempeldatauppsättningen. - För Legitima etiketterväljer
legit
, vilket motsvarar värdet som representerar legitima händelser i exempeldatauppsättningen. - För Omärkta händelser, behåll standardvalet Ignorera omärkta händelser för denna exempeldatauppsättning.
- Välja Nästa.
- Granska dina inställningar och välj sedan Skapa och träna modell.
Amazon Fraud Detector skapar en modell och börjar träna en ny version av modellen.
På Modellversioner sida, status kolumn anger status för modellträning. Modellträning som använder exempeldatauppsättningen tar cirka 45 minuter att genomföra. Statusen ändras till Redo att distribuera efter att modellutbildningen är klar.
Granska modellens prestanda
Efter att modellutbildningen är klar validerar Amazon Fraud Detector modellens prestanda med hjälp av 15 % av din data som inte användes för att träna modellen och tillhandahåller olika verktyg, inklusive ett poängfördelningsdiagram och förvirringsmatris, för att bedöma modellens prestanda.
Utför följande steg för att se modellens prestanda:
- Välj på Amazon Fraud Detector-konsolen Modeller i navigeringsfönstret.
- Välj den modell som du just tränat (
sample_fraud_detection_model
), sedan Välj 1.0. Detta är versionen av Amazon Fraud Detector som skapats av din modell. - Granska Modellprestanda totalpoäng och alla andra mätvärden som Amazon Fraud Detector genererade för denna modell.
Distribuera modellen
När du har granskat prestandamåtten för din utbildade modell och är redo att använda den genererar bedrägeriförutsägelser kan du distribuera modellen:
- Välj på Amazon Fraud Detector-konsolen Modeller i navigeringsfönstret.
- Välj modell
sample_fraud_detection_model
, och välj sedan den specifika modellversionen som du vill distribuera. För det här inlägget, välj 1.0. - På Modellversion sida, på Handlingar meny, välj Distribuera modellversion.
På Modellversioner sida, status visar status för distributionen. Statusen ändras till Aktiva när distributionen är klar. Detta indikerar att modellversionen är aktiverad och tillgänglig för att generera bedrägeriförutsägelser.
Skapa en detektor
Efter att du har distribuerat modellen bygger du en detektor för docfraud
händelsetyp och lägg till den distribuerade modellen. Slutför följande steg:
- Välj på Amazon Fraud Detector-konsolen Detektorer i navigeringsfönstret.
- Välja Skapa detektor.
- På Definiera detektordetaljer sida, ange
fraud_detector
för detektornamnet och, valfritt, ange en beskrivning för detektorn, till exempel min provdetektor för bedrägeri. - För Händelsetypväljer
docfraud
. Detta är händelsen som du skapade tidigare. - Välja Nästa.
Lägg till regler att tolka
Efter att du har skapat Amazon Fraud Detector-modellen kan du använda Amazon Fraud Detector-konsolen eller applikationsprogrammeringsgränssnittet (API) för att definiera affärsdrivna regler (villkor som talar om för Amazon Fraud Detector hur man tolkar modellresultatet vid utvärdering av bedrägeriförutsägelse) . För att anpassa sig till processen för teckning av bolån kan du skapa regler för att flagga bolåneansökningar enligt de risknivåer som är associerade och kartlagda som bedrägerier, legitima eller om en granskning behövs.
Till exempel kanske du vill automatiskt avvisa bolåneansökningar med en hög risk för bedrägerier, med tanke på parametrar som manipulerade bilder av de nödvändiga dokumenten, saknade dokument som lönebesked eller inkomstkrav och så vidare. Å andra sidan kan vissa applikationer behöva en människa i slingan för att fatta effektiva beslut.
Amazon Fraud Detector använder det aggregerade värdet (beräknat genom att kombinera en uppsättning råvariabler) och råvärdet (värdet som anges för variabeln) för att generera modellpoängen. Modellpoängen kan vara mellan 0–1000, där 0 indikerar låg bedrägeriskisk och 1000 indikerar hög bedrägerisk.
För att lägga till respektive affärsdrivna regler, utför följande steg:
- Välj på Amazon Fraud Detector-konsolen regler i navigeringsfönstret.
- Välja Lägg till regel.
- I Definiera en regel sektion, ange bedrägeri för regelnamnet och, valfritt, ange en beskrivning.
- För Uttryck, ange regeluttrycket med Amazon Fraud Detectors förenklade regeluttrycksspråk
$docdraud_insightscore >= 900
- För Utkomsterväljer Skapa ett nytt resultat (Ett utfall är resultatet av en bedrägeriförutsägelse och returneras om regeln matchar under en utvärdering.)
- I Skapa ett nytt resultat sektion, ange avvisa som resultatnamn och en valfri beskrivning.
- Välja Spara resultatet
- Välja Lägg till regel för att köra regelvalideringskontrollen och spara regeln.
- Efter att den har skapats gör Amazon Fraud Detector följande
high_risk
regel tillgänglig för användning i din detektor.- Regelnamn:
fraud
- Resultat:
decline
- Uttryck:
$docdraud_insightscore >= 900
- Regelnamn:
- Välja Lägg till en annan regeloch välj sedan Skapa regel fliken för att lägga till ytterligare 2 regler enligt nedan:
- Skapa en
low_risk
regel med följande detaljer:- Regelnamn:
legit
- Resultat:
approve
- Uttryck:
$docdraud_insightscore <= 500
- Regelnamn:
- Skapa en
medium_risk
regel med följande detaljer:- Regelnamn:
review needed
- Resultat:
review
- Uttryck:
$docdraud_insightscore <= 900 and docdraud_insightscore >=500
- Regelnamn:
Dessa värden är exempel som används för det här inlägget. När du skapar regler för din egen detektor, använd värden som är lämpliga för din modell och användningsfall.
- När du har skapat alla tre reglerna väljer du Nästa.
Distribuera API:et för att göra förutsägelser
Efter att de regelbaserade åtgärderna har utlösts kan du distribuera ett Amazon Fraud Detector API för att utvärdera låneansökningarna och förutsäga potentiella bedrägerier. Förutsägelserna kan utföras i en batch eller i realtid.
Integrera din SageMaker-modell (valfritt)
Om du redan har en bedrägeriupptäcktsmodell i SageMaker kan du integrera den med Amazon Fraud Detector för dina föredragna resultat.
Detta innebär att du kan använda både SageMaker och Amazon Fraud Detector-modeller i din applikation för att upptäcka olika typer av bedrägerier. Till exempel kan din applikation använda Amazon Fraud Detector-modellen för att bedöma bedrägerisken för kundkonton, och samtidigt använda din PageMaker-modell för att kontrollera om det finns risk för kontokompromiss.
Städa upp
För att undvika framtida avgifter, radera resurserna som skapats för lösningen, inklusive följande:
- S3 hink
- Amazon Fraud Detector slutpunkt
Slutsats
Det här inlägget ledde dig genom en automatiserad och anpassad lösning för att upptäcka bedrägerier i bolånegarantiprocessen. Denna lösning låter dig upptäcka bedrägliga försök närmare tidpunkten för bedrägeri och hjälper försäkringsgivare med en effektiv beslutsprocess. Dessutom tillåter flexibiliteten i implementeringen dig att definiera affärsdrivna regler för att klassificera och fånga de bedrägliga försöken anpassade till specifika affärsbehov.
För mer information om hur du bygger en heltäckande lösning för att upptäcka bedrägerier för inteckningsdokument, se del 1 och del 2 i den här serien.
Om författarna
Anup Ravindranath är en Senior Solutions Architect på Amazon Web Services (AWS) baserad i Toronto, Kanada och arbetar med Financial Services-organisationer. Han hjälper kunder att förändra sina verksamheter och förnya sig i molnet.
Vinnie Saini är Senior Solutions Architect på Amazon Web Services (AWS) baserad i Toronto, Kanada. Hon har hjälpt Financial Services-kunder att förvandla sig till molnet, med AI- och ML-drivna lösningar som ligger på starka grundpelare för Architectural Excellence.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
- PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
- Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
- PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/automate-mortgage-document-fraud-detection-using-an-ml-model-and-business-defined-rules-with-amazon-fraud-detector-part-3/
- : har
- :är
- :inte
- :var
- $UPP
- 100
- 15%
- 7
- 900
- a
- Om Oss
- godtagbart
- tillgång
- Enligt
- Konto
- konton
- åtgärder
- aktiviteter
- aktivitet
- lägga till
- Annat
- Dessutom
- Efter
- AI
- rikta
- Alla
- tillåter
- redan
- amason
- Amazon bedrägeri detektor
- Amazon Web Services
- Amazon Web Services (AWS)
- an
- och
- Annan
- vilken som helst
- api
- Ansökan
- tillämpningar
- tillvägagångssätt
- lämpligt
- cirka
- arkitektoniska
- arkitektur
- ÄR
- AS
- bedöma
- associerad
- At
- Försök
- automatisera
- Automatiserad
- automatiskt
- tillgänglig
- undvika
- AWS
- baserat
- BE
- varit
- innan
- börjar
- nedan
- mellan
- båda
- SLUTRESULTAT
- Byggnad
- inbyggd
- företag
- företag
- men
- Knappen
- by
- beräknat
- kallas
- KAN
- Kanada
- fånga
- Vid
- vissa
- Förändringar
- avgifter
- Diagram
- ta
- kontrollerade
- Välja
- klassificering
- klassificera
- klick
- närmare
- cloud
- Kolumn
- kombinera
- fullborda
- komponent
- kompromiss
- dator
- Datorsyn
- begreppsmässig
- villkor
- förvirring
- med tanke på
- Konsol
- motsvarar
- beläggning
- skapa
- skapas
- skapar
- beställnings
- kund
- Kunder
- kundanpassad
- datum
- Beslutet
- Beslutsfattande
- beslut
- Nedgång
- djup
- Standard
- definiera
- definierande
- demonstrerar
- distribuera
- utplacerade
- utplacering
- beskrivning
- detaljer
- upptäcka
- Detektering
- utveckla
- Diagrammet
- olika
- diskuteras
- fördelning
- dokumentera
- dokument
- driven
- under
- varje
- Tidigare
- Effektiv
- element
- början till slut
- Motor
- ange
- enhet
- utvärdera
- utvärdering
- utvärdering
- händelse
- händelser
- exempel
- exempel
- Excellence
- Uttrycket
- Fil
- Filer
- finansiella
- finansiella tjänster
- Flexibilitet
- efter
- följer
- För
- smidda
- format
- grundläggande
- bedrägeri
- spårning av bedrägerier
- bedräglig
- från
- fullständigt
- framtida
- generera
- genereras
- sidan
- Har
- he
- headers
- hjälpa
- hjälper
- Hög
- Markera
- höggradigt
- historisk
- Hur ser din drömresa ut
- How To
- http
- HTTPS
- humant
- identifiera
- if
- bilder
- genomförande
- förbättra
- förbättra
- in
- Inklusive
- Inkomst
- felaktig
- pekar på
- informationen
- initieras
- förnya
- ingångar
- integrera
- Gränssnitt
- innebär
- IT
- jpg
- bara
- Ha kvar
- etikett
- Etiketter
- laid
- språk
- inlärning
- t minst
- Lämna
- legitim
- utlåning
- nivåer
- tycka om
- Logiken
- Låg
- Maskinen
- maskininlärning
- göra
- GÖR
- Framställning
- förvaltade
- många
- tändstickor
- Matris
- mogen
- Maj..
- Metrics
- minuter
- saknas
- ML
- modell
- modeller
- månader
- mer
- Inteckning
- måste
- my
- namn
- Navigering
- Behöver
- behövs
- behov
- Nya
- Nästa
- nu
- mål
- förekomst
- of
- Gamla
- on
- Tillbehör
- or
- organisationer
- Övriga
- vår
- Resultat
- utgångar
- övergripande
- egen
- sida
- panelen
- parametrar
- del
- bana
- prestanda
- utfört
- behörigheter
- pelare
- rörledning
- plato
- Platon Data Intelligence
- PlatonData
- Inlägg
- potentiell
- förutse
- förutsägelse
- Förutsägelser
- föredragen
- beredd
- förutsättning
- presentera
- presenteras
- process
- Profil
- Programmering
- ge
- förutsatt
- ger
- Raw
- redo
- verklig
- realtid
- senaste
- rekommenderas
- hänvisa
- region
- representerar
- representerar
- Obligatorisk
- Krav
- Resurser
- att
- resultera
- Resultat
- översyn
- Granskad
- Risk
- Roll
- Regel
- regler
- Körning
- sagemaker
- prov
- Save
- sparade
- Skala
- göra
- Andra
- §
- se
- vald
- Val
- senior
- Serier
- service
- Tjänster
- in
- inställning
- inställningar
- hon
- Visar
- liknande
- Enkelt
- samtidigt
- So
- lösning
- Lösningar
- specifik
- Etapp
- status
- Steg
- Steg
- förvaring
- lagras
- stark
- sådana
- Som stöds
- tagen
- tar
- tala
- den där
- Smakämnen
- deras
- sedan
- Dessa
- Tredje
- detta
- tre
- Genom
- tid
- till
- alltför
- verktyg
- toronto
- mot
- Tåg
- tränad
- Utbildning
- Förvandla
- triggas
- Typ
- typer
- writing
- uppladdad
- uppladdning
- användning
- användningsfall
- Begagnade
- användningar
- med hjälp av
- godkännande
- värde
- Värden
- variabel
- olika
- version
- versioner
- utsikt
- syn
- promenerade
- vill
- var
- we
- webb
- webbservice
- när
- som
- medan
- kommer
- med
- arbetsflöden
- arbetssätt
- Om er
- Din
- zephyrnet