Automatize a validação de documentos e a detecção de fraudes no processo de subscrição de hipoteca usando os serviços de IA da AWS: Parte 1 | Amazon Web Services

Automatize a validação de documentos e a detecção de fraudes no processo de subscrição de hipoteca usando os serviços de IA da AWS: Parte 1 | Amazon Web Services

Nesta série de três partes, apresentamos uma solução que demonstra como você pode automatizar a detecção de adulteração e fraude de documentos em grande escala usando AWS AI e serviços de aprendizado de máquina (ML) para um caso de uso de subscrição de hipoteca.

Esta solução acompanha uma onda global mais significativa de fraude hipotecária crescente, que está piorando à medida que mais pessoas apresentam provas fraudulentas para se qualificar para empréstimos. Os dados sugerem que a atividade de hipotecas fraudulentas suspeitas e de alto risco está aumentando, observando um aumento de 52% nas solicitações de hipotecas fraudulentas suspeitas desde 2013. (Fonte: Equifax)

A Parte 1 desta série discute os desafios mais comuns associados ao processo de empréstimo manual. Fornecemos orientações concretas sobre como lidar com esse problema com os serviços de IA e ML da AWS para detectar adulteração de documentos, identificar e categorizar padrões para cenários fraudulentos e integrar-se a regras definidas pela empresa, minimizando a experiência humana para detecção de fraudes.

Na Parte 2, demonstramos como treinar e hospedar um modelo de visão computacional para detecção e localização de violação em Amazon Sage Maker. Na Parte 3, mostramos como automatizar a detecção de fraudes em documentos de hipoteca com um modelo de ML e regras definidas pelo negócio usando Detector de fraude da Amazon.

Desafios associados ao processo de empréstimo manual

As organizações do setor de empréstimos e hipotecas recebem milhares de solicitações, desde novas solicitações de hipoteca até o refinanciamento de uma hipoteca existente. Esses documentos são cada vez mais suscetíveis a fraudes de documentos, pois os fraudadores tentam explorar o sistema e se qualificar para hipotecas de várias maneiras ilegais. Para ser elegível para uma hipoteca, o requerente deve fornecer ao credor documentos que comprovem seu emprego, bens e dívidas. Mudar as regras de empréstimo e as taxas de juros podem alterar drasticamente a acessibilidade de crédito de um solicitante. Os fraudadores variam de novatos desajeitados a mestres quase perfeitos ao criar documentos de solicitação de empréstimo fraudulentos. A papelada fraudulenta inclui, mas não se limita a, alterar ou falsificar holerites, inflar informações sobre renda, deturpar o status do trabalho e falsificar cartas de emprego e outros documentos importantes de subscrição de hipotecas. Essas tentativas de fraude podem ser um desafio para os credores hipotecários capturarem.

Os desafios significativos associados ao processo de empréstimo manual incluem, entre outros:

  • A necessidade de um mutuário visitar a agência
  • Sobrecarga operacional
  • Erros de entrada de dados
  • Automação e tempo de resolução

Finalmente, o processo de subscrição, ou a análise da qualidade de crédito e a decisão do empréstimo, leva mais tempo se for feito manualmente. Novamente, o processo manual de empréstimo ao consumidor tem algumas vantagens, como a aprovação de um empréstimo que requer julgamento humano. A solução fornecerá automação e mitigação de riscos na subscrição de hipotecas, o que ajudará a reduzir o tempo e os custos em comparação com o processo manual.

Visão geral da solução

A validação de documentos é um tipo crítico de entrada para decisões de fraude hipotecária. Compreender o perfil de risco dos documentos hipotecários de suporte e gerar percepções a partir desses dados pode melhorar significativamente as decisões de risco e é fundamental para a estratégia de gerenciamento de fraude de qualquer subscritor.

O diagrama a seguir representa cada estágio em um pipeline de detecção de fraude de documento de hipoteca. Examinamos cada um desses estágios e como eles auxiliam na precisão da subscrição (iniciada com a captura de documentos para classificar e extrair o conteúdo necessário), detectar documentos adulterados e, finalmente, usar um modelo de ML para detectar possíveis fraudes classificadas de acordo com regras orientadas aos negócios.

Arquitetura conceitual

Nas seções a seguir, discutimos as etapas do processo em detalhes.

Classificação de documentos

Com o processamento inteligente de documentos (IDP), podemos processar documentos financeiros automaticamente usando os serviços de IA da AWS, como amazontext e Amazon Comprehend.

Além disso, podemos usar a API Amazon Textract Analyze Lending no processamento de documentos de hipoteca. O Analyze Lending usa modelos de ML pré-treinados para extrair, classificar e validar automaticamente as informações em documentos relacionados a hipotecas com alta velocidade e precisão, reduzindo o erro humano. Conforme ilustrado na figura a seguir, o Analyze Lending recebe um documento de empréstimo e o divide em páginas, classificando-as de acordo com o tipo de documento. As páginas do documento são roteadas automaticamente para as operações de processamento de texto do Amazon Textract para extração e análise precisas de dados.

API de análise de empréstimo do Amazon Textract

A API Analyze Lending oferece os seguintes benefícios:

  • Processamento automatizado de ponta a ponta de pacotes de hipotecas
  • Modelos de ML pré-treinados em vários tipos de documentos em um pacote de solicitação de hipoteca
  • Capacidade de escalar sob demanda e reduzir a dependência de revisores humanos
  • Melhor tomada de decisão e custos operacionais significativamente mais baixos

Detecção de adulteração

Usamos um modelo de visão computacional implantado no SageMaker para nossa solução completa de localização e detecção de falsificação de imagem, o que significa que ele usa uma imagem de teste como entrada e prevê a probabilidade de falsificação em nível de pixel como saída.

A maioria dos estudos de pesquisa concentra-se em quatro técnicas de falsificação de imagens: emenda, cópia-mover, remoção e aprimoramento. Tanto a emenda quanto a cópia-mover envolvem a adição de conteúdo de imagem à imagem de destino (forjada). No entanto, o conteúdo adicionado é obtido de uma imagem diferente na emenda. No copy-move, é a partir da imagem de destino. A remoção, ou pintura interna, remove uma região de imagem selecionada (por exemplo, ocultando um objeto) e preenche o espaço com novos valores de pixel estimados do plano de fundo. Por fim, o aprimoramento da imagem é uma vasta coleção de manipulações locais, como nitidez, brilho e ajuste.

Dependendo das características da falsificação, diferentes pistas podem ser usadas como base para detecção e localização. Essas pistas incluem artefatos de compressão JPEG, inconsistências de borda, padrões de ruído, consistência de cor, semelhança visual, consistência EXIF ​​e modelo de câmera. No entanto, as falsificações da vida real são mais complexas e geralmente usam uma sequência de manipulações para ocultar a falsificação. A maioria dos métodos existentes concentra-se na detecção de nível de imagem, seja uma imagem forjada ou não, e não na localização ou destaque de uma área falsificada da imagem do documento para ajudar o subscritor a tomar decisões informadas.

Percorremos os detalhes de implementação de treinamento e hospedagem de um modelo de visão computacional para detecção de adulteração e localização no SageMaker na Parte 2 desta série. A arquitetura conceitual baseada em CNN do modelo é representada no diagrama a seguir. O modelo extrai recursos de rastreamento de manipulação de imagem para uma imagem de teste e identifica regiões anômalas avaliando o quão diferente um recurso local é de seus recursos de referência. Ele detecta pixels forjados identificando recursos anômalos locais como uma máscara prevista da imagem de teste.

Detecção de violação de visão computacional

Detecção de fraude

Usamos o Amazon Fraud Detector, um serviço de IA totalmente gerenciado, para automatizar a geração, avaliação e detecção de atividades fraudulentas. Isso é obtido por meio da geração de previsões de fraude com base nos dados extraídos dos documentos da hipoteca em modelos de fraude de ML treinados com os dados históricos (fraude) do cliente. Você pode usar a previsão para acionar regras de negócios em relação às decisões de subscrição.

Processo do detector de fraudes da Amazon

Definir a lógica de previsão de fraude envolve os seguintes componentes:

  • Tipos de eventos – Definir a estrutura do evento
  • Modelos – Definir o algoritmo e os requisitos de dados para prever fraudes
  • Variáveis – Representa um elemento de dados associado ao evento de detecção de fraude
  • Regras – Diga ao Amazon Fraud Detector como interpretar os valores das variáveis ​​durante a previsão de fraude
  • Focados no Negócio – Os resultados gerados a partir de uma previsão de fraude
  • Versão do detector – Contém lógica de previsão de fraude para o evento de detecção de fraude

O diagrama a seguir ilustra a arquitetura desse componente.

Processo Detalhado do Detector de Fraudes da Amazon

Depois de implantar seu modelo, você pode avaliar suas pontuações e métricas de desempenho com base nas explicações de previsão. Isso ajuda a identificar os principais indicadores de risco e analisar os padrões de fraude nos dados.

Validação de terceiros

Integramos a solução com provedores terceirizados (via API) para validar as informações extraídas dos documentos, como informações pessoais e trabalhistas. Isso é particularmente útil para validação cruzada de detalhes, além da detecção de adulteração de documentos e detecção de fraude com base no padrão histórico de aplicativos.

O diagrama de arquitetura a seguir ilustra um pipeline de detecção de fraude orientado a lote no processamento de aplicativos de hipoteca usando vários serviços da AWS.

Arquitetura de Detecção de Fraude de Ponta a Ponta

O fluxo de trabalho inclui as seguintes etapas:

  1. O usuário carrega os documentos digitalizados em Serviço de armazenamento simples da Amazon (Amazônia S3).
  2. O upload aciona um AWS Lambda (Invoke Document Analysis) que chama a API do Amazon Textract para extração de texto. Além disso, podemos usar a API Amazon Textract Analyze Lending para extrair, classificar e validar informações automaticamente.
  3. Após a conclusão da extração de texto, uma notificação é enviada via Serviço de notificação simples da Amazon (Amazônia SNS).
  4. A notificação aciona uma função do Lambda (obter análise de documento), que invoca o Amazon Comprehend para classificação personalizada de documentos.
  5. Os resultados da análise de documentos que têm uma baixa pontuação de confiança são encaminhados para revisores humanos usando IA aumentada da Amazon (Amazônia A2I).
  6. A saída do Amazon Textract e Amazon Comprehend é agregada usando uma função Lambda (Analyze & Classify Document).
  7. Um endpoint de inferência do SageMaker é chamado para uma máscara de previsão de fraude dos documentos de entrada.
  8. O Amazon Fraud Detector é chamado para uma pontuação de previsão de fraude usando os dados extraídos dos documentos da hipoteca.
  9. Os resultados do Amazon Fraud Detector e do endpoint de inferência do SageMaker são agregados ao aplicativo de origem do empréstimo.
  10. O status do trabalho de processamento de documentos é rastreado em Amazon DynamoDB.

Conclusão

Esta postagem apresentou uma solução automatizada para detectar adulteração e fraude de documentos no processo de subscrição de hipoteca usando o Amazon Fraud Detector e outros serviços Amazon AI e ML. Essa solução permite detectar tentativas de fraude mais perto do momento da ocorrência da fraude e auxilia os subscritores em um processo de tomada de decisão eficaz. A flexibilidade da implementação permite definir regras de negócios para classificar e capturar as tentativas fraudulentas personalizadas para necessidades específicas de negócios.

Na Parte 2 desta série, fornecemos os detalhes de implementação para detectar a adulteração de documentos usando o SageMaker. Na Parte 3, demonstramos como implementar a solução no Amazon Fraud Detector.


Sobre os autores


Automatize a validação de documentos e a detecção de fraudes no processo de subscrição de hipotecas usando os serviços de IA da AWS: Parte 1 | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.Anup Ravindranath
é Arquiteto de Soluções Sênior na Amazon Web Services (AWS) com sede em Toronto, Canadá, trabalhando com organizações de Serviços Financeiros. Ele ajuda os clientes a transformar seus negócios e inovar na nuvem.

Automatize a validação de documentos e a detecção de fraudes no processo de subscrição de hipotecas usando os serviços de IA da AWS: Parte 1 | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.Vinnie Saini é Arquiteto de Soluções Sênior na Amazon Web Services (AWS) com sede em Toronto, Canadá. Ela tem ajudado os clientes de serviços financeiros a se transformarem na nuvem, com soluções baseadas em IA e ML baseadas em fortes pilares fundamentais de excelência arquitetônica.

Carimbo de hora:

Mais de Aprendizado de máquina da AWS