У перший пост У цій серії з трьох частин ми представили рішення, яке демонструє, як можна автоматизувати масштабне виявлення підробки документів і шахрайства за допомогою AI AWS і служб машинного навчання (ML) для сценарію використання іпотечного андеррайтингу.
У друга посада, we discussed an approach to develop a deep learning-based computer vision model to detect and highlight forged images in mortgage underwriting.
In this post, we present a solution to automate mortgage document fraud detection using an ML model and business-defined rules with Детектор шахрайства Amazon.
Огляд рішення
We use Amazon Fraud Detector, a fully managed fraud detection service, to automate the detection of fraudulent activities. With an objective to improve fraud prediction accuracies by proactively identifying document fraud, while improving underwriting accuracies, Amazon Fraud Detector helps you build customized fraud detection models using a historical dataset, configure customized decision logic using the built-in rules engine, and orchestrate risk decision workflows with the click of a button.
The following diagram represents each stage in a mortgage document fraud detection pipeline.
We will now be covering the third component of the mortgage document fraud detection pipeline. The steps to deploy this component are as follows:
- Upload historical data to Служба простого зберігання Amazon (Amazon S3).
- Select your options and train the model.
- Створіть модель.
- Review model performance.
- Розгорніть модель.
- Create a detector.
- Add rules to interpret model scores.
- Deploy the API to make predictions.
Передумови
The following are prerequisite steps for this solution:
- Sign up for an AWS account.
- Set up permissions that allows your AWS account to access Amazon Fraud Detector.
- Collect the historical fraud data to be used to train the fraud detector model, with the following requirements:
- Data must be in CSV format and have headers.
- Two headers are required:
EVENT_TIMESTAMP
таEVENT_LABEL
. - Data must reside in Amazon S3 in an AWS Region supported by the service.
- It’s highly recommended to run a data profile before you train (use an automated data profiler for Amazon Fraud Detector).
- It’s recommended to use at least 3–6 months of data.
- It takes time for fraud to mature; data that is 1–3 months old is recommended (not too recent).
- Some NULLs and missing values are acceptable (but too many and the variable is ignored, as discussed in Missing or incorrect variable type).
Upload historical data to Amazon S3
After you have the custom historical data files to train a fraud detector model, create an S3 bucket and upload the data to the bucket.
Select options and train the model
The next step towards building and training a fraud detector model is to define the business activity (event) to evaluate for the fraud. Defining an event involves setting the variables in your dataset, an entity initiating the event, and the labels that classify the event.
Complete the following steps to define a docfraud event to detect document fraud, which is initiated by the entity applicant mortgage, referring to a new mortgage application:
- На консолі Amazon Fraud Detector виберіть Події у навігаційній панелі.
- Вибирати Створювати.
- під Event type details, введіть
docfraud
as the event type name and, optionally, enter a description of the event. - Вибирати Створити сутність.
- на Створити сутність сторінку, введіть
applicant_mortgage
as the entity type name and, optionally, enter a description of the entity type. - Вибирати Створити сутність.
- під Змінні події, Для Виберіть, як визначити змінні цієї подіївиберіть Виберіть змінні з навчального набору даних.
- для Роль IAMвиберіть Створити роль IAM.
- на Створити роль IAM page, enter the name of the S3 bucket with your example data and choose Створіть роль.
- для Розташування даних, enter the path to your historical data. This is the S3 URI path that you saved after uploading the historical data. The path is similar to
S3://your-bucket-name/example dataset filename.csv
. - Вибирати Завантажувати.
Variables represent data elements that you want to use in a fraud prediction. These variables can be taken from the event dataset that you prepared for training your model, from your Amazon Fraud Detector model’s risk score outputs, or from Amazon SageMaker models. For more information about variables taken from the event dataset, see Get event dataset requirements using the Data models explorer.
- під Labels – optional, Для етикеткивиберіть Create new labels.
- на Створити етикетку сторінку, введіть
fraud
as the name. This label corresponds to the value that represents the fraudulent mortgage application in the example dataset. - Вибирати Створити етикетку.
- Create a second label called
legit
. This label corresponds to the value that represents the legitimate mortgage application in the example dataset. - Вибирати Створіть тип події.
The following screenshot shows our event type details.
The following screenshot shows our variables.
The following screenshot shows our labels.
Створіть модель
After you have loaded the historical data and selected the required options to train a model, complete the following steps to create a model:
- На консолі Amazon Fraud Detector виберіть моделі у навігаційній панелі.
- Вибирати Додати модель, а потім виберіть Створити модель.
- на Визначте деталі моделі сторінку, введіть
mortgage_fraud_detection_model
as the model’s name and an optional description of the model. - для Тип моделі, виберіть Статистика онлайн-шахрайства модель.
- для Тип подіївиберіть
docfraud
. This is the event type that you created earlier. - У Дані про історичні події розділ, надайте таку інформацію:
- для Event data sourceвиберіть Event data stored uploaded to S3 (or AFD).
- для Роль IAM, choose the role that you created earlier.
- для Розташування даних про тренування, enter the S3 URI path to your example data file.
- Вибирати МАЙБУТНІ.
- У Вхідні дані моделі section, leave all checkboxes checked. By default, Amazon Fraud Detector uses all variables from your historical event dataset as model inputs.
- У Label classification розділ, для Етикетки шахрайствавиберіть
fraud
, which corresponds to the value that represents fraudulent events in the example dataset. - для Законні ярликивиберіть
legit
, which corresponds to the value that represents legitimate events in the example dataset. - для Unlabeled events, keep the default selection Ігнорувати події без позначок for this example dataset.
- Вибирати МАЙБУТНІ.
- Перегляньте свої налаштування та виберіть Створення та навчання моделі.
Amazon Fraud Detector creates a model and begins to train a new version of the model.
на Модельні версії стор Статус column indicates the status of model training. Model training that uses the example dataset takes approximately 45 minutes to complete. The status changes to Готовий до розгортання after model training is complete.
Review model performance
After the model training is complete, Amazon Fraud Detector validates the model performance using 15% of your data that was not used to train the model and provides various tools, including a score distribution chart and confusion matrix, to assess model performance.
To view the model’s performance, complete the following steps:
- На консолі Amazon Fraud Detector виберіть моделі у навігаційній панелі.
- Choose the model that you just trained (
sample_fraud_detection_model
), потім виберіть 1.0. This is the version Amazon Fraud Detector created of your model. - Перегляньте Продуктивність моделі overall score and all other metrics that Amazon Fraud Detector generated for this model.
Розгортання моделі
After you have reviewed the performance metrics of your trained model and are ready to use it generate fraud predictions, you can deploy the model:
- На консолі Amazon Fraud Detector виберіть моделі у навігаційній панелі.
- Виберіть модель
sample_fraud_detection_model
, and then choose the specific model version that you want to deploy. For this post, choose 1.0. - на Модель версії сторінка, на Дії меню, виберіть Розгорнути версію моделі.
на Модельні версії стор Статус shows the status of the deployment. The status changes to Active when the deployment is complete. This indicates that the model version is activated and available to generate fraud predictions.
Створити детектор
After you have deployed the model, you build a detector for the docfraud
event type and add the deployed model. Complete the following steps:
- На консолі Amazon Fraud Detector виберіть Детектори у навігаційній панелі.
- Вибирати Створити детектор.
- на Define detector details сторінку, введіть
fraud_detector
for the detector name and, optionally, enter a description for the detector, such as my sample fraud detector. - для Тип подіївиберіть
docfraud
. This is the event that you created in earlier. - Вибирати МАЙБУТНІ.
Add rules to interpret
After you have created the Amazon Fraud Detector model, you can use the Amazon Fraud Detector console or application programming interface (API) to define business-driven rules (conditions that tell Amazon Fraud Detector how to interpret model performance score when evaluating for fraud prediction). To align with the mortgage underwriting process, you may create rules to flag mortgage applications according to the risk levels associated and mapped as fraud, legitimate, or if a review is needed.
For example, you may want to automatically decline mortgage applications with a high fraud risk, considering parameters like tampered images of the required documents, missing documents like paystubs or income requirements, and so on. On the other hand, certain applications may need a human in the loop for making effective decisions.
Amazon Fraud Detector uses the aggregated value (calculated by combining a set of raw variables) and raw value (the value provided for the variable) to generate the model scores. The model scores can be between 0–1000, where 0 indicates low fraud risk and 1000 indicates high fraud risk.
To add the respective business-driven rules, complete the following steps:
- На консолі Amazon Fraud Detector виберіть Правила у навігаційній панелі.
- Вибирати Додайте правило.
- У Define a rule section, enter fraud for the rule name and, optionally, enter a description.
- для вираз, enter the rule expression using the Amazon Fraud Detector simplified rule expression language
$docdraud_insightscore >= 900
- для Результативиберіть Створіть новий результат (An outcome is the result from a fraud prediction and is returned if the rule matches during an evaluation.)
- У Створіть новий результат section, enter decline as the outcome name and an optional description.
- Вибирати Зберегти результат
- Вибирати Додайте правило щоб запустити перевірку правил і зберегти правило.
- After it’s created, Amazon Fraud Detector makes the following
high_risk
rule available for use in your detector.- Rule name:
fraud
- Результат:
decline
- Вираз:
$docdraud_insightscore >= 900
- Rule name:
- Вибирати Додайте ще одне правило, а потім виберіть Створити правило tab to add additional 2 rules as below:
- Створити
low_risk
rule with the following details:- Rule name:
legit
- Результат:
approve
- Вираз:
$docdraud_insightscore <= 500
- Rule name:
- Створити
medium_risk
rule with the following details:- Rule name:
review needed
- Результат:
review
- Вираз:
$docdraud_insightscore <= 900 and docdraud_insightscore >=500
- Rule name:
These values are examples used for this post. When you create rules for your own detector, use values that are appropriate for your model and use case.
- After you have created all three rules, choose МАЙБУТНІ.
Deploy the API to make predictions
After the rules-based actions have been triggered, you can deploy an Amazon Fraud Detector API to evaluate the lending applications and predict potential fraud. The predictions can be performed in a batch or real time.
Integrate your SageMaker model (Optional)
If you already have a fraud detection model in SageMaker, you can integrate it with Amazon Fraud Detector for your preferred results.
This implies that you can use both SageMaker and Amazon Fraud Detector models in your application to detect different types of fraud. For example, your application can use the Amazon Fraud Detector model to assess the fraud risk of customer accounts, and simultaneously use your PageMaker model to check for account compromise risk.
Прибирати
To avoid incurring any future charges, delete the resources created for the solution, including the following:
- Ковш S3
- Amazon Fraud Detector endpoint
Висновок
This post walked you through an automated and customized solution to detect fraud in the mortgage underwriting process. This solution allows you to detect fraudulent attempts closer to the time of fraud occurrence and helps underwriters with an effective decision-making process. Additionally, the flexibility of the implementation allows you to define business-driven rules to classify and capture the fraudulent attempts customized to specific business needs.
For more information about building an end-to-end mortgage document fraud detection solution, refer to Частина 1 та Частина 2 у цій серії.
Про авторів
Ануп Равіндранат є старшим архітектором рішень в Amazon Web Services (AWS), що базується в Торонто, Канада, і працює з організаціями, що надають фінансові послуги. Він допомагає клієнтам трансформувати свій бізнес і впроваджувати інновації в хмарі.
Вінні Сайні є старшим архітектором рішень в Amazon Web Services (AWS) у Торонто, Канада. Вона допомагала клієнтам відділу фінансових послуг трансформуватися в хмару, використовуючи рішення на основі штучного інтелекту та машинного навчання, які базуються на міцних фундаментальних стовпах архітектурної досконалості.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/automate-mortgage-document-fraud-detection-using-an-ml-model-and-business-defined-rules-with-amazon-fraud-detector-part-3/
- : має
- :є
- : ні
- :де
- $UP
- 100
- 15%
- 7
- 900
- a
- МЕНЮ
- прийнятний
- доступ
- За
- рахунки
- Рахунки
- дії
- діяльності
- діяльність
- додавати
- Додатковий
- Додатково
- після
- AI
- вирівнювати
- ВСІ
- дозволяє
- вже
- Amazon
- Детектор шахрайства Amazon
- Amazon Web Services
- Веб-служби Amazon (AWS)
- an
- та
- Інший
- будь-який
- API
- додаток
- застосування
- підхід
- відповідний
- приблизно
- архітектурний
- архітектура
- ЕСТЬ
- AS
- оцінити
- асоційований
- At
- Спроби
- автоматизувати
- Автоматизований
- автоматично
- доступний
- уникнути
- AWS
- заснований
- BE
- було
- перед тим
- починається
- нижче
- між
- обидва
- будувати
- Створюємо
- вбудований
- бізнес
- підприємства
- але
- button
- by
- розрахований
- званий
- CAN
- Канада
- захоплення
- випадок
- певний
- Зміни
- вантажі
- Графік
- перевірка
- перевірено
- Вибирати
- класифікація
- Класифікувати
- клацання
- ближче
- хмара
- Колонка
- об'єднання
- повний
- компонент
- компроміс
- комп'ютер
- Комп'ютерне бачення
- концептуальний
- Умови
- замішання
- беручи до уваги
- Консоль
- відповідає
- покриття
- створювати
- створений
- створює
- виготовлений на замовлення
- клієнт
- Клієнти
- налаштувати
- дані
- рішення
- Прийняття рішень
- рішення
- Відмова прийняти
- глибокий
- дефолт
- визначати
- визначаючи
- демонструє
- розгортання
- розгорнути
- розгортання
- description
- деталі
- виявляти
- Виявлення
- розвивати
- схема
- різний
- обговорювалися
- розподіл
- документ
- документація
- керований
- під час
- кожен
- Раніше
- Ефективний
- елементи
- кінець в кінець
- двигун
- Що натомість? Створіть віртуальну версію себе у
- суб'єкта
- оцінювати
- оцінки
- оцінка
- Event
- Події
- приклад
- Приклади
- Перевага
- вираз
- філе
- Файли
- фінансовий
- фінансові послуги
- Гнучкість
- після
- слідує
- для
- кований
- формат
- фундаментальні
- шахрайство
- виявлення шахрайства
- шахрайський
- від
- повністю
- майбутнє
- породжувати
- генерується
- рука
- Мати
- he
- Заголовки
- допомогу
- допомагає
- Високий
- Виділіть
- дуже
- історичний
- Як
- How To
- HTTP
- HTTPS
- людина
- ідентифікує
- if
- зображень
- реалізація
- удосконалювати
- поліпшення
- in
- У тому числі
- Дохід
- неправильний
- вказує
- інформація
- розпочатий
- оновлювати
- витрати
- інтегрувати
- інтерфейс
- включає в себе
- IT
- JPG
- просто
- тримати
- етикетка
- етикетки
- закладені
- мова
- вивчення
- найменш
- Залишати
- законний
- кредитування
- рівні
- як
- логіка
- низький
- машина
- навчання за допомогою машини
- зробити
- РОБОТИ
- Робить
- вдалося
- багато
- сірники
- Матриця
- зрілий
- Може..
- Метрика
- хвилин
- відсутній
- ML
- модель
- Моделі
- місяців
- більше
- Іпотека
- повинен
- my
- ім'я
- навігація
- Необхідність
- необхідний
- потреби
- Нові
- наступний
- зараз
- мета
- виникнення
- of
- Старий
- on
- Опції
- or
- організації
- Інше
- наші
- Результат
- виходи
- загальний
- власний
- сторінка
- pane
- параметри
- частина
- шлях
- продуктивність
- виконується
- Дозволи
- стовпи
- трубопровід
- plato
- Інформація про дані Платона
- PlatoData
- пошта
- потенціал
- передбачати
- прогноз
- Прогнози
- переважним
- підготовлений
- передумова
- представити
- представлений
- процес
- профіль
- Програмування
- забезпечувати
- за умови
- забезпечує
- Сировина
- готовий
- реальний
- реального часу
- останній
- рекомендований
- послатися
- регіон
- представляти
- представляє
- вимагається
- Вимога
- ресурси
- ті
- результат
- результати
- огляд
- відгуки
- Risk
- Роль
- Правило
- Правила
- прогін
- мудрець
- зразок
- зберегти
- зберігаються
- шкала
- рахунок
- другий
- розділ
- побачити
- обраний
- вибір
- старший
- Серія
- обслуговування
- Послуги
- комплект
- установка
- налаштування
- вона
- Шоу
- аналогічний
- простий
- одночасно
- So
- рішення
- Рішення
- конкретний
- Стажування
- Статус
- Крок
- заходи
- зберігання
- зберігати
- сильний
- такі
- Підтриманий
- прийняті
- приймає
- сказати
- Що
- Команда
- їх
- потім
- Ці
- третій
- це
- три
- через
- час
- до
- занадто
- інструменти
- Торонто
- до
- поїзд
- навчений
- Навчання
- Перетворення
- спрацьовує
- тип
- Типи
- андеррайтинг
- завантажено
- Завантаження
- використання
- використання випадку
- використовуваний
- використовує
- використання
- перевірка достовірності
- значення
- Цінності
- змінна
- різний
- версія
- версії
- вид
- бачення
- пішов
- хотіти
- було
- we
- Web
- веб-сервіси
- коли
- який
- в той час як
- волі
- з
- Робочі процеси
- робочий
- Ти
- вашу
- зефірнет