在 第一篇文章 在这个由三部分组成的系列中,我们提出了一个解决方案,演示如何针对抵押贷款承保用例使用 AWS AI 和机器学习 (ML) 服务大规模自动检测文档篡改和欺诈。
在 第二篇文章,我们讨论了一种开发基于深度学习的计算机视觉模型的方法,以检测和突出显示抵押贷款承保中的伪造图像。
在这篇文章中,我们提出了一种解决方案,使用 ML 模型和业务定义的规则来自动检测抵押贷款文件欺诈 亚马逊欺诈检测器.
解决方案概述
我们使用 Amazon Fraud Detector(一项完全托管的欺诈检测服务)来自动检测欺诈活动。 Amazon Fraud Detector 的目标是通过主动识别文档欺诈来提高欺诈预测准确性,同时提高承保准确性,Amazon Fraud Detector 可帮助您使用历史数据集构建自定义欺诈检测模型,使用内置规则引擎配置自定义决策逻辑,并协调风险决策只需单击按钮即可完成工作流程。
下图表示抵押贷款文件欺诈检测管道中的每个阶段。
我们现在将介绍抵押贷款文件欺诈检测流程的第三个组成部分。部署该组件的步骤如下:
- 上传历史数据至 亚马逊简单存储服务 (亚马逊S3)。
- 选择您的选项并训练模型。
- 创建模型。
- 检查模型性能。
- 部署模型。
- 创建一个探测器。
- 添加规则来解释模型分数。
- 部署 API 进行预测。
先决条件
以下是此解决方案的先决步骤:
- 注册一个 AWS 账户。
- 设置允许您的 AWS 账户访问 Amazon Fraud Detector 的权限。
- 收集历史欺诈数据用于训练欺诈检测器模型,满足以下要求:
- 数据必须采用 CSV 格式并具有标题。
- 需要两个标头:
EVENT_TIMESTAMP
和EVENT_LABEL
. - 数据必须驻留在服务支持的 AWS 区域中的 Amazon S3 中。
- 强烈建议在训练之前运行数据配置文件(使用 Amazon Fraud Detector 的自动数据分析器).
- 建议至少使用 3-6 个月的数据。
- 欺诈的成熟需要时间;建议使用 1-3 个月前的数据(不要太新)。
- 一些 NULL 和缺失值是可以接受的(但是太多,变量会被忽略,如 变量类型缺失或不正确).
将历史数据上传到Amazon S3
拥有自定义历史数据文件来训练欺诈检测器模型后,创建 S3 存储桶并将数据上传到该存储桶。
选择选项并训练模型
构建和训练欺诈检测器模型的下一步是定义用于评估欺诈的业务活动(事件)。定义事件涉及设置数据集中的变量、启动事件的实体以及对事件进行分类的标签。
完成以下步骤定义文档欺诈事件以检测文档欺诈,该事件由实体申请人抵押贷款发起,涉及新的抵押贷款申请:
- 在Amazon Fraud Detector控制台上,选择 展会活动 在导航窗格中。
- 创建.
- 下 事件类型详细信息,输入
docfraud
作为事件类型名称,并且可以选择输入事件的描述。 - 创建实体.
- 点击 创建实体 页面,输入
applicant_mortgage
作为实体类型名称,并且可以选择输入实体类型的描述。 - 创建实体.
- 下 事件变量,为 选择如何定义此事件的变量,选择 从训练数据集中选择变量.
- 针对 IAM角色,选择 创建IAM角色.
- 点击 创建IAM角色 页面,输入带有示例数据的 S3 存储桶的名称,然后选择 创建角色.
- 针对 资料位置,输入历史数据的路径。这是您上传历史数据后保存的 S3 URI 路径。该路径类似于
S3://your-bucket-name/example dataset filename.csv
. - 上传.
变量表示您想要在欺诈预测中使用的数据元素。这些变量可以取自您为训练模型而准备的事件数据集、Amazon Fraud Detector 模型的风险评分输出或 亚马逊SageMaker 楷模。有关从事件数据集中获取的变量的更多信息,请参阅 使用数据模型资源管理器获取事件数据集要求.
- 下 标签 – 可选,为 标签,选择 创建新标签.
- 点击 建立标签 页面,输入
fraud
正如名字。该标签对应于示例数据集中代表欺诈性抵押贷款申请的值。 - 建立标签.
- 创建第二个标签,名为
legit
。该标签对应于示例数据集中代表合法抵押贷款申请的值。 - 创建事件类型.
以下屏幕截图显示了我们的事件类型详细信息。
下面的屏幕截图显示了我们的变量。
以下屏幕截图显示了我们的标签。
创建模型
加载历史数据并选择训练模型所需的选项后,请完成以下步骤来创建模型:
- 在Amazon Fraud Detector控制台上,选择 型号 在导航窗格中。
- 新增模型,然后选择 建立模型.
- 点击 定义模型细节 页面,输入
mortgage_fraud_detection_model
作为模型的名称和模型的可选描述。 - 针对 型号类型, 选择 在线欺诈洞察 模型。
- 针对 事件类型,选择
docfraud
。这是您之前创建的事件类型。 - 在 历史事件数据 部分,提供以下信息:
- 针对 事件数据源,选择 存储的事件数据上传到S3(或AFD).
- 针对 IAM角色,选择您之前创建的角色。
- 针对 训练数据位置,输入示例数据文件的 S3 URI 路径。
- 下一页.
- 在 模型输入 部分,选中所有复选框。默认情况下,Amazon Fraud Detector 使用历史事件数据集中的所有变量作为模型输入。
- 在 标签分类 部分,用于 欺诈标签,选择
fraud
,它对应于示例数据集中代表欺诈事件的值。 - 针对 合法标签,选择
legit
,它对应于表示示例数据集中合法事件的值。 - 针对 未标记的事件,保持默认选择 忽略未标记的事件 对于此示例数据集。
- 下一页.
- 查看您的设置,然后选择 创建并训练模型.
Amazon Fraud Detector 创建模型并开始训练该模型的新版本。
点击 型号版本 页面, Status 列表示模型训练的状态。使用示例数据集的模型训练大约需要 45 分钟才能完成。状态变为 准备部署 模型训练完成后。
审查模型性能
模型训练完成后,Amazon Fraud Detector 使用未用于训练模型的 15% 的数据来验证模型性能,并提供各种工具(包括分数分布图和混淆矩阵)来评估模型性能。
要查看模型的性能,请完成以下步骤:
- 在Amazon Fraud Detector控制台上,选择 型号 在导航窗格中。
- 选择您刚刚训练的模型(
sample_fraud_detection_model
),然后选择 1.0。这是 Amazon Fraud Detector 根据您的模型创建的版本。 - 查看 模型表现 总体得分以及 Amazon Fraud Detector 为此模型生成的所有其他指标。
部署模型
查看训练模型的性能指标并准备好使用它生成欺诈预测后,您可以部署该模型:
- 在Amazon Fraud Detector控制台上,选择 型号 在导航窗格中。
- 选择型号
sample_fraud_detection_model
,然后选择您要部署的特定模型版本。对于这篇文章,选择 1.0. - 点击 型号版本 页面,关于 行动 菜单中选择 部署模型版本.
点击 型号版本 页面, Status 显示部署的状态。状态变为 现有的 当部署完成时。这表明模型版本已激活并且可用于生成欺诈预测。
创建检测器
部署模型后,您可以构建一个检测器 docfraud
事件类型并添加部署的模型。完成以下步骤:
- 在Amazon Fraud Detector控制台上,选择 探测器 在导航窗格中。
- 创建检测器.
- 点击 定义探测器详细信息 页面,输入
fraud_detector
输入检测器名称,并可以选择输入检测器的描述,例如我的示例欺诈检测器。 - 针对 活动类型,选择
docfraud
。这是您之前创建的事件。 - 下一页.
添加规则来解释
创建 Amazon Fraud Detector 模型后,您可以使用 Amazon Fraud Detector 控制台或应用程序编程接口 (API) 定义业务驱动的规则(告诉 Amazon Fraud Detector 在评估欺诈预测时如何解释模型性能分数的条件) 。为了与抵押贷款承销流程保持一致,您可以创建规则,根据关联的风险级别标记抵押贷款申请,并将其映射为欺诈、合法或是否需要审核。
例如,您可能希望自动拒绝具有高欺诈风险的抵押贷款申请,并考虑所需文件的图像被篡改、工资单或收入要求等文件丢失等参数。另一方面,某些应用程序可能需要有人参与其中才能做出有效的决策。
Amazon Fraud Detector 使用聚合值(通过组合一组原始变量计算得出)和原始值(为变量提供的值)来生成模型分数。模型得分可以在 0-1000 之间,其中 0 表示欺诈风险低,1000 表示欺诈风险高。
要添加相应的业务驱动规则,请完成以下步骤:
- 在Amazon Fraud Detector控制台上,选择 规则 在导航窗格中。
- 添加规则.
- 在 定义规则 部分,输入欺诈作为规则名称,并可以选择输入描述。
- 针对 口语,使用 Amazon Fraud Detector 简化规则表达式语言输入规则表达式
$docdraud_insightscore >= 900
- 针对 结果,选择 创造新成果 (结果是欺诈预测的结果,如果在评估期间规则匹配,则返回结果。)
- 在 创造新成果 部分,输入拒绝作为结果名称和可选描述。
- 保存结果
- 添加规则 运行规则验证检查器并保存规则。
- 创建后,Amazon Fraud Detector 会执行以下操作
high_risk
规则可在您的检测器中使用。- 规则名称:
fraud
- 结果:
decline
- 表达式:
$docdraud_insightscore >= 900
- 规则名称:
- 添加其他规则,然后选择 建立规则 选项卡添加另外 2 条规则,如下所示:
- 创建一个
low_risk
规则包含以下详细信息:- 规则名称:
legit
- 结果:
approve
- 表达式:
$docdraud_insightscore <= 500
- 规则名称:
- 创建一个
medium_risk
规则包含以下详细信息:- 规则名称:
review needed
- 结果:
review
- 表达式:
$docdraud_insightscore <= 900 and docdraud_insightscore >=500
- 规则名称:
这些值是本文使用的示例。当您为自己的检测器创建规则时,请使用适合您的模型和用例的值。
- 创建完所有三个规则后,选择 下一页.
部署 API 进行预测
触发基于规则的操作后,您可以部署 Amazon Fraud Detector API 来评估贷款应用程序并预测潜在的欺诈行为。预测可以批量或实时执行。
集成您的 SageMaker 模型(可选)
如果您在 SageMaker 中已有欺诈检测模型,则可以将其与 Amazon Fraud Detector 集成以获得您想要的结果。
这意味着您可以在应用程序中使用 SageMaker 和 Amazon Fraud Detector 模型来检测不同类型的欺诈。例如,您的应用程序可以使用 Amazon Fraud Detector 模型来评估客户账户的欺诈风险,并同时使用 PageMaker 模型来检查账户泄露风险。
清理
为了避免将来产生任何费用,请删除为解决方案创建的资源,包括以下资源:
- S3斗
- Amazon Fraud Detector 端点
结论
这篇文章向您介绍了一个自动化的定制解决方案,用于检测抵押贷款承销过程中的欺诈行为。该解决方案使您能够在接近欺诈发生时检测到欺诈企图,并帮助承保人制定有效的决策流程。此外,实施的灵活性允许您定义业务驱动的规则来分类和捕获根据特定业务需求定制的欺诈尝试。
有关构建端到端抵押贷款文件欺诈检测解决方案的更多信息,请参阅 部分1 和 部分2 在这个系列中。
关于作者
阿努普·拉文德拉纳特 是位于加拿大多伦多的 Amazon Web Services (AWS) 的高级解决方案架构师,与金融服务组织合作。 他帮助客户实现业务转型并在云上进行创新。
维尼塞尼 是位于加拿大多伦多的 Amazon Web Services (AWS) 的高级解决方案架构师。 她一直在帮助金融服务客户在云上转型,将 AI 和 ML 驱动的解决方案建立在卓越架构的强大基础支柱之上。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- PlatoData.Network 垂直生成人工智能。 赋予自己力量。 访问这里。
- 柏拉图爱流。 Web3 智能。 知识放大。 访问这里。
- 柏拉图ESG。 碳, 清洁科技, 能源, 环境, 太阳能, 废物管理。 访问这里。
- 柏拉图健康。 生物技术和临床试验情报。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/automate-mortgage-document-fraud-detection-using-an-ml-model-and-business-defined-rules-with-amazon-fraud-detector-part-3/
- :具有
- :是
- :不是
- :在哪里
- $UP
- 100
- 15%
- 7
- 900
- a
- 关于
- 可接受
- ACCESS
- 根据
- 账号管理
- 账户
- 行动
- 活动
- 活动
- 加
- 额外
- 另外
- 后
- AI
- 对齐
- 所有类型
- 允许
- 已经
- Amazon
- 亚马逊欺诈检测器
- 亚马逊网络服务
- 亚马逊网络服务(AWS)
- an
- 和
- 另一个
- 任何
- API
- 应用领域
- 应用领域
- 的途径
- 适当
- 约
- 建筑的
- 架构
- 保健
- AS
- 评估
- 相关
- At
- 尝试
- 自动化
- 自动化
- 自动
- 可使用
- 避免
- AWS
- 基于
- BE
- 很
- before
- 开始
- 如下。
- 之间
- 都
- 建立
- 建筑物
- 内建的
- 商业
- 企业
- 但是
- 按键
- by
- 计算
- 被称为
- CAN
- 加拿大
- 捕获
- 案件
- 一定
- 更改
- 收费
- 图表
- 查
- 检查
- 分类
- 分类
- 点击
- 接近
- 云端技术
- 柱
- 结合
- 完成
- 元件
- 妥协
- 一台
- 计算机视觉
- 概念上的
- 条件
- 混乱
- 考虑
- 安慰
- 对应
- 覆盖
- 创建信息图
- 创建
- 创建
- 习俗
- 顾客
- 合作伙伴
- 定制
- data
- 决定
- 决策
- 决定
- 拒绝
- 深
- 默认
- 定义
- 定义
- 演示
- 部署
- 部署
- 部署
- 描述
- 详情
- 检测
- 检测
- 开发
- 图表
- 不同
- 讨论
- 分配
- 文件
- 文件
- 驱动
- ,我们将参加
- 每
- 此前
- 有效
- 分子
- 端至端
- 发动机
- 输入
- 实体
- 评估
- 评估
- 评估
- 活动
- 事件
- 例子
- 例子
- 追求卓越
- 表达
- 文件
- 档
- 金融
- 金融服务
- 高度灵活
- 以下
- 如下
- 针对
- 伪造的
- 格式
- 基础
- 骗局
- 欺诈检测
- 欺诈
- 止
- 充分
- 未来
- 生成
- 产生
- 手
- 有
- he
- 头
- 帮助
- 帮助
- 高
- 近期亮点
- 高度
- 历史的
- 创新中心
- How To
- HTTP
- HTTPS
- 人
- 确定
- if
- 图片
- 履行
- 改善
- 改善
- in
- 包含
- 收入
- 不正确
- 表示
- 信息
- 启动
- 创新
- 输入
- 整合
- 接口
- 涉及
- IT
- JPG
- 只是
- 保持
- 标签
- 标签
- 奠定了
- 语言
- 学习
- 最少
- 离开
- 合法
- 贷款
- 各级
- 喜欢
- 逻辑
- 低
- 机
- 机器学习
- 使
- 制作
- 制作
- 管理
- 许多
- 火柴
- 矩阵
- 成熟
- 可能..
- 指标
- 分钟
- 失踪
- ML
- 模型
- 模型
- 个月
- 更多
- 抵押
- 必须
- my
- 姓名
- 旅游导航
- 需求
- 打印车票
- 需要
- 全新
- 下页
- 现在
- 目标
- 发生
- of
- 老
- on
- 附加选项
- or
- 组织
- 其他名称
- 我们的
- 成果
- 输出
- 最划算
- 己
- 页
- 面包
- 参数
- 部分
- 径
- 性能
- 执行
- 权限
- 支柱
- 管道
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 帖子
- 潜力
- 预测
- 预测
- 预测
- 首选
- 准备
- 先决条件
- 当下
- 呈现
- 过程
- 本人简介
- 代码编程
- 提供
- 提供
- 提供
- 原
- 准备
- 真实
- 实时的
- 最近
- 建议
- 参考
- 地区
- 代表
- 代表
- 必须
- 岗位要求
- 资源
- 那些
- 导致
- 成果
- 检讨
- 审查
- 风险
- 角色
- 第
- 定位、竞价/采购和分析/优化数字媒体采购,但算法只不过是解决问题的操作和规则。
- 运行
- sagemaker
- 样品
- 保存
- 保存
- 鳞片
- 得分了
- 其次
- 部分
- 看到
- 选
- 选择
- 前辈
- 系列
- 服务
- 特色服务
- 集
- 设置
- 设置
- 她
- 作品
- 类似
- 简易
- 同时
- So
- 方案,
- 解决方案
- 具体的
- 阶段
- Status
- 步
- 步骤
- 存储
- 存储
- 强烈
- 这样
- 支持
- 拍摄
- 需要
- 展示
- 这
- 其
- 然后
- 博曼
- 第三
- Free Introduction
- 三
- 通过
- 次
- 至
- 也有
- 工具
- 多伦多
- 向
- 培训
- 熟练
- 产品培训
- 改造
- 引发
- 类型
- 类型
- 保险业
- 上传
- 上传
- 使用
- 用例
- 用过的
- 使用
- 运用
- 验证
- 折扣值
- 价值观
- 变量
- 各个
- 版本
- 版本
- 查看
- 愿景
- 走
- 想
- 是
- we
- 卷筒纸
- Web服务
- ,尤其是
- 这
- 而
- 将
- 工作流程
- 加工
- 完全
- 您一站式解决方案
- 和风网