より多くの企業が顧客により良いサービスを提供するためにオンライン プレゼンスを高めるにつれて、新しい詐欺パターンが絶えず出現しています。 進化し続ける今日のデジタル環境では、詐欺師の手口がますます巧妙化しており、そのような詐欺行為を検出して防止することは、企業や金融機関にとって最も重要になっています。
従来のルールベースの不正検出システムは、定義済みのルールとしきい値に依存して潜在的な不正行為にフラグを立てるため、迅速に反復する能力に限界があります。 これらのシステムは多数の誤検知を生成する可能性があり、詐欺チームが実行する手動調査の量が大幅に増加します。 さらに、人間はエラーが発生しやすく、大量のデータを処理する能力が限られているため、不正を検出するための手動の作業には時間がかかり、不正な取引の見逃し、損失の増加、評判の低下につながる可能性があります。
機械学習 (ML) は、大量のデータを迅速かつ正確に分析して、異常なパターンと可能性のある不正の傾向を特定できるため、不正の検出において重要な役割を果たします。 ML 詐欺モデルのパフォーマンスは、トレーニング対象のデータの品質に大きく依存します。特に、教師ありモデルの場合、正確なラベル付きデータが重要です。 ML では、モデルをトレーニングするための重要な履歴データが不足していることを、 コールドスタートの問題.
不正検出の世界では、以下にいくつかの従来のコールド スタート シナリオを示します。
- 取引履歴や不正事例がなくても、正確な不正モデルを構築する
- 新しい顧客やアカウントの正当な活動と詐欺を正確に区別できること
- 詐欺システムによってこれまでに見られなかったアドレスまたは受益者へのリスク決定支払い
これらのシナリオを解決するには、複数の方法があります。 たとえば、万能モデルと呼ばれる一般的なモデルを使用できます。これらのモデルは通常、詐欺コンソーシアムのような詐欺データ共有プラットフォーム上でトレーニングされます。 このアプローチの課題は、同じビジネスはなく、詐欺攻撃のベクトルは絶えず変化することです。
もう XNUMX つのオプションは、教師なし異常検出モデルを使用して、顧客イベントの異常な動作を監視し、明らかにすることです。 このアプローチの課題は、すべての不正イベントが異常であるとは限らず、すべての異常が実際に不正であるとは限らないことです。 したがって、より高い偽陽性率が期待できます。
この記事では、100 個のイベントを使用して、リアルタイムの不正防止 ML モデルをすばやくブートストラップする方法を示します。 アマゾン詐欺検出器 新機能、 コールドスタート、それにより、大規模なデータセットを収集して正確にラベル付けする時間や能力がない多くの組織にとって、カスタム ML モデルへの参入障壁が劇的に低下します。 さらに、Amazon Fraud Detector に保存されたイベントを使用して、結果を確認し、イベントに正しくラベルを付けてモデルを再トレーニングする方法について説明します。これにより、時間の経過とともに不正防止対策の有効性が向上します。
ソリューションの概要
Amazon Fraud Detector は、オンラインでの潜在的な不正行為の検出を自動化するフルマネージド型の不正検出サービスです。 Amazon Fraud Detector を使用して、独自の履歴データセットを使用してカスタマイズされた不正検出モデルを構築し、組み込みのルール エンジンを使用して決定ロジックを追加し、ボタンをクリックするだけでリスク決定ワークフローを調整できます。
以前は、モデルをトレーニングするために、少なくとも 10,000 の詐欺の例を含む 400 を超えるラベル付きイベントを提供する必要がありました。 コールド スタート機能のリリースにより、最小 100 のイベントと少なくとも 50 の不正として分類されたモデルをすばやくトレーニングできます。 初期のデータ要件と比較すると、履歴データが 99% 削減され、ラベル要件が 87% 削減されています。
新しいコールド スタート機能は、小規模なデータ セットを強化、拡張、およびリスク モデリングするためのインテリジェントな方法を提供します。 さらに、Amazon Fraud Detector は、ラベルの割り当てと、ラベルのないイベントのサンプリングを実行します。
公開データセットを使用して実行された実験では、制限を 50 件の不正と 100 件のイベントのみに下げることで、教師なしおよび半教師ありモデルよりも一貫して優れたパフォーマンスを発揮する不正 ML モデルを構築できることが示されています。
コールドスタートモデルの性能
目に見えないデータを一般化して正確な予測を行う ML モデルの能力は、トレーニング データセットの品質と多様性の影響を受けます。 コールド スタート モデルの場合も同様です。 これらのイベントに正しくラベルを付けてモデルを再トレーニングし、最終的に最適なモデル パフォーマンスに導くために、より多くのデータが収集されるため、適切なプロセスを用意する必要があります。
データ要件が低くなると、モデルの分散が大きくなり、テスト データのサイズが制限されるため、報告されるパフォーマンスの不安定性が高まります。 モデルのパフォーマンスに対する正しい期待を構築するのに役立つように、モデルの AUC に加えて、Amazon Fraud Detector は不確実性の範囲のメトリクスも報告します。 次の表は、これらのメトリックを定義しています。
. | . | AUC | ||
. | . | <0.6 | 0.6 – 0.8 | >= 0.8 |
AUC 不確実性間隔 | > 0.3 | モデルのパフォーマンスは非常に低く、大きく異なる場合があります。 不正検出のパフォーマンスが低いことが予想されます。 | モデルのパフォーマンスは低く、大幅に異なる場合があります。 限られた不正検出パフォーマンスが予想されます。 | モデルのパフォーマンスは大きく異なる場合があります。 |
0.1 – 0.3 | モデルのパフォーマンスは非常に低く、大幅に異なる場合があります。 不正検出のパフォーマンスが低いことが予想されます。 | モデルのパフォーマンスは低く、大幅に異なる場合があります。 限られた不正検出パフォーマンスが予想されます。 | モデルのパフォーマンスは大幅に異なる場合があります。 | |
<0.1 | モデルのパフォーマンスは非常に低いです。 不正検出のパフォーマンスが低いことが予想されます。 | モデルのパフォーマンスは低いです。 限られた不正検出パフォーマンスが予想されます。 | 警告なし |
コールド スタート モデルのトレーニング
Cold Start 詐欺モデルのトレーニングは、他の Amazon Fraud Detector モデルのトレーニングと同じです。 異なるのはデータセットのサイズです。 コールド スタート トレーニングのサンプル データセットは、 GitHubレポ。 Amazon Fraud Detector カスタムモデルをトレーニングするには、ハンズオンに従ってください。 チュートリアル。 どちらかを使用できます Amazon Fraud Detector コンソールのチュートリアル または SDKチュートリアル 不正検出モデルを構築、トレーニング、デプロイする。
モデルのトレーニングが完了したら、パフォーマンス メトリックを確認し、ステータスを次のように変更してデプロイできます。 アクティブ. モデル スコアとパフォーマンス メトリックの詳細については、次を参照してください。 モデルスコア および モデルのパフォーマンスメトリック. この時点で、モデルを検出器に追加できるようになりました。 ビジネスルール モデルが出力するリスク スコアを解釈し、 GetEventPrediction APIです。
Fraud ML モデルの継続的な改善とフィードバック ループ
Amazon Fraud Detector コールド スタート機能を使用すると、不正検出エンドポイントをすばやくブートストラップし、すぐにビジネスの保護を開始できます。 ただし、新しい詐欺パターンが絶えず出現しているため、コールド スタート モデルを新しいデータで再トレーニングして、時間の経過とともに予測の精度と有効性を向上させることが重要です。
モデルの反復処理を支援するために、Amazon Fraud Detector は推論のためにサービスに送信されたすべてのイベントを自動的に保存します。 次のスクリーンショットに示すように、イベント タイプ レベルでイベント インジェスト フラグがオンになっていることを変更または検証できます。
保存されたイベント機能を使用すると、Amazon Fraud Detector SDK を使用してプログラムでイベントにアクセスし、イベントのメタデータと予測の説明を確認して、情報に基づいたリスク決定を下すことができます。 さらに、将来のモデルの再トレーニングと継続的なモデルの改善のために、イベントにラベルを付けることができます。 次の図は、このワークフローの例を示しています。
次のコード スニペットでは、保存されたイベントにラベルを付けるプロセスを示します。
- イベントでリアルタイムの不正予測を行うには、GetEventPrediction API を呼び出します。
応答に見られるように、一致した意思決定エンジンのルールに基づいて、不正行為チームによる手動レビューのためにイベントを送信する必要があります。 予測説明のメタデータを収集することで、各イベント変数がモデルの不正予測スコアにどのように影響したかについての洞察を得ることができます。
- これらの洞察を収集するために、
get_event_prediction_metada
API:
API 応答:
これらの洞察により、不正アナリストは問題のイベントについて情報に基づいたリスク決定を下し、イベント ラベルを更新できます。
- イベント ラベルを更新するには、
update_event_label
API:
APIレスポンス
最後の手順として、イベント ラベルが正しく更新されたかどうかを確認できます。
- イベント ラベルを確認するには、
get_event
API:
APIレスポンス
クリーンアップ
今後の料金の発生を避けるために、ソリューション用に作成されたリソースを削除してください。
まとめ
この投稿では、Amazon Fraud Detector の新しい Cold Start 機能を使用して、わずか 100 のイベントでリアルタイムの不正防止システムをすばやくブートストラップする方法を示しました。 保存されたイベントを使用して結果を確認し、イベントに正しくラベルを付けてモデルを再トレーニングし、時間の経過とともに不正防止対策の有効性を向上させる方法について説明しました。
Amazon Fraud Detector などの完全マネージド型の AWS サービスは、企業がユーザーの行動を分析してプラットフォームでの不正行為を特定し、ビジネス価値の促進により集中するために費やす時間を削減するのに役立ちます。 Amazon Fraud Detector がビジネスにどのように役立つかについて詳しくは、次のサイトをご覧ください。 アマゾン詐欺探知機.
著者について
マルセル・ピビダル ワールド ワイド スペシャリスト オーガニゼーションのグローバル シニア AI サービス ソリューション アーキテクトです。 Marcel は、FinTechs、決済プロバイダー、製薬会社、および政府機関のテクノロジーを通じてビジネス上の問題を解決してきた 20 年以上の経験を持っています。 彼が現在注力している分野は、リスク管理、詐欺防止、本人確認です。
ジュリア・シュー Amazon Fraud Detector のリサーチサイエンティストです。 彼女は、機械学習技術を使用して顧客の課題を解決することに情熱を注いでいます。 余暇には、ハイキング、絵を描くこと、新しいコーヒー ショップを探索することを楽しんでいます。
ギエルメ・リッチ は AWS のシニア ソリューション アーキテクトであり、スタートアップ企業がアプリケーションのコストを最新化して最適化するのを支援しています。 金融セクターの企業で 10 年以上の経験を持つ彼は、現在 AI/ML スペシャリストのチームと協力しています。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 未来を鋳造する w エイドリエン・アシュリー。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/
- :持っている
- :は
- :not
- :どこ
- 000
- 1
- 10
- 100
- 20
- 20年
- 200
- 39
- 50
- 7
- 8
- 9
- a
- 能力
- できる
- 私たちについて
- アクセス
- 精度
- 正確な
- 正確にデジタル化
- 活動
- アクティビティ
- 住所
- 機関
- AI
- AIサービス
- AI / ML
- すべて
- また
- Amazon
- アマゾン詐欺検出器
- 間で
- 金額
- an
- アナリスト
- 分析します
- 分析する
- および
- 異常検出
- どれか
- API
- アプローチ
- です
- エリア
- AS
- At
- 攻撃
- 自動化する
- 自動的に
- AWS
- バリア
- ベース
- BE
- なぜなら
- になる
- になる
- 受益者
- より良いです
- ブートストラップ
- ビルド
- 内蔵
- ビジネス
- ビジネス
- (Comma Separated Values) ボタンをクリックして、各々のジョブ実行の詳細(開始/停止時間、変数値など)のCSVファイルをダウンロードします。
- by
- コール
- 呼ばれます
- 缶
- 容量
- 挑戦する
- 課題
- 変化する
- 変化
- 課金
- 分類された
- クリック
- コード
- コーヒー
- 収集する
- COM
- 企業
- 比べ
- 領事
- 絶えず
- コンテキスト
- 連続的な
- コスト
- 作成した
- 重大な
- 重大な
- 電流プローブ
- 現在
- カスタム
- 顧客
- Customers
- カスタマイズ
- データ
- データ共有
- データセット
- 決定
- 定義する
- 実証します
- 実証
- 展開します
- 検出
- 異なります
- デジタル
- 話し合います
- 議論する
- 見分けます
- 多様性
- do
- ドント
- 劇的に
- 運転
- 各
- 有効
- 努力
- どちら
- 新興の
- エンドポイント
- エンジン
- 濃縮
- エンティティ
- エントリ
- 評価
- イベント
- イベント
- 例
- 例
- 期待する
- 期待
- 体験
- 説明
- 探る
- 延伸
- false
- 特徴
- フィードバック
- 少数の
- ファイナル
- ファイナンシャル
- 金融機関
- 金融部門
- もう完成させ、ワークスペースに掲示しましたか?
- フィンテック
- フォーカス
- フォロー中
- 詐欺
- 不正検出
- 不正防止
- 詐欺師
- 不正な
- 不正行為
- 無料版
- から
- 完全に
- さらに
- 未来
- 利得
- 集まり
- 生成する
- グローバル
- 政府・公共機関
- 大いに
- 実践的な
- 持ってる
- he
- 重く
- 助けます
- 助け
- より高い
- 歴史的
- history
- 認定条件
- しかしながら
- HTML
- HTTPS
- 人間
- 同一の
- 識別する
- アイデンティティ
- 身元確認
- 直ちに
- 影響を受けた
- 改善します
- 改善
- 改善
- in
- 増える
- 増加した
- 増加
- の増加
- 情報に基づく
- 初期
- 洞察
- 不安定
- 機関
- インテリジェント-
- に
- 調査
- IP
- IT
- ITS
- JPG
- 既知の
- ラベル
- 欠如
- 風景
- 大
- 主要な
- LEARN
- 学習
- レベル
- ような
- 限定的
- 制限
- 少し
- 損失
- ロー
- 導入トータルコストの
- 機械
- 機械学習
- make
- 作成
- マネージド
- 管理
- マニュアル
- 多くの
- マッチ
- 措置
- メソッド
- メトリック
- かもしれない
- 最小
- ML
- モデル
- 近代化します
- モニター
- 他には?
- さらに
- の試合に
- 名
- 新作
- 今
- 数
- of
- on
- オンライン
- の
- 最適な
- 最適化
- オプション
- or
- 組織
- 組織
- その他
- 私たちの
- 優れたパフォーマンス
- が
- 克服する
- 自分の
- 最高の
- 情熱的な
- パターン
- 支払い
- 支払いプロバイダ
- 支払い
- パフォーマンス
- 実行する
- ファーマ
- 場所
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポイント
- 正の
- 可能
- ポスト
- :
- 予測
- 予測
- プレゼンス
- 予防
- 防止
- 問題
- プロセス
- ラボレーション
- 保護
- 提供します
- プロバイダ
- は、大阪で
- 公共
- 品質
- 質問
- すぐに
- 範囲
- 価格表
- への
- 減らします
- リリース
- 報告
- レポート
- 要件
- 要件
- 研究
- リソース
- 応答
- 結果
- 結果
- レビュー
- リスク
- リスク管理
- 職種
- ルール
- ルール
- シナリオ
- 科学者
- スコア
- SDDK
- セクター
- シニア
- 役立つ
- サービス
- サービス
- セット
- シェアリング
- ショップ
- すべき
- 表示する
- 示す
- 作品
- 重要
- 著しく
- 単に
- サイズ
- 小さい
- So
- 溶液
- ソリューション
- 解決する
- 解決
- 一部
- 洗練された
- 専門家
- 専門家
- 特に
- 過ごす
- start
- スタートアップ
- Status:
- 手順
- 保存され
- 店舗
- そのような
- 表面
- システム
- テーブル
- 戦術
- チーム
- テクニック
- テクノロジー
- test
- より
- それ
- 世界
- アプリ環境に合わせて
- それによって
- したがって、
- ボーマン
- 彼ら
- この
- 介して
- 時間
- 時間がかかる
- 〜へ
- 今日の
- 一緒に
- top
- 伝統的な
- トレーニング
- 訓練された
- トレーニング
- 取引
- トレンド
- 一般的に
- 最終的に
- 不確実性
- アップデイト
- 更新しました
- つかいます
- ユーザー
- 検証
- 値
- Verification
- 確認する
- 訪問
- ボリューム
- ボリューム
- ました
- 方法
- we
- この試験は
- which
- while
- ワークフロー
- ワーキング
- 世界
- 年
- You
- あなたの
- ゼファーネット