Amazon Fraud Detector を使用して不正検出における機械学習のコールドスタートの課題を克服する

プラトン再発行

フォロワー： 0

より多くの企業が顧客により良いサービスを提供するためにオンラインプレゼンスを高めるにつれて、新しい詐欺パターンが絶えず出現しています。進化し続ける今日のデジタル環境では、詐欺師の手口がますます巧妙化しており、そのような詐欺行為を検出して防止することは、企業や金融機関にとって最も重要になっています。

従来のルールベースの不正検出システムは、定義済みのルールとしきい値に依存して潜在的な不正行為にフラグを立てるため、迅速に反復する能力に限界があります。これらのシステムは多数の誤検知を生成する可能性があり、詐欺チームが実行する手動調査の量が大幅に増加します。さらに、人間はエラーが発生しやすく、大量のデータを処理する能力が限られているため、不正を検出するための手動の作業には時間がかかり、不正な取引の見逃し、損失の増加、評判の低下につながる可能性があります。

機械学習 (ML) は、大量のデータを迅速かつ正確に分析して、異常なパターンと可能性のある不正の傾向を特定できるため、不正の検出において重要な役割を果たします。 ML 詐欺モデルのパフォーマンスは、トレーニング対象のデータの品質に大きく依存します。特に、教師ありモデルの場合、正確なラベル付きデータが重要です。 ML では、モデルをトレーニングするための重要な履歴データが不足していることを、 コールドスタートの問題.

不正検出の世界では、以下にいくつかの従来のコールドスタートシナリオを示します。

取引履歴や不正事例がなくても、正確な不正モデルを構築する
新しい顧客やアカウントの正当な活動と詐欺を正確に区別できること
詐欺システムによってこれまでに見られなかったアドレスまたは受益者へのリスク決定支払い

これらのシナリオを解決するには、複数の方法があります。たとえば、万能モデルと呼ばれる一般的なモデルを使用できます。これらのモデルは通常、詐欺コンソーシアムのような詐欺データ共有プラットフォーム上でトレーニングされます。このアプローチの課題は、同じビジネスはなく、詐欺攻撃のベクトルは絶えず変化することです。

もう XNUMX つのオプションは、教師なし異常検出モデルを使用して、顧客イベントの異常な動作を監視し、明らかにすることです。このアプローチの課題は、すべての不正イベントが異常であるとは限らず、すべての異常が実際に不正であるとは限らないことです。したがって、より高い偽陽性率が期待できます。

この記事では、100 個のイベントを使用して、リアルタイムの不正防止 ML モデルをすばやくブートストラップする方法を示します。アマゾン詐欺検出器新機能、コールドスタート、それにより、大規模なデータセットを収集して正確にラベル付けする時間や能力がない多くの組織にとって、カスタム ML モデルへの参入障壁が劇的に低下します。さらに、Amazon Fraud Detector に保存されたイベントを使用して、結果を確認し、イベントに正しくラベルを付けてモデルを再トレーニングする方法について説明します。これにより、時間の経過とともに不正防止対策の有効性が向上します。

ソリューションの概要

Amazon Fraud Detector は、オンラインでの潜在的な不正行為の検出を自動化するフルマネージド型の不正検出サービスです。 Amazon Fraud Detector を使用して、独自の履歴データセットを使用してカスタマイズされた不正検出モデルを構築し、組み込みのルールエンジンを使用して決定ロジックを追加し、ボタンをクリックするだけでリスク決定ワークフローを調整できます。

以前は、モデルをトレーニングするために、少なくとも 10,000 の詐欺の例を含む 400 を超えるラベル付きイベントを提供する必要がありました。コールドスタート機能のリリースにより、最小 100 のイベントと少なくとも 50 の不正として分類されたモデルをすばやくトレーニングできます。初期のデータ要件と比較すると、履歴データが 99% 削減され、ラベル要件が 87% 削減されています。

新しいコールドスタート機能は、小規模なデータセットを強化、拡張、およびリスクモデリングするためのインテリジェントな方法を提供します。さらに、Amazon Fraud Detector は、ラベルの割り当てと、ラベルのないイベントのサンプリングを実行します。

公開データセットを使用して実行された実験では、制限を 50 件の不正と 100 件のイベントのみに下げることで、教師なしおよび半教師ありモデルよりも一貫して優れたパフォーマンスを発揮する不正 ML モデルを構築できることが示されています。

コールドスタートモデルの性能

目に見えないデータを一般化して正確な予測を行う ML モデルの能力は、トレーニングデータセットの品質と多様性の影響を受けます。コールドスタートモデルの場合も同様です。これらのイベントに正しくラベルを付けてモデルを再トレーニングし、最終的に最適なモデルパフォーマンスに導くために、より多くのデータが収集されるため、適切なプロセスを用意する必要があります。

データ要件が低くなると、モデルの分散が大きくなり、テストデータのサイズが制限されるため、報告されるパフォーマンスの不安定性が高まります。モデルのパフォーマンスに対する正しい期待を構築するのに役立つように、モデルの AUC に加えて、Amazon Fraud Detector は不確実性の範囲のメトリクスも報告します。次の表は、これらのメトリックを定義しています。

.	.	AUC
.	.	<0.6	0.6 – 0.8	>= 0.8
AUC 不確実性間隔	> 0.3	モデルのパフォーマンスは非常に低く、大きく異なる場合があります。不正検出のパフォーマンスが低いことが予想されます。	モデルのパフォーマンスは低く、大幅に異なる場合があります。限られた不正検出パフォーマンスが予想されます。	モデルのパフォーマンスは大きく異なる場合があります。
	0.1 – 0.3	モデルのパフォーマンスは非常に低く、大幅に異なる場合があります。不正検出のパフォーマンスが低いことが予想されます。	モデルのパフォーマンスは低く、大幅に異なる場合があります。限られた不正検出パフォーマンスが予想されます。	モデルのパフォーマンスは大幅に異なる場合があります。
	<0.1	モデルのパフォーマンスは非常に低いです。不正検出のパフォーマンスが低いことが予想されます。	モデルのパフォーマンスは低いです。限られた不正検出パフォーマンスが予想されます。	警告なし

コールドスタートモデルのトレーニング

Cold Start 詐欺モデルのトレーニングは、他の Amazon Fraud Detector モデルのトレーニングと同じです。異なるのはデータセットのサイズです。コールドスタートトレーニングのサンプルデータセットは、 GitHubレポ。 Amazon Fraud Detector カスタムモデルをトレーニングするには、ハンズオンに従ってください。チュートリアル。どちらかを使用できます Amazon Fraud Detector コンソールのチュートリアルまたは SDKチュートリアル不正検出モデルを構築、トレーニング、デプロイする。

モデルのトレーニングが完了したら、パフォーマンスメトリックを確認し、ステータスを次のように変更してデプロイできます。 アクティブ. モデルスコアとパフォーマンスメトリックの詳細については、次を参照してください。モデルスコアおよびモデルのパフォーマンスメトリック. この時点で、モデルを検出器に追加できるようになりました。ビジネスルールモデルが出力するリスクスコアを解釈し、 GetEventPrediction APIです。

Fraud ML モデルの継続的な改善とフィードバックループ

Amazon Fraud Detector コールドスタート機能を使用すると、不正検出エンドポイントをすばやくブートストラップし、すぐにビジネスの保護を開始できます。ただし、新しい詐欺パターンが絶えず出現しているため、コールドスタートモデルを新しいデータで再トレーニングして、時間の経過とともに予測の精度と有効性を向上させることが重要です。

モデルの反復処理を支援するために、Amazon Fraud Detector は推論のためにサービスに送信されたすべてのイベントを自動的に保存します。次のスクリーンショットに示すように、イベントタイプレベルでイベントインジェストフラグがオンになっていることを変更または検証できます。

Overcome the machine learning cold start challenge in fraud detection using Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertical Search. Ai.

保存されたイベント機能を使用すると、Amazon Fraud Detector SDK を使用してプログラムでイベントにアクセスし、イベントのメタデータと予測の説明を確認して、情報に基づいたリスク決定を下すことができます。さらに、将来のモデルの再トレーニングと継続的なモデルの改善のために、イベントにラベルを付けることができます。次の図は、このワークフローの例を示しています。

Overcome the machine learning cold start challenge in fraud detection using Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertical Search. Ai.

次のコードスニペットでは、保存されたイベントにラベルを付けるプロセスを示します。

イベントでリアルタイムの不正予測を行うには、GetEventPrediction API を呼び出します。

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

API 応答:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

応答に見られるように、一致した意思決定エンジンのルールに基づいて、不正行為チームによる手動レビューのためにイベントを送信する必要があります。予測説明のメタデータを収集することで、各イベント変数がモデルの不正予測スコアにどのように影響したかについての洞察を得ることができます。

これらの洞察を収集するために、 get_event_prediction_metada API：

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

API 応答:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

これらの洞察により、不正アナリストは問題のイベントについて情報に基づいたリスク決定を下し、イベントラベルを更新できます。

イベントラベルを更新するには、 update_event_label API：

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

APIレスポンス

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

最後の手順として、イベントラベルが正しく更新されたかどうかを確認できます。

イベントラベルを確認するには、 get_event API：

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

APIレスポンス

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

クリーンアップ

今後の料金の発生を避けるために、ソリューション用に作成されたリソースを削除してください。

まとめ

この投稿では、Amazon Fraud Detector の新しい Cold Start 機能を使用して、わずか 100 のイベントでリアルタイムの不正防止システムをすばやくブートストラップする方法を示しました。保存されたイベントを使用して結果を確認し、イベントに正しくラベルを付けてモデルを再トレーニングし、時間の経過とともに不正防止対策の有効性を向上させる方法について説明しました。

Amazon Fraud Detector などの完全マネージド型の AWS サービスは、企業がユーザーの行動を分析してプラットフォームでの不正行為を特定し、ビジネス価値の促進により集中するために費やす時間を削減するのに役立ちます。 Amazon Fraud Detector がビジネスにどのように役立つかについて詳しくは、次のサイトをご覧ください。アマゾン詐欺探知機.

著者について

マルセル・ピビダル ワールドワイドスペシャリストオーガニゼーションのグローバルシニア AI サービスソリューションアーキテクトです。 Marcel は、FinTechs、決済プロバイダー、製薬会社、および政府機関のテクノロジーを通じてビジネス上の問題を解決してきた 20 年以上の経験を持っています。彼が現在注力している分野は、リスク管理、詐欺防止、本人確認です。

ジュリア・シュー Amazon Fraud Detector のリサーチサイエンティストです。彼女は、機械学習技術を使用して顧客の課題を解決することに情熱を注いでいます。余暇には、ハイキング、絵を描くこと、新しいコーヒーショップを探索することを楽しんでいます。

ギエルメ・リッチ は AWS のシニアソリューションアーキテクトであり、スタートアップ企業がアプリケーションのコストを最新化して最適化するのを支援しています。金融セクターの企業で 10 年以上の経験を持つ彼は、現在 AI/ML スペシャリストのチームと協力しています。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
Platoblockchain。 Web3メタバースインテリジェンス。知識の増幅。こちらからアクセスしてください。
未来を鋳造する w エイドリエン・アシュリー。こちらからアクセスしてください。
情報源： https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

タイムスタンプ： 2023 年 4 月 17 日

タイムスタンプ： 2023 年 3 月 10 日

プラトン再発行

デフォルトのライフサイクル設定でAmazonSageMakerStudioでAmazonSageMakerDataWranglerを使用する

AWS 専用アクセラレータを使用して、機械学習ワークロードのエネルギー消費を最大 90% 削減 | アマゾンウェブサービス

Amazon Lex の新しい生成 AI 機能でセルフサービスアシスタントを強化 | アマゾンウェブサービス

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー