オンラインアプリケーションの採用の増加とインターネットユーザーの増加に伴い、デジタル詐欺は年々増加しています。 アマゾン詐欺検出器 高度な機械学習(ML)技術と、Amazonによる20年以上の不正検出の専門知識を使用して、不正の可能性のあるオンラインアクティビティをより適切に特定するのに役立つフルマネージドサービスを提供します。
複数のユースケースにわたって不正をより迅速にキャッチできるように、Amazon Fraud Detectorは、調整されたアルゴリズム、エンリッチメント、および機能変換を備えた特定のモデルを提供します。 モデルトレーニングは完全に自動化されており、手間がかかりません。次の手順に従うことができます。 ユーザーガイド または関連 ブログ記事 始めるために。 ただし、トレーニング済みのモデルでは、モデルを展開する準備ができているかどうかを判断する必要があります。 これには、ML、統計、不正検出に関する特定の知識が必要であり、いくつかの一般的なアプローチを知っておくと役立つ場合があります。
この投稿は、モデルのパフォーマンスを診断し、展開に適したモデルを選択するのに役立ちます。 Amazon Fraud Detectorが提供する指標を確認し、潜在的な問題の診断を支援し、モデルのパフォーマンスを向上させるための提案を提供します。 このアプローチは、Online Fraud Insights(OFI)モデルテンプレートとTransaction Fraud Insights(TFI)モデルテンプレートの両方に適用できます。
ソリューションの概要
この投稿では、モデルのパフォーマンスを診断するためのエンドツーエンドのプロセスを提供します。 最初に、AUC、スコア分布、混同行列、ROC曲線、モデル変数の重要度など、AmazonFraudDetectorコンソールに表示されるすべてのモデルメトリックを紹介します。 次に、さまざまなメトリックを使用してモデルのパフォーマンスを診断するためのXNUMX段階のアプローチを示します。 最後に、一般的な問題のモデルパフォーマンスを改善するための提案を提供します。
前提条件
Amazon Fraud Detectorモデルを深く掘り下げる前に、次の前提条件を完了する必要があります。
- AWSアカウントを作成します。
- イベントデータセットを作成する モデルトレーニング用。
- データをアップロードする 〜へ Amazon シンプル ストレージ サービス (Amazon S3)または イベントデータをAmazonFraudDetectorに取り込みます.
- Amazon詐欺検出器モデルを構築する.
モデルメトリックを解釈する
モデルトレーニングが完了すると、Amazon Fraud Detectorは、モデルトレーニングで使用されなかったモデリングデータの一部を使用してモデルを評価します。 の評価指標を返します モデルバージョン そのモデルのページ。 これらのメトリックは、本番環境にデプロイした後に実際のデータで期待できるモデルのパフォーマンスを反映しています。
次のスクリーンショットは、AmazonFraudDetectorによって返されるモデルのパフォーマンスの例を示しています。 スコア分布(左)でさまざまなしきい値を選択でき、それに応じて混同行列(右)が更新されます。
次の調査結果を使用して、パフォーマンスを確認し、戦略ルールを決定できます。
- AUC(曲線の下の領域) –このモデルの全体的なパフォーマンス。 AUCが0.50のモデルは、ランダムな確率を表すため、コイントスに勝るものはありませんが、「完璧な」モデルのスコアは1.0になります。 AUCが高いほど、モデルは不正と正当なものをより適切に区別できます。
- スコア分布 –100,000イベントの母集団の例を想定したモデルスコア分布のヒストグラム。 Amazon Fraud Detectorは、0〜1000のモデルスコアを生成します。スコアが低いほど、不正のリスクは低くなります。 正当な(緑)集団と詐欺(青)集団の間のより良い分離は、通常、より良いモデルを示します。 詳細については、を参照してください。 モデルスコア.
- 混同行列 –真陽性、真陰性、偽陽性、偽陰性、真陽性率(TPR)、偽陽性率(FPR)など、選択した特定のスコアしきい値のモデルパフォーマンスを説明する表。 表のカウントは、100,0000イベントの例の母集団を想定しています。 詳細については、を参照してください。 モデルのパフォーマンスメトリック.
- ROC(受信者操作特性)曲線 –次のスクリーンショットに示すように、モデルの診断能力を示すプロット。 これは、すべての可能なモデルスコアしきい値に対する偽陽性率の関数として真陽性率をプロットします。 を選択してこのチャートを表示する 高度な指標。 XNUMXつのモデルの複数のバージョンをトレーニングした場合は、異なるFPRしきい値を選択して、パフォーマンスの変化を確認できます。
- モデル変数の重要性 –次のスクリーンショットに示すように、生成されたモデルへの寄与に基づくモデル変数のランク。 値が最も高いモデル変数は、そのモデルバージョンのデータセット内の他のモデル変数よりもモデルにとって重要であり、デフォルトで一番上に表示されます。 詳細については、を参照してください。 モデル変数の重要性.
モデルのパフォーマンスを診断する
モデルを本番環境にデプロイする前に、Amazon Fraud Detectorが返したメトリックを使用して、モデルのパフォーマンスを理解し、考えられる問題を診断する必要があります。 MLモデルの一般的な問題は、データ関連の問題とモデル関連の問題のXNUMXつの主要なカテゴリに分類できます。 Amazon Fraud Detectorは、検証セットとテストセットを慎重に使用してバックエンドでモデルを評価および調整することにより、モデル関連の問題を処理しました。 次の手順を実行して、モデルをデプロイする準備ができているかどうか、またはデータ関連の問題が発生している可能性があるかどうかを検証できます。
- モデル全体のパフォーマンス(AUCとスコア分布)を確認します。
- ビジネス要件(混同行列と表)を確認します。
- モデル変数の重要度を確認してください。
モデル全体のパフォーマンスを確認する:AUCとスコアの分布
将来のイベントのより正確な予測は、常に予測モデルの主要な目標です。 Amazon Fraud Detectorによって返されるAUCは、トレーニングで使用されていない適切にサンプリングされたテストセットで計算されます。 一般に、AUCが0.9を超えるモデルは、適切なモデルと見なされます。
パフォーマンスが0.8未満のモデルを観察した場合、それは通常、モデルに改善の余地があることを意味します(モデルのパフォーマンスが低い場合の一般的な問題については、この投稿の後半で説明します)。 「良好な」パフォーマンスの定義は、ビジネスとベースラインモデルに大きく依存することに注意してください。 AUCが0.8より大きい場合でも、この投稿の手順に従って、AmazonFraudDetectorモデルを改善することができます。
一方、AUCが0.99を超える場合は、モデルがテストセットの不正イベントと正当なイベントをほぼ完全に分離できることを意味します。 これは、「あまりにも良すぎて真実ではない」シナリオである場合があります(この投稿の後半で、非常に高いモデルパフォーマンスの一般的な問題について説明します)。
全体的なAUCに加えて、スコア分布はモデルがどの程度適合しているかを示すこともできます。 理想的には、スケールの両端に正当な不正の大部分が表示されているはずです。これは、モデルのスコアがテストセットのイベントを正確にランク付けできることを示しています。
次の例では、スコア分布のAUCは0.96です。
正当な分布と不正な分布が重複しているか、中央に集中している場合は、モデルが不正なイベントと正当なイベントを区別するのにうまく機能していないことを意味します。これは、履歴データの分布が変更されたか、より多くのデータや機能が必要であることを示している可能性があります。
以下は、AUCが0.64のスコア分布の例です。
不正と正当なイベントをほぼ完全に分割できる分割ポイントを見つけることができれば、モデルにラベルの漏洩の問題があるか、不正のパターンを検出しやすい可能性が高いため、注意が必要です。
次の例では、スコア分布のAUCは1.0です。
ビジネス要件の確認:混同行列と表
AUCはモデルのパフォーマンスの便利な指標ですが、ビジネス要件に直接変換されない場合があります。 Amazon Fraud Detectorは、不正キャプチャ率(真陽性率)、不正として誤って予測された正当なイベントの割合(偽陽性率)などのメトリックも提供します。これらは、ビジネス要件としてより一般的に使用されます。 適度に優れたAUCを使用してモデルをトレーニングした後、それらのメトリックを使用して、モデルとビジネス要件を比較する必要があります。
混同行列と表は、影響を確認し、それがビジネスニーズを満たしているかどうかを確認するためのインターフェイスを提供します。 数値はモデルのしきい値に依存することに注意してください。スコアがしきい値よりも大きいイベントは不正として分類され、スコアがしきい値よりも低いイベントは正当なものとして分類されます。 ビジネス要件に応じて、使用するしきい値を選択できます。
たとえば、目標が詐欺の73%をキャプチャすることである場合、(以下の例に示すように)855などのしきい値を選択できます。これにより、すべての詐欺の73%をキャプチャできます。 ただし、このモデルでは、3%の正当なイベントが不正であると誤って分類されます。 このFPRがビジネスに受け入れられる場合、モデルは展開に適しています。 それ以外の場合は、モデルのパフォーマンスを向上させる必要があります。
もう950つの例は、正当な顧客をブロックまたはチャレンジするためのコストが非常に高い場合、低FPRと高精度が必要です。 その場合、次の例に示すように、しきい値1を選択できます。これにより、正当な顧客の80%が不正として誤分類され、特定された不正のXNUMX%が実際に不正になります。
さらに、複数のしきい値を選択して、ブロック、調査、合格などのさまざまな結果を割り当てることができます。 すべてのビジネス要件を満たす適切なしきい値とルールが見つからない場合は、より多くのデータと属性を使用してモデルをトレーニングすることを検討する必要があります。
モデル変数の重要性を確認する
モデル変数の重要性 ペインには、各変数がモデルにどのように寄与するかが表示されます。 XNUMXつの変数の重要度が他の変数よりも大幅に高い場合は、ラベルの漏洩または不正パターンの検出が容易すぎることを示している可能性があります。 変数の重要度は、入力変数に集約されることに注意してください。 あなたがわずかに高い重要性を観察した場合 IP_ADDRESS
, CARD_BIN
, EMAIL_ADDRESS
, PHONE_NUMBER
, BILLING_ZIP
または SHIPPING_ZIP
、それは濃縮の力のためかもしれません。
次の例は、を使用した潜在的なラベルリークを伴うモデル変数の重要性を示しています investigation_status
.
モデル変数の重要性は、追加の変数がモデルにリフトをもたらす可能性があることのヒントも提供します。 たとえば、AUCが低く、販売者関連の機能の重要性が高い場合は、次のような注文機能をさらに収集することを検討してください。 SELLER_CATEGORY
, SELLER_ADDRESS
, SELLER_ACTIVE_YEARS
、およびそれらの変数をモデルに追加します。
モデルのパフォーマンスが低い場合の一般的な問題
このセクションでは、モデルのパフォーマンスの低下に関して発生する可能性のある一般的な問題について説明します。
履歴データの分布が変更されました
過去のデータ分散のドリフトは、大きなビジネスの変化やデータ収集の問題がある場合に発生します。 たとえば、最近新しい市場で製品を発売した場合、 IP_ADDRESS
, EMAIL
, ADDRESS
関連する機能は完全に異なる可能性があり、詐欺の手口も変更される可能性があります。 AmazonFraudDetectorは EVENT_TIMESTAMP
データを分割し、データセット内のイベントの適切なサブセットでモデルを評価します。 履歴データの分布が大幅に変化した場合、評価セットはトレーニングデータと大きく異なる可能性があり、報告されたモデルのパフォーマンスが低くなる可能性があります。
履歴データを調べることで、潜在的なデータ分布の変更の問題を確認できます。
- Amazon詐欺検出器データプロファイラー ラベルの不正率と欠落率が時間の経過とともに変化したかどうかを確認するためのツール。
- 特に変数の重要度が高い機能の場合、時間の経過に伴う変数の分布が大幅に変化したかどうかを確認します。
- ターゲット変数による経時的な変数分布を確認します。 最近のデータでXNUMXつのカテゴリからの不正イベントが大幅に多い場合は、ビジネス上の判断を使用して、変更が妥当かどうかを確認することをお勧めします。
ラベルの紛失率が非常に高い場合、または最新の日付で不正率が一貫して低下している場合は、ラベルが完全に成熟していないことを示している可能性があります。 最新のデータを除外するか、正確なラベルを収集するためにさらに長く待ってから、モデルを再トレーニングする必要があります。
特定の日付で不正率と変数の急激な増加が見られる場合は、それが外れ値であるかデータ収集の問題であるかを再確認することをお勧めします。 その場合は、それらのイベントを削除してモデルを再トレーニングする必要があります。
古いデータで現在および将来のビジネスを表すことができない場合は、古い期間のデータをトレーニングから除外する必要があります。 Amazon Fraud Detectorで保存されたイベントを使用している場合は、トレーニングジョブを構成するときに、新しいバージョンを再トレーニングして適切な日付範囲を選択するだけです。 それはまた、あなたのビジネスにおける詐欺の手口が時間とともに比較的急速に変化することを示しているかもしれません。 モデルの展開後、モデルを頻繁に再トレーニングする必要がある場合があります。
不適切な変数型マッピング
Amazon Fraud Detectorは、変数タイプに基づいてデータを強化および変換します。 Amazon Fraud Detectorモデルがデータの最大値を取得できるように、変数を正しいタイプにマッピングすることが重要です。 たとえば、マップする場合 IP
CATEGORICAL
代わりにタイプ IP_ADDRESS
、あなたは取得しません IP-
バックエンドの関連するエンリッチメント。
一般に、AmazonFraudDetectorは次のアクションを提案します。
- 変数を次のような特定のタイプにマップします
IP_ADDRESS
,EMAIL_ADDRESS
,CARD_BIN
,PHONE_NUMBER
、AmazonFraudDetectorが追加情報を抽出して強化できるようにします。 - 特定の変数タイプが見つからない場合は、次のXNUMXつのジェネリック型のいずれかにマップします。
NUMERIC
,CATEGORICAL
またはFREE_FORM_TEXT
. - 変数がテキスト形式であり、顧客レビューや製品説明などのカーディナリティが高い場合は、変数をにマップする必要があります。
FREE_FORM_TEXT
AmazonFraudDetectorがバックエンドのテキスト機能と埋め込みを抽出するように変数タイプ。 たとえば、マップする場合url_string
〜へFREE_FORM_TEXT
、URLをトークン化し、情報を抽出してダウンストリームモデルにフィードすることができます。これにより、URLからより多くの隠されたパターンを学習できます。
変数タイプのいずれかが変数構成で正しくマップされていない場合は、変数タイプを変更してからモデルを再トレーニングできます。
不十分なデータまたは機能
Amazon Fraud Detectorは、Online Fraud Insights(OFI)またはTransaction Fraud Insights(TFI)モデルをトレーニングするために少なくとも10,000のレコードを必要とし、これらのレコードのうち少なくとも400が不正であると識別されます。 TFIはまた、データセットの多様性を確保するために、不正な記録と正当な記録の両方がそれぞれ少なくとも100の異なるエンティティからのものであることを要求します。 さらに、Amazon Fraud Detectorでは、モデリングデータに少なくともXNUMXつの変数が必要です。 これらは、有用なAmazonFraudDetectorモデルを構築するための最小データ要件です。 ただし、より多くのレコードと変数を使用すると、通常、MLモデルがデータから基礎となるパターンをより適切に学習するのに役立ちます。 AUCが低い場合、またはビジネス要件を満たすしきい値が見つからない場合は、より多くのデータを使用してモデルを再トレーニングするか、モデルに新しい機能を追加することを検討する必要があります。 通常、私たちは見つけます EMAIL_ADDRESS
, IP
, PAYMENT_TYPE
, BILLING_ADDRESS
, SHIPPING_ADDRESS
, DEVICE
関連する変数は、不正の検出において重要です。
もうXNUMXつの考えられる原因は、一部の変数に含まれている欠落値が多すぎることです。 それが起こっているかどうかを確認するには、モデルトレーニングメッセージを確認し、を参照してください。 トレーニングデータの問題のトラブルシューティング 提案のため。
非常に高いモデルパフォーマンスの一般的な問題
このセクションでは、非常に高いモデルパフォーマンスに関連する一般的な問題について説明します。
ラベル漏れ
ラベルの漏洩は、トレーニングデータセットが予測時に利用可能であるとは予想されない情報を使用する場合に発生します。 実稼働環境で実行すると、モデルの有用性が過大評価されます。
高いAUC(1に近い)、完全に分離されたスコア分布、およびXNUMXつの変数の有意に高い変数の重要性は、潜在的なラベル漏洩の問題の指標となる可能性があります。 を使用して、機能とラベルの相関関係を確認することもできます。 データプロファイラーを選択します。 機能とラベルの相関関係 プロットは、各機能とラベルの間の相関関係を示しています。 0.99つの機能のラベルとの相関がXNUMXを超える場合は、ビジネス上の判断に基づいて、その機能が適切に使用されているかどうかを確認する必要があります。 たとえば、ローン申請を承認または却下するリスクモデルを構築するには、次のような機能を使用しないでください。 AMOUNT_PAID
、支払いは引受プロセスの後に行われるためです。 予測を行うときに変数が使用できない場合は、その変数をモデル構成から削除して、新しいモデルを再トレーニングする必要があります。
次の例は、各変数とラベルの間の相関関係を示しています。 investigation_status
ラベルとの相関が高い(1に近い)ため、ラベルの漏れの問題があるかどうかを再確認する必要があります。
単純な詐欺パターン
データの不正パターンが単純な場合、非常に高いモデルパフォーマンスも観察される可能性があります。 たとえば、モデリングデータ内のすべての不正イベントが同じ内部サービスプロバイダーを経由しているとします。 モデルが選択するのは簡単です IP-
関連する変数を返し、重要度の高い「完璧な」モデルを返します。 IP
.
単純な不正パターンは、必ずしもデータの問題を示しているわけではありません。 あなたのビジネスにおける詐欺の手口は簡単に捕らえることができるのは事実かもしれません。 ただし、結論を出す前に、モデルトレーニングで使用されるラベルが正確であり、モデリングデータが可能な限り多くの不正パターンをカバーしていることを確認する必要があります。 たとえば、特定のアプリケーションからのすべてのアプリケーションにラベルを付けるなど、ルールに基づいて不正イベントにラベルを付ける場合 BILLING_ZIP
さらに PRODUCT_CATEGORY
詐欺として、モデルはルールをシミュレートし、高いAUCを達成することにより、これらの詐欺を簡単にキャッチできます。
を使用して、各機能のさまざまなカテゴリまたはビンにまたがるラベルの分布を確認できます。 データプロファイラー。 たとえば、ほとんどの不正イベントがXNUMXつまたはいくつかの製品カテゴリから発生していることを確認した場合、それは単純な不正パターンの指標である可能性があり、データ収集またはプロセスの誤りではないことを確認する必要があります。 機能が次のような場合 CUSTOMER_ID
、モデルトレーニングでこの機能を除外する必要があります。
次の例は、次のさまざまなカテゴリにわたるラベルの配布を示しています。 product_category
。 すべての詐欺はXNUMXつの製品カテゴリから発生します。
不適切なデータサンプリング
データの一部のみをサンプリングしてAmazonFraudDetectorに送信すると、不適切なデータサンプリングが発生する可能性があります。 データが適切にサンプリングされておらず、本番環境のトラフィックを表していない場合、報告されたモデルのパフォーマンスは不正確になり、モデルは本番環境の予測に役立たない可能性があります。 たとえば、モデリングデータのすべての不正イベントがアジアからサンプリングされ、すべての合法的なイベントが米国からサンプリングされた場合、モデルはに基づいて不正と合法を分離することを学習する可能性があります。 BILLING_COUNTRY
。 その場合、モデルは他の母集団に適用される一般的なものではありません。
通常、サンプリングせずにすべての最新イベントを送信することをお勧めします。 データサイズと不正率に基づいて、AmazonFraudDetectorはモデルトレーニングの前にサンプリングを行います。 データが大きすぎて(100 GBを超える)、サブセットのみをサンプリングして送信することにした場合は、データをランダムにサンプリングし、サンプルが母集団全体を代表していることを確認する必要があります。 TFIの場合、エンティティごとにデータをサンプリングする必要があります。つまり、XNUMXつのエンティティをサンプリングする場合は、エンティティレベルの集計が正しく計算されるように、そのすべての履歴を含める必要があります。 データのサブセットのみをAmazonFraudDetectorに送信する場合、エンティティの以前のイベントが送信されていないと、推論中のリアルタイム集計が不正確になる可能性があることに注意してください。
もう2つの不適切なデータサンプリングは、モデルの構築に2日のデータなどの短期間のデータのみを使用することである可能性があります。 特にビジネス攻撃や詐欺攻撃に季節性がある場合は、データに偏りが生じる可能性があります。 不正の種類の多様性を確保するために、通常、モデリングに少なくともXNUMXサイクル(XNUMX週間やXNUMXか月など)のデータを含めることをお勧めします。
まとめ
すべての潜在的な問題を診断して解決した後、有用なAmazon Fraud Detectorモデルを入手し、そのパフォーマンスに自信を持つ必要があります。 次のステップでは、 モデルとビジネスルールを使用して検出器を作成できます、シャドウモード評価のために本番環境にデプロイする準備をします。
付録
モデルトレーニングの変数を除外する方法
深く掘り下げた後、変動するリークターゲット情報を特定し、それをモデルトレーニングから除外したい場合があります。 次の手順を実行することで、不要な変数を除いてモデルバージョンを再トレーニングできます。
- Amazon Fraud Detectorコンソールのナビゲーションペインで、[ Models.
- ソフトウェア設定ページで、下図のように Models ページで、再トレーニングするモデルを選択します。
- ソフトウェア設定ページで、下図のように メニュー、選択 新しいバージョンをトレーニングする.
- 使用する日付範囲を選択して選択します Next.
- ソフトウェア設定ページで、下図のように トレーニングを構成する ページで、モデルトレーニングで使用しない変数の選択を解除します。
- 不正ラベルと正当なラベル、およびAmazon Fraud Detectorでラベルのないイベントをどのように使用するかを指定してから、 Next.
- モデル構成を確認して、 モデルの作成とトレーニング.
イベント変数タイプを変更する方法
変数は、不正防止に使用されるデータ要素を表します。 Amazon Fraud Detectorでは、すべての変数がグローバルであり、すべてのイベントとモデルで共有されます。つまり、XNUMXつの変数を複数のイベントで使用できます。 たとえば、IPはサインインイベントに関連付けることができ、トランザクションイベントにも関連付けることができます。 当然、Amazon Fraud Detectorは、変数が作成されると、変数タイプとデータタイプをロックしました。 既存の変数を削除するには、最初に関連するすべてのイベントタイプとモデルを削除する必要があります。 Amazon Fraud Detectorに移動して、特定の変数に関連付けられているリソースを確認できます。 Variables ナビゲーションペインで、変数名と 関連リソース.
変数と関連するすべてのイベントタイプを削除します
変数を削除するには、次の手順を実行します。
- Amazon Fraud Detectorコンソールのナビゲーションペインで、[ Variables.
- 削除する変数を選択します。
- 選択する 関連リソース この変数を使用したすべてのイベントタイプのリストを表示します。
変数を削除する前に、これらの関連するイベントタイプを削除する必要があります。 - リストからイベントタイプを選択して、関連するイベントタイプページに移動します。
- 選択する 保存されたイベント このイベントタイプでデータが保存されているかどうかを確認します。
- Amazon Fraud Detectorにイベントが保存されている場合は、 保存されたイベントを削除する 保存されたイベントを削除します。
削除ジョブが完了すると、「このイベントタイプの保存されたイベントは正常に削除されました」というメッセージが表示されます。 - 選択する 関連リソース.
検出器とモデルがこのイベントタイプに関連付けられている場合は、最初にそれらのリソースを削除する必要があります。 - 検出器が関連付けられている場合は、次の手順を実行して、関連付けられているすべての検出器を削除します。
- 検出器を選択して 検出器の詳細 ページで見やすくするために変数を解析したりすることができます。
- モデルバージョン ペインで、検出器のバージョンを選択します。
- 検出器のバージョンページで、 .
- 検出器のバージョンがアクティブな場合は、 非活性化します、選択する この検出器のバージョンを別のバージョンに置き換えずに非アクティブ化する、選択して 検出器のバージョンを無効にします。
- 検出器のバージョンが非アクティブ化された後、 その後 削除.
- これらの手順を繰り返して、すべての検出器バージョンを削除します。
- ソフトウェア設定ページで、下図のように 検出器の詳細 ページ、選択 関連するルール.
- 削除するルールを選択します。
- 選択する & ルールバージョンを削除する.
- ルール名を入力して確認し、選択します バージョンを削除.
- これらの手順を繰り返して、関連するすべてのルールを削除します。
- すべての検出器のバージョンと関連するルールが削除されたら、 検出器の詳細 ページ、選択 、選択して 検出器を削除.
- 検出器の名前を入力して、 検出器を削除.
- これらの手順を繰り返して、次の検出器を削除します。
- イベントタイプに関連付けられているモデルがある場合は、次の手順を実行してモデルを削除します。
- モデルの名前を選択します。
- モデルバージョン ペインで、バージョンを選択します。
- モデルのステータスが
Active
、選択する & モデルバージョンのアンデプロイ. - 入力します
undeploy
確認して選択する モデルバージョンのアンデプロイ.
ステータスがに変わりますUndeploying
。 プロセスが完了するまでに数分かかります。 - ステータスが
Ready to deploy
、[アクション]と[削除]を選択します。 - これらの手順を繰り返して、すべてのモデルバージョンを削除します。
- [モデルの詳細]ページで、[アクション]と[モデルの削除]を選択します。
- モデルの名前を入力し、モデルの削除を選択します。
- これらの手順を繰り返して、次のモデルを削除します。
- 関連するすべての検出器とモデルが削除されたら、 & イベントタイプを削除 イベントの詳細 ページで見やすくするために変数を解析したりすることができます。
- イベントタイプの名前を入力し、を選択します イベントタイプを削除.
- ナビゲーションペインで、 Variables、削除する変数を選択します。
- 前の手順を繰り返して、変数に関連付けられているすべてのイベントタイプを削除します。
- ソフトウェア設定ページで、下図のように 変数の詳細 ページ、選択 & 削除します。
- 変数の名前を入力して、 変数を削除.
正しい変数タイプで新しい変数を作成します
変数と関連するすべてのイベントタイプ、保存されたイベント、モデル、および検出器をAmazon Fraud Detectorから削除した後、同じ名前の新しい変数を作成し、それを正しい変数タイプにマップできます。
- Amazon Fraud Detectorコンソールのナビゲーションペインで、[ Variables.
- 選択する 創造する.
- 変更する変数名(前に削除した変数名)を入力します。
- 変更する正しい変数タイプを選択します。
- 選択する 変数を作成します。
データをアップロードしてモデルを再トレーニングする
変数タイプを更新した後、データを再度アップロードして、新しいモデルをトレーニングできます。 手順については、を参照してください。 新しいAmazonFraudDetector機能でオンライン取引詐欺を検出する.
既存のイベントタイプに新しい変数を追加する方法
既存のイベントタイプに新しい変数を追加するには、次の手順を実行します。
- 以前のトレーニングCVSファイルに新しい変数を追加します。
- 新しいトレーニングデータファイルをS3バケットにアップロードします。 トレーニングファイルのAmazonS3の場所をメモします(たとえば、
s3://bucketname/path/to/some/object.csv
)とあなたの役割名。 - Amazon Fraud Detectorコンソールのナビゲーションペインで、[ イベント。
- ソフトウェア設定ページで、下図のように イベントの種類 ページで、変数を追加するイベントタイプの名前を選択します。
- ソフトウェア設定ページで、下図のように イベントタイプ 詳細ページで、 をタップし、その後、 変数を追加する.
- このイベントの変数を定義する方法を選択してください、選択する トレーニングデータセットから変数を選択します.
- IAMロールの場合、既存のIAMロールを選択するか、AmazonS3のデータにアクセスするための新しいロールを作成します。
- データの場所、新しいトレーニングファイルのS3の場所を入力し、 アップロードします。
既存のイベントタイプに存在しない新しい変数がリストに表示されます。
- 選択する 変数を追加します。
これで、新しい変数が既存のイベントタイプに追加されました。 Amazon Fraud Detectorで保存されたイベントを使用している場合、保存されたイベントの新しい変数はまだ欠落しています。 新しい変数を含むトレーニングデータをAmazonFraudDetectorにインポートしてから、新しいモデルバージョンを再トレーニングする必要があります。 同じもので新しいトレーニングデータをアップロードする場合 EVENT_ID
& EVENT_TIMESTAMP
、新しいイベント変数は、AmazonFraudDetectorに保存されている以前のイベント変数を上書きします。
著者について
ジュリア・シュー AmazonFraudDetectorのリサーチサイエンティストです。 彼女は機械学習技術を使用して顧客の課題を解決することに情熱を注いでいます。 余暇には、ハイキング、絵画、新しいコーヒーショップの探索を楽しんでいます。
ハオジョウ Amazon FraudDetectorのリサーチサイエンティストです。 彼は、米国ノースウェスタン大学で電気工学の博士号を取得しています。 彼は、詐欺や虐待と戦うために機械学習技術を適用することに情熱を注いでいます。
アビシェーク・ラヴィ はAmazonFraudDetectorのシニアプロダクトマネージャーです。 彼は、技術的な能力を活用して顧客を喜ばせる製品を構築することに情熱を注いでいます。
- "
- 000
- 10
- 100
- 20年
- 9
- a
- 能力
- 私たちについて
- アクセス
- それに応じて
- 正確な
- 越えて
- 行動
- アクティブ
- 活動
- 追加されました
- 添加
- NEW
- 養子縁組
- 高度な
- アルゴリズム
- すべて
- ことができます
- 常に
- Amazon
- 適用可能な
- 申し込み
- 適用された
- 適用
- アプローチ
- アプローチ
- 適切な
- 承認する
- AREA
- アジア
- 関連する
- 注意
- 属性
- 自動化
- 利用できます
- AWS
- ベースライン
- なぜなら
- 以下
- より良いです
- の間に
- ブロック
- 国境
- 持って来る
- ビルド
- ビジネス
- 計算された
- 機能
- キャプチャー
- これ
- 場合
- 例
- レスリング
- カテゴリー
- 原因となる
- 一定
- 課題
- 挑戦
- 変化する
- 選択する
- 分類された
- コーヒー
- コイン
- 収集する
- 収集
- コレクション
- 戦闘
- 来ます
- コマンドと
- コンプリート
- 完全に
- 完了
- 確信して
- 混乱
- 検討
- 領事
- 便利
- 可能性
- 作ります
- 作成した
- 電流プローブ
- 曲線
- 顧客
- Customers
- データ
- 試合日
- 深いです
- によっては
- 依存
- 展開します
- 展開する
- 展開
- 説明
- 細部
- 検出
- 異なります
- デジタル
- 直接に
- 話し合います
- ディスプレイ
- ディストリビューション
- ディストリビューション
- 多様性
- そうではありません
- 落とした
- 間に
- 各
- 簡単に
- 要素は
- 端から端まで
- 終了
- エンジニアリング
- 豊かにする
- 入力します
- エンティティ
- エンティティ
- 環境
- 特に
- 評価する
- 評価
- イベント
- イベント
- 例
- 除外
- 既存の
- 期待する
- 予想される
- 専門知識
- 抽出物
- 速いです
- 特徴
- 特徴
- 最後に
- 名
- フォロー中
- フォーム
- 詐欺
- 無料版
- から
- function
- 未来
- 生成された
- グローバル
- 目標
- 良い
- 大きい
- グリーン
- 成長性
- 起こる
- 助けます
- 役立つ
- ことができます
- ハイ
- より高い
- 非常に
- 歴史的
- history
- 保持している
- 認定条件
- How To
- しかしながら
- HTTPS
- 識別する
- 影響
- 重要性
- 重要
- 改善します
- 改善
- include
- 含めて
- 示す
- 情報
- 洞察
- インタフェース
- インターネット
- 調べる
- IP
- 問題
- 問題
- IT
- ジョブ
- 判断
- 知っている
- 知識
- ラベル
- ラベリング
- ラベル
- 大
- より大きい
- 最新の
- 打ち上げ
- 漏れ
- LEARN
- 学習
- レベル
- 活用
- リスト
- リストされた
- 場所
- ロック
- 機械
- 機械学習
- make
- 作成
- マネージド
- マネージャー
- 地図
- 市場
- マトリックス
- 手段
- メッセージ
- メトリック
- かもしれない
- 最小
- ML
- モデル
- ヶ月
- 他には?
- 最も
- の試合に
- ナビゲート
- ナビゲーション
- ニーズ
- 負
- 新しい特徴
- ニューマーケット
- 次の
- 数
- 番号
- オファー
- オンライン
- オペレータ
- 注文
- その他
- さもないと
- 全体
- 部
- 情熱的な
- 支払い
- 割合
- パフォーマンス
- 期間
- ポイント
- 人口
- 正の
- 可能
- 潜在的な
- 電力
- 予測
- 現在
- 防止
- 前
- 主要な
- 問題
- プロセス
- プロダクト
- 生産
- 製品
- 提供します
- 提供
- プロバイダー
- は、大阪で
- すぐに
- 範囲
- への
- 合理的な
- 最近
- 最近
- 推奨する
- 記録
- 反映する
- に対する
- 表す
- 代表者
- 表し
- 要件
- 必要
- 研究
- リソース
- return
- 収益
- レビュー
- 上昇
- リスク
- 職種
- ルール
- ラン
- 同じ
- 規模
- 科学者
- 選択
- サービス
- セッションに
- 影
- shared
- ショップ
- ショート
- 表示する
- 示す
- 簡単な拡張で
- サイズ
- So
- 固体
- 解決
- 一部
- 特定の
- split
- 開始
- 統計
- Status:
- まだ
- ストレージ利用料
- 戦略
- 首尾よく
- ターゲット
- 技術的
- テクニック
- テンプレート
- test
- テスト
- 三
- しきい値
- 介して
- 時間
- ツール
- top
- TPR
- トラフィック
- トレーニング
- トレーニング
- トランザクション
- 変換
- 一般的に
- 下
- わかる
- 大学
- アップデイト
- us
- USA
- つかいます
- users
- 通常
- ユーティリティ
- 値
- バージョン
- 詳しく見る
- wait
- この試験は
- かどうか
- while
- 無し
- 価値
- でしょう
- 年
- 年
- あなたの