Διαγνώστε την απόδοση του μοντέλου πριν από την ανάπτυξη για το Amazon Fraud Detector

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Με την αύξηση της υιοθέτησης διαδικτυακών εφαρμογών και τον αυξανόμενο αριθμό χρηστών του Διαδικτύου, η ψηφιακή απάτη αυξάνεται χρόνο με το χρόνο. Ανιχνευτής απάτης Amazon παρέχει μια πλήρως διαχειριζόμενη υπηρεσία για να σας βοηθήσει να εντοπίζετε καλύτερα πιθανές δόλιες διαδικτυακές δραστηριότητες χρησιμοποιώντας προηγμένες τεχνικές μηχανικής μάθησης (ML) και περισσότερα από 20 χρόνια εμπειρίας στον εντοπισμό απάτης από την Amazon.

Για να σας βοηθήσει να εντοπίσετε την απάτη πιο γρήγορα σε περιπτώσεις πολλαπλών χρήσεων, το Amazon Fraud Detector προσφέρει συγκεκριμένα μοντέλα με προσαρμοσμένους αλγόριθμους, εμπλουτισμούς και μετασχηματισμούς χαρακτηριστικών. Η εκπαίδευση μοντέλων είναι πλήρως αυτοματοποιημένη και χωρίς προβλήματα και μπορείτε να ακολουθήσετε τις οδηγίες στο τον οδηγό χρήστη ή σχετικές blog θέσεις για να ξεκινήσετε. Ωστόσο, με εκπαιδευμένα μοντέλα, πρέπει να αποφασίσετε εάν το μοντέλο είναι έτοιμο για ανάπτυξη. Αυτό απαιτεί ορισμένες γνώσεις σε θέματα ML, στατιστικών και ανίχνευσης απάτης και μπορεί να είναι χρήσιμο να γνωρίζετε ορισμένες τυπικές προσεγγίσεις.

Αυτή η ανάρτηση θα σας βοηθήσει να διαγνώσετε την απόδοση του μοντέλου και να επιλέξετε το σωστό μοντέλο για ανάπτυξη. Περιηγούμαστε στις μετρήσεις που παρέχονται από το Amazon Fraud Detector, σας βοηθούμε να διαγνώσετε πιθανά προβλήματα και παρέχουμε προτάσεις για τη βελτίωση της απόδοσης του μοντέλου. Οι προσεγγίσεις ισχύουν τόσο για τα πρότυπα μοντέλων Online Fraud Insights (OFI) όσο και Transaction Fraud Insights (TFI).

Επισκόπηση λύσεων

Αυτή η ανάρτηση παρέχει μια διαδικασία από άκρο σε άκρο για τη διάγνωση της απόδοσης του μοντέλου σας. Αρχικά εισάγει όλες τις μετρήσεις του μοντέλου που εμφανίζονται στην κονσόλα Amazon Fraud Detector, συμπεριλαμβανομένης της AUC, της κατανομής βαθμολογίας, του πίνακα σύγχυσης, της καμπύλης ROC και της σημασίας μεταβλητής μοντέλου. Στη συνέχεια παρουσιάζουμε μια προσέγγιση τριών βημάτων για τη διάγνωση της απόδοσης του μοντέλου χρησιμοποιώντας διαφορετικές μετρήσεις. Τέλος, παρέχουμε προτάσεις για τη βελτίωση της απόδοσης του μοντέλου για τυπικά ζητήματα.

Προϋποθέσεις

Πριν βουτήξετε βαθιά στο μοντέλο του Amazon Fraud Detector, πρέπει να ολοκληρώσετε τις ακόλουθες προϋποθέσεις:

Δημιουργήστε έναν λογαριασμό AWS.
Δημιουργήστε ένα σύνολο δεδομένων συμβάντων για εκπαίδευση μοντέλων.
Ανεβάστε τα δεδομένα σας προς την Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3) ή εισαγάγετε τα δεδομένα συμβάντων σας στο Amazon Fraud Detector.
Δημιουργήστε ένα μοντέλο Amazon Fraud Detector.

Ερμηνεύστε τις μετρήσεις του μοντέλου

Αφού ολοκληρωθεί η εκπαίδευση του μοντέλου, το Amazon Fraud Detector αξιολογεί το μοντέλο σας χρησιμοποιώντας μέρος των δεδομένων μοντελοποίησης που δεν χρησιμοποιήθηκαν στην εκπαίδευση μοντέλων. Επιστρέφει τις μετρήσεις αξιολόγησης στο Έκδοση μοντέλου σελίδα για αυτό το μοντέλο. Αυτές οι μετρήσεις αντικατοπτρίζουν την απόδοση του μοντέλου που μπορείτε να περιμένετε σε πραγματικά δεδομένα μετά την ανάπτυξη στην παραγωγή.

Το ακόλουθο στιγμιότυπο οθόνης δείχνει παράδειγμα απόδοσης μοντέλου που επιστράφηκε από το Amazon Fraud Detector. Μπορείτε να επιλέξετε διαφορετικά κατώφλια για την κατανομή βαθμολογίας (αριστερά) και ο πίνακας σύγχυσης (δεξιά) ενημερώνεται ανάλογα.

Μπορείτε να χρησιμοποιήσετε τα ακόλουθα ευρήματα για να ελέγξετε την απόδοση και να αποφασίσετε για κανόνες στρατηγικής:

AUC (περιοχή κάτω από την καμπύλη) – Η συνολική απόδοση αυτού του μοντέλου. Ένα μοντέλο με AUC 0.50 δεν είναι καλύτερο από μια αναστροφή νομίσματος επειδή αντιπροσωπεύει τυχαία πιθανότητα, ενώ ένα «τέλειο» μοντέλο θα έχει βαθμολογία 1.0. Όσο υψηλότερη είναι η AUC, τόσο καλύτερα το μοντέλο σας μπορεί να διακρίνει μεταξύ απατών και νόμιμων.
Κατανομή βαθμολογίας – Ένα ιστόγραμμα κατανομών βαθμολογίας μοντέλου υποθέτοντας ένα παράδειγμα πληθυσμού 100,000 συμβάντων. Το Amazon Fraud Detector δημιουργεί βαθμολογίες μοντέλου μεταξύ 0-1000, όπου όσο χαμηλότερη είναι η βαθμολογία, τόσο χαμηλότερος είναι ο κίνδυνος απάτης. Ο καλύτερος διαχωρισμός μεταξύ νόμιμων (πράσινων) και απατών (μπλε) πληθυσμών συνήθως υποδεικνύει ένα καλύτερο μοντέλο. Για περισσότερες λεπτομέρειες, βλ Βαθμολογίες μοντέλου.
Πίνακας σύγχυσης – Ένας πίνακας που περιγράφει την απόδοση του μοντέλου για το επιλεγμένο δεδομένο όριο βαθμολογίας, συμπεριλαμβανομένου του αληθούς θετικού, του αληθινού αρνητικού, του ψευδώς θετικού, του ψευδώς αρνητικού, του αληθούς θετικού ποσοστού (TPR) και του ψευδώς θετικού ποσοστού (FPR). Η καταμέτρηση στον πίνακα υποθέτει ένα παράδειγμα πληθυσμού 100,0000 συμβάντων. Για περισσότερες λεπτομέρειες, βλ Μετρήσεις απόδοσης μοντέλου.
Καμπύλη ROC (Receiver Operator Characteristic). – Μια γραφική παράσταση που απεικονίζει τη διαγνωστική ικανότητα του μοντέλου, όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης. Σχεδιάζει το πραγματικό θετικό ποσοστό ως συνάρτηση του ψευδώς θετικού ποσοστού σε όλα τα πιθανά όρια βαθμολογίας του μοντέλου. Δείτε αυτό το γράφημα επιλέγοντας Σύνθετες μετρήσεις. Εάν έχετε εκπαιδεύσει πολλές εκδόσεις ενός μοντέλου, μπορείτε να επιλέξετε διαφορετικά κατώφλια FPR για να ελέγξετε την αλλαγή απόδοσης.
Σημασία μεταβλητής μοντέλου – Η κατάταξη των μεταβλητών του μοντέλου με βάση τη συμβολή τους στο μοντέλο που δημιουργήθηκε, όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης. Η μεταβλητή μοντέλου με την υψηλότερη τιμή είναι πιο σημαντική για το μοντέλο από τις άλλες μεταβλητές μοντέλου στο σύνολο δεδομένων για αυτήν την έκδοση μοντέλου και εμφανίζεται στην κορυφή από προεπιλογή. Για περισσότερες λεπτομέρειες, βλ Σημασία μεταβλητής μοντέλου.

Διάγνωση απόδοσης μοντέλου

Προτού αναπτύξετε το μοντέλο σας στην παραγωγή, θα πρέπει να χρησιμοποιήσετε τις μετρήσεις που επέστρεψε το Amazon Fraud Detector για να κατανοήσετε την απόδοση του μοντέλου και να διαγνώσετε τα πιθανά προβλήματα. Τα κοινά προβλήματα των μοντέλων ML μπορούν να χωριστούν σε δύο κύριες κατηγορίες: ζητήματα που σχετίζονται με δεδομένα και ζητήματα που σχετίζονται με μοντέλα. Το Amazon Fraud Detector έχει φροντίσει για τα ζητήματα που σχετίζονται με το μοντέλο χρησιμοποιώντας προσεκτικά σετ επικύρωσης και δοκιμών για την αξιολόγηση και τον συντονισμό του μοντέλου σας στο backend. Μπορείτε να ολοκληρώσετε τα παρακάτω βήματα για να επιβεβαιώσετε εάν το μοντέλο σας είναι έτοιμο για ανάπτυξη ή έχει πιθανά ζητήματα που σχετίζονται με δεδομένα:

Ελέγξτε τη συνολική απόδοση του μοντέλου (AUC και κατανομή βαθμολογίας).
Ελέγξτε τις επιχειρηματικές απαιτήσεις (πίνακας σύγχυσης και πίνακας).
Ελέγξτε τη σημασία της μεταβλητής του μοντέλου.

Ελέγξτε τη συνολική απόδοση του μοντέλου: AUC και κατανομή βαθμολογίας

Η ακριβέστερη πρόβλεψη των μελλοντικών γεγονότων είναι πάντα ο πρωταρχικός στόχος ενός προγνωστικού μοντέλου. Η AUC που επιστρέφεται από το Amazon Fraud Detector υπολογίζεται σε ένα σωστά δειγματοληπτικό σύνολο δοκιμών που δεν χρησιμοποιείται στην εκπαίδευση. Γενικά, ένα μοντέλο με AUC μεγαλύτερο από 0.9 θεωρείται καλό μοντέλο.

Εάν παρατηρήσετε ένα μοντέλο με απόδοση μικρότερη από 0.8, συνήθως σημαίνει ότι το μοντέλο έχει περιθώρια βελτίωσης (θα συζητήσουμε κοινά ζητήματα για χαμηλή απόδοση μοντέλου αργότερα σε αυτήν την ανάρτηση). Σημειώστε ότι ο ορισμός της «καλής» απόδοσης εξαρτάται σε μεγάλο βαθμό από την επιχείρησή σας και το βασικό μοντέλο. Μπορείτε ακόμα να ακολουθήσετε τα βήματα σε αυτήν την ανάρτηση για να βελτιώσετε το μοντέλο του Amazon Fraud Detector, παρόλο που η AUC του είναι μεγαλύτερη από 0.8.

Από την άλλη πλευρά, εάν η AUC είναι πάνω από 0.99, σημαίνει ότι το μοντέλο μπορεί σχεδόν τέλεια να διαχωρίσει την απάτη και τα νόμιμα γεγονότα στο δοκιμαστικό σετ. Αυτό είναι μερικές φορές ένα σενάριο "πολύ καλό για να είναι αληθινό" (συζητάμε κοινά ζητήματα για πολύ υψηλές επιδόσεις μοντέλου αργότερα σε αυτήν την ανάρτηση).

Εκτός από τη συνολική AUC, η κατανομή βαθμολογίας μπορεί επίσης να σας πει πόσο καλά έχει τοποθετηθεί το μοντέλο. Στην ιδανική περίπτωση, θα πρέπει να βλέπετε το μεγαλύτερο μέρος των νόμιμων και απατών που βρίσκονται στα δύο άκρα της κλίμακας, γεγονός που υποδεικνύει ότι η βαθμολογία του μοντέλου μπορεί να ταξινομήσει με ακρίβεια τα συμβάντα στο δοκιμαστικό σύνολο.

Στο ακόλουθο παράδειγμα, η κατανομή βαθμολογίας έχει AUC 0.96.

Εάν η νόμιμη διανομή και η διανομή απάτης επικαλύπτονται ή συγκεντρώνονται στο κέντρο, αυτό πιθανώς σημαίνει ότι το μοντέλο δεν έχει καλή απόδοση στη διάκριση των γεγονότων απάτης από τα νόμιμα συμβάντα, κάτι που μπορεί να υποδεικνύει ότι η κατανομή ιστορικών δεδομένων έχει αλλάξει ή ότι χρειάζεστε περισσότερα δεδομένα ή λειτουργίες.

Το παρακάτω είναι ένα παράδειγμα κατανομής βαθμολογίας με AUC 0.64.

Εάν μπορείτε να βρείτε ένα σημείο διαχωρισμού που μπορεί σχεδόν να διαχωρίσει τέλεια την απάτη και τα νόμιμα γεγονότα, υπάρχει μεγάλη πιθανότητα το μοντέλο να έχει πρόβλημα διαρροής ετικέτας ή τα μοτίβα απάτης να είναι πολύ εύκολο να εντοπιστούν, κάτι που θα πρέπει να τραβήξει την προσοχή σας.

Στο ακόλουθο παράδειγμα, η κατανομή βαθμολογίας έχει AUC 1.0.

Ελέγξτε τις επιχειρηματικές απαιτήσεις: Πίνακας και πίνακας σύγχυσης

Αν και η AUC είναι ένας βολικός δείκτης της απόδοσης του μοντέλου, μπορεί να μην μεταφράζεται άμεσα στις απαιτήσεις της επιχείρησής σας. Το Amazon Fraud Detector παρέχει επίσης μετρήσεις όπως ποσοστό καταγραφής απάτης (πραγματικό θετικό ποσοστό), ποσοστό νόμιμων γεγονότων που λανθασμένα προβλέπονται ως απάτη (ψευδώς θετικό ποσοστό) και άλλα, τα οποία χρησιμοποιούνται πιο συχνά ως επιχειρηματικές απαιτήσεις. Αφού εκπαιδεύσετε ένα μοντέλο με αρκετά καλή AUC, πρέπει να συγκρίνετε το μοντέλο με τις απαιτήσεις της επιχείρησής σας με αυτές τις μετρήσεις.

Η μήτρα και ο πίνακας σύγχυσης σάς παρέχουν μια διεπαφή για να ελέγξετε τον αντίκτυπο και να ελέγξετε εάν ανταποκρίνεται στις ανάγκες της επιχείρησής σας. Σημειώστε ότι οι αριθμοί εξαρτώνται από το όριο του μοντέλου, όπου τα συμβάντα με βαθμολογίες μεγαλύτερες από το όριο ταξινομούνται ως απάτη και τα συμβάντα με βαθμολογίες χαμηλότερες από το όριο ταξινομούνται ως νόμιμα. Μπορείτε να επιλέξετε ποιο όριο θα χρησιμοποιήσετε ανάλογα με τις απαιτήσεις της επιχείρησής σας.

Για παράδειγμα, εάν ο στόχος σας είναι να συλλάβετε το 73% των απατών, τότε (όπως φαίνεται στο παρακάτω παράδειγμα) μπορείτε να επιλέξετε ένα όριο όπως το 855, το οποίο σας επιτρέπει να συλλάβετε το 73% όλων των απατών. Ωστόσο, το μοντέλο θα ταξινομήσει εσφαλμένα το 3% των νόμιμων συμβάντων ως δόλια. Εάν αυτό το FPR είναι αποδεκτό για την επιχείρησή σας, τότε το μοντέλο είναι καλό για ανάπτυξη. Διαφορετικά, θα πρέπει να βελτιώσετε την απόδοση του μοντέλου.

Ένα άλλο παράδειγμα είναι εάν το κόστος για τον αποκλεισμό ή την αμφισβήτηση ενός νόμιμου πελάτη είναι εξαιρετικά υψηλό, τότε θέλετε χαμηλό FPR και υψηλή ακρίβεια. Σε αυτήν την περίπτωση, μπορείτε να επιλέξετε ένα όριο 950, όπως φαίνεται στο παρακάτω παράδειγμα, το οποίο θα παραλείψει να ταξινομήσει το 1% των νόμιμων πελατών ως απάτη και το 80% της εντοπισμένης απάτης θα είναι πράγματι απάτη.

Επιπλέον, μπορείτε να επιλέξετε πολλά κατώφλια και να εκχωρήσετε διαφορετικά αποτελέσματα, όπως αποκλεισμό, διερεύνηση, επιτυχία. Εάν δεν μπορείτε να βρείτε σωστά όρια και κανόνες που να ικανοποιούν όλες τις απαιτήσεις της επιχείρησής σας, θα πρέπει να εξετάσετε το ενδεχόμενο εκπαίδευσης του μοντέλου σας με περισσότερα δεδομένα και χαρακτηριστικά.

Ελέγξτε τη σημασία της μεταβλητής του μοντέλου

Η Σημασία μεταβλητής μοντέλου Το παράθυρο εμφανίζει πώς κάθε μεταβλητή συνεισφέρει στο μοντέλο σας. Εάν μια μεταβλητή έχει σημαντικά υψηλότερη τιμή σημασίας από τις άλλες, μπορεί να υποδηλώνει διαρροή ετικέτας ή ότι τα μοτίβα απάτης είναι πολύ εύκολο να εντοπιστούν. Σημειώστε ότι η σημασία της μεταβλητής συγκεντρώνεται πίσω στις μεταβλητές εισόδου σας. Εάν παρατηρήσετε ελαφρώς μεγαλύτερη σημασία του IP_ADDRESS, CARD_BIN, EMAIL_ADDRESS, PHONE_NUMBER, BILLING_ZIP, ή SHIPPING_ZIP, μπορεί λόγω της δύναμης του εμπλουτισμού.

Το ακόλουθο παράδειγμα δείχνει τη σημασία της μεταβλητής του μοντέλου με μια πιθανή διαρροή ετικέτας χρησιμοποιώντας investigation_status.

Η σημασία της μεταβλητής μοντέλου σας δίνει επίσης υποδείξεις για το ποιες πρόσθετες μεταβλητές θα μπορούσαν ενδεχομένως να βελτιώσουν το μοντέλο. Για παράδειγμα, εάν παρατηρήσετε χαμηλή AUC και τα χαρακτηριστικά που σχετίζονται με τον πωλητή δείχνουν μεγάλη σημασία, μπορείτε να εξετάσετε το ενδεχόμενο να συλλέξετε περισσότερες δυνατότητες παραγγελίας, όπως π.χ. SELLER_CATEGORY, SELLER_ADDRESS, να SELLER_ACTIVE_YEARSκαι προσθέστε αυτές τις μεταβλητές στο μοντέλο σας.

Συνήθη προβλήματα για χαμηλή απόδοση μοντέλου

Σε αυτήν την ενότητα, συζητάμε κοινά ζητήματα που μπορεί να αντιμετωπίσετε σχετικά με τη χαμηλή απόδοση του μοντέλου.

Η κατανομή των ιστορικών δεδομένων άλλαξε

Η μετατόπιση της διανομής δεδομένων ιστορικού συμβαίνει όταν αντιμετωπίζετε μια μεγάλη επιχειρηματική αλλαγή ή ένα πρόβλημα συλλογής δεδομένων. Για παράδειγμα, εάν κυκλοφόρησε πρόσφατα το προϊόν σας σε μια νέα αγορά, το IP_ADDRESS, EMAIL, να ADDRESS Τα σχετικά χαρακτηριστικά θα μπορούσαν να είναι εντελώς διαφορετικά και ο τρόπος λειτουργίας της απάτης θα μπορούσε επίσης να αλλάξει. Χρήσεις του Amazon Fraud Detector EVENT_TIMESTAMP για να χωρίσετε δεδομένα και να αξιολογήσετε το μοντέλο σας στο κατάλληλο υποσύνολο συμβάντων στο σύνολο δεδομένων σας. Εάν η κατανομή των ιστορικών δεδομένων σας αλλάξει σημαντικά, το σύνολο αξιολόγησης μπορεί να είναι πολύ διαφορετικό από τα δεδομένα εκπαίδευσης και η απόδοση του μοντέλου που αναφέρεται μπορεί να είναι χαμηλή.

Μπορείτε να ελέγξετε το ενδεχόμενο πρόβλημα αλλαγής διανομής δεδομένων εξερευνώντας τα ιστορικά δεδομένα σας:

Χρησιμοποιήστε το Προφίλ δεδομένων Amazon Fraud Detector εργαλείο για να ελέγξετε εάν το ποσοστό απάτης και το ποσοστό ελλείψεων της ετικέτας άλλαξαν με την πάροδο του χρόνου.
Ελέγξτε εάν η κατανομή της μεταβλητής με την πάροδο του χρόνου άλλαξε σημαντικά, ειδικά για χαρακτηριστικά με υψηλή μεταβλητή σημασία.
Ελέγξτε την κατανομή μεταβλητών με την πάροδο του χρόνου ανά μεταβλητές-στόχους. Εάν παρατηρήσετε σημαντικά περισσότερα συμβάντα απάτης από μία κατηγορία στα πρόσφατα δεδομένα, ίσως θελήσετε να ελέγξετε εάν η αλλαγή είναι λογική χρησιμοποιώντας τις επιχειρηματικές σας κρίσεις.

Εάν διαπιστώσετε ότι το ποσοστό που λείπει από την ετικέτα είναι πολύ υψηλό ή το ποσοστό απάτης μειώνεται σταθερά κατά τις πιο πρόσφατες ημερομηνίες, μπορεί να αποτελεί ένδειξη ότι οι ετικέτες δεν έχουν ωριμάσει πλήρως. Θα πρέπει να εξαιρέσετε τα πιο πρόσφατα δεδομένα ή να περιμένετε περισσότερο για να συλλέξετε τις ακριβείς ετικέτες και, στη συνέχεια, να επανεκπαιδεύσετε το μοντέλο σας.

Εάν παρατηρήσετε μια απότομη αύξηση του ποσοστού απάτης και των μεταβλητών σε συγκεκριμένες ημερομηνίες, ίσως θελήσετε να ελέγξετε ξανά εάν πρόκειται για ακραία τιμή ή για ζήτημα συλλογής δεδομένων. Σε αυτήν την περίπτωση, θα πρέπει να διαγράψετε αυτά τα συμβάντα και να επανεκπαιδεύσετε το μοντέλο.

Εάν διαπιστώσετε ότι τα παλιά δεδομένα δεν μπορούν να αντιπροσωπεύουν την τρέχουσα και τη μελλοντική επιχείρησή σας, θα πρέπει να εξαιρέσετε την παλιά περίοδο δεδομένων από την εκπαίδευση. Εάν χρησιμοποιείτε αποθηκευμένα συμβάντα στο Amazon Fraud Detector, μπορείτε απλώς να επανεκπαιδεύσετε μια νέα έκδοση και να επιλέξετε το κατάλληλο εύρος ημερομηνιών κατά τη διαμόρφωση της εργασίας εκπαίδευσης. Αυτό μπορεί επίσης να υποδηλώνει ότι ο τρόπος απάτης στην επιχείρησή σας αλλάζει σχετικά γρήγορα με την πάροδο του χρόνου. Μετά την ανάπτυξη του μοντέλου, μπορεί να χρειαστεί να εκπαιδεύετε συχνά το μοντέλο σας.

Ακατάλληλη αντιστοίχιση τύπων μεταβλητής

Το Amazon Fraud Detector εμπλουτίζει και μετασχηματίζει τα δεδομένα με βάση τους τύπους μεταβλητών. Είναι σημαντικό να αντιστοιχίσετε τις μεταβλητές σας στον σωστό τύπο, έτσι ώστε το μοντέλο Amazon Fraud Detector να μπορεί να λάβει τη μέγιστη τιμή των δεδομένων σας. Για παράδειγμα, εάν χαρτογραφήσετε IP στο CATEGORICAL πληκτρολογήστε αντί για IP_ADDRESS, δεν το καταλαβαίνεις IP-σχετικοί εμπλουτισμοί στο backend.

Γενικά, το Amazon Fraud Detector προτείνει τις ακόλουθες ενέργειες:

Αντιστοιχίστε τις μεταβλητές σας σε συγκεκριμένους τύπους, όπως π.χ IP_ADDRESS, EMAIL_ADDRESS, CARD_BIN, να PHONE_NUMBER, ώστε το Amazon Fraud Detector να εξάγει και να εμπλουτίζει πρόσθετες πληροφορίες.
Εάν δεν μπορείτε να βρείτε τον συγκεκριμένο τύπο μεταβλητής, αντιστοιχίστε τον σε έναν από τους τρεις γενικούς τύπους: NUMERIC, CATEGORICAL, ή FREE_FORM_TEXT.
Εάν μια μεταβλητή είναι σε μορφή κειμένου και έχει υψηλή ταυτότητα, όπως κριτική πελάτη ή περιγραφή προϊόντος, θα πρέπει να την αντιστοιχίσετε στο FREE_FORM_TEXT μεταβλητού τύπου, ώστε το Amazon Fraud Detector να εξάγει χαρακτηριστικά κειμένου και ενσωματώσεις στο backend για εσάς. Για παράδειγμα, εάν χαρτογραφήσετε url_string προς την FREE_FORM_TEXT, είναι σε θέση να κάνει tokenize τη διεύθυνση URL και να εξάγει πληροφορίες για τροφοδοσία στο μεταγενέστερο μοντέλο, κάτι που θα το βοηθήσει να μάθει περισσότερα κρυφά μοτίβα από τη διεύθυνση URL.

Εάν διαπιστώσετε ότι κάποιος από τους τύπους μεταβλητών σας έχει αντιστοιχιστεί εσφαλμένα στη διαμόρφωση μεταβλητής, μπορείτε να αλλάξετε τον τύπο της μεταβλητής σας και στη συνέχεια να επανεκπαιδεύσετε το μοντέλο.

Ανεπαρκή δεδομένα ή χαρακτηριστικά

Το Amazon Fraud Detector απαιτεί τουλάχιστον 10,000 εγγραφές για την εκπαίδευση ενός μοντέλου Online Fraud Insights (OFI) ή Transaction Fraud Insights (TFI), με τουλάχιστον 400 από αυτά τα αρχεία να αναγνωρίζονται ως δόλια. Το TFI απαιτεί επίσης τόσο οι δόλιες όσο και οι νόμιμες εγγραφές να προέρχονται από τουλάχιστον 100 διαφορετικές οντότητες η καθεμία για να διασφαλιστεί η ποικιλομορφία του συνόλου δεδομένων. Επιπλέον, το Amazon Fraud Detector απαιτεί τα δεδομένα μοντελοποίησης να έχουν τουλάχιστον δύο μεταβλητές. Αυτές είναι οι ελάχιστες απαιτήσεις δεδομένων για τη δημιουργία ενός χρήσιμου μοντέλου Amazon Fraud Detector. Ωστόσο, η χρήση περισσότερων εγγραφών και μεταβλητών συνήθως βοηθά τα μοντέλα ML να μάθουν καλύτερα τα υποκείμενα μοτίβα από τα δεδομένα σας. Όταν παρατηρείτε χαμηλή AUC ή δεν μπορείτε να βρείτε όρια που να ανταποκρίνονται στις απαιτήσεις της επιχείρησής σας, θα πρέπει να εξετάσετε το ενδεχόμενο να εκπαιδεύσετε ξανά το μοντέλο σας με περισσότερα δεδομένα ή να προσθέσετε νέες δυνατότητες στο μοντέλο σας. Συνήθως, βρίσκουμε EMAIL_ADDRESS, IP, PAYMENT_TYPE, BILLING_ADDRESS, SHIPPING_ADDRESS, να DEVICE Οι σχετικές μεταβλητές είναι σημαντικές για τον εντοπισμό απάτης.

Μια άλλη πιθανή αιτία είναι ότι ορισμένες από τις μεταβλητές σας περιέχουν πάρα πολλές τιμές που λείπουν. Για να δείτε αν συμβαίνει αυτό, ελέγξτε τα μηνύματα εκπαίδευσης του μοντέλου και ανατρέξτε στο Αντιμετώπιση προβλημάτων δεδομένων εκπαίδευσης για προτάσεις.

Συνήθη προβλήματα για πολύ υψηλές επιδόσεις μοντέλου

Σε αυτήν την ενότητα, συζητάμε κοινά ζητήματα που σχετίζονται με πολύ υψηλές επιδόσεις μοντέλου.

Διαρροή ετικέτας

Η διαρροή ετικέτας συμβαίνει όταν τα σύνολα δεδομένων εκπαίδευσης χρησιμοποιούν πληροφορίες που δεν αναμένεται να είναι διαθέσιμες τη στιγμή της πρόβλεψης. Υπερεκτιμά τη χρησιμότητα του μοντέλου όταν εκτελείται σε περιβάλλον παραγωγής.

Η υψηλή AUC (κοντά στο 1), η τέλεια διαχωρισμένη κατανομή βαθμολογίας και η σημαντικά υψηλότερη μεταβλητή σημασία μιας μεταβλητής θα μπορούσαν να αποτελούν δείκτες πιθανών προβλημάτων διαρροής ετικετών. Μπορείτε επίσης να ελέγξετε τη συσχέτιση μεταξύ των χαρακτηριστικών και της ετικέτας χρησιμοποιώντας το Προφίλ δεδομένων. ο Συσχέτιση χαρακτηριστικών και ετικετών Η γραφική παράσταση δείχνει τη συσχέτιση μεταξύ κάθε χαρακτηριστικού και της ετικέτας. Εάν ένα χαρακτηριστικό έχει πάνω από 0.99 συσχέτιση με την ετικέτα, θα πρέπει να ελέγξετε εάν το χαρακτηριστικό χρησιμοποιείται σωστά με βάση τις επιχειρηματικές κρίσεις. Για παράδειγμα, για να δημιουργήσετε ένα μοντέλο κινδύνου για την έγκριση ή την απόρριψη μιας αίτησης δανείου, δεν θα πρέπει να χρησιμοποιείτε λειτουργίες όπως AMOUNT_PAID, γιατί οι πληρωμές γίνονται μετά τη διαδικασία αναδοχής. Εάν μια μεταβλητή δεν είναι διαθέσιμη τη στιγμή που κάνετε την πρόβλεψη, θα πρέπει να αφαιρέσετε αυτήν τη μεταβλητή από τη διαμόρφωση του μοντέλου και να επανεκπαιδεύσετε ένα νέο μοντέλο.

Το ακόλουθο παράδειγμα δείχνει τη συσχέτιση μεταξύ κάθε μεταβλητής και ετικέτας. investigation_status έχει υψηλή συσχέτιση (κοντά στο 1) με την ετικέτα, επομένως θα πρέπει να ελέγξετε ξανά εάν υπάρχει πρόβλημα διαρροής ετικέτας.

Απλά μοτίβα απάτης

Όταν τα μοτίβα απάτης στα δεδομένα σας είναι απλά, μπορεί επίσης να παρατηρήσετε πολύ υψηλή απόδοση μοντέλου. Για παράδειγμα, ας υποθέσουμε ότι όλα τα συμβάντα απάτης στα δεδομένα μοντελοποίησης προέρχονται από τον ίδιο πάροχο εσωτερικής υπηρεσίας. είναι απλό για το μοντέλο να επιλέξει το IP-σχετικές μεταβλητές και επιστρέφουν ένα «τέλειο» μοντέλο με μεγάλη σημασία IP.

Τα απλά μοτίβα απάτης δεν υποδεικνύουν πάντα πρόβλημα δεδομένων. Θα μπορούσε να είναι αλήθεια ότι ο τρόπος απάτης στην επιχείρησή σας είναι εύκολο να αποτυπωθεί. Ωστόσο, πριν βγάλετε ένα συμπέρασμα, πρέπει να βεβαιωθείτε ότι οι ετικέτες που χρησιμοποιούνται στην εκπαίδευση μοντέλων είναι ακριβείς και ότι τα δεδομένα μοντελοποίησης καλύπτουν όσο το δυνατόν περισσότερα μοτίβα απάτης. Για παράδειγμα, εάν επισημάνετε τα συμβάντα απάτης σας βάσει κανόνων, όπως η επισήμανση όλων των εφαρμογών από μια συγκεκριμένη BILLING_ZIP συν PRODUCT_CATEGORY Ως απάτη, το μοντέλο μπορεί εύκολα να συλλάβει αυτές τις απάτες προσομοιώνοντας τους κανόνες και επιτυγχάνοντας υψηλή AUC.

Μπορείτε να ελέγξετε την κατανομή ετικετών σε διαφορετικές κατηγορίες ή θήκες κάθε δυνατότητας χρησιμοποιώντας το Προφίλ δεδομένων. Για παράδειγμα, εάν παρατηρήσετε ότι τα περισσότερα συμβάντα απάτης προέρχονται από μία ή λίγες κατηγορίες προϊόντων, μπορεί να αποτελεί ένδειξη απλών μοτίβων απάτης και πρέπει να επιβεβαιώσετε ότι δεν πρόκειται για λάθος συλλογής δεδομένων ή διαδικασίας. Αν το χαρακτηριστικό είναι σαν CUSTOMER_ID, θα πρέπει να εξαιρέσετε τη δυνατότητα στην εκπαίδευση μοντέλων.

Το παρακάτω παράδειγμα δείχνει την κατανομή ετικετών σε διαφορετικές κατηγορίες product_category. Όλες οι απάτες προέρχονται από δύο κατηγορίες προϊόντων.

Ακατάλληλη δειγματοληψία δεδομένων

Ακατάλληλη δειγματοληψία δεδομένων μπορεί να συμβεί όταν κάνατε δείγμα και στείλατε μόνο μέρος των δεδομένων σας στο Amazon Fraud Detector. Εάν τα δεδομένα δεν δειγματίζονται σωστά και δεν είναι αντιπροσωπευτικά της επισκεψιμότητας στην παραγωγή, η αναφερόμενη απόδοση του μοντέλου θα είναι ανακριβής και το μοντέλο μπορεί να είναι άχρηστο για την πρόβλεψη παραγωγής. Για παράδειγμα, εάν όλα τα συμβάντα απάτης στα δεδομένα μοντελοποίησης έχουν δειγματοληψία από την Ασία και όλα τα νόμιμα συμβάντα προέρχονται από τις ΗΠΑ, το μοντέλο μπορεί να μάθει να διαχωρίζει την απάτη και το νόμιμο με βάση BILLING_COUNTRY. Σε αυτήν την περίπτωση, το μοντέλο δεν είναι γενικό για να εφαρμοστεί σε άλλους πληθυσμούς.

Συνήθως, προτείνουμε την αποστολή όλων των πιο πρόσφατων συμβάντων χωρίς δειγματοληψία. Με βάση το μέγεθος δεδομένων και το ποσοστό απάτης, το Amazon Fraud Detector κάνει δειγματοληψία πριν από την εκπαίδευση του μοντέλου για εσάς. Εάν τα δεδομένα σας είναι πολύ μεγάλα (πάνω από 100 GB) και αποφασίσετε να κάνετε δειγματοληψία και να στείλετε μόνο ένα υποσύνολο, θα πρέπει να κάνετε τυχαία δειγματοληψία των δεδομένων σας και να βεβαιωθείτε ότι το δείγμα είναι αντιπροσωπευτικό ολόκληρου του πληθυσμού. Για το TFI, θα πρέπει να κάνετε δειγματοληψία των δεδομένων σας ανά οντότητα, πράγμα που σημαίνει ότι εάν δειγματοληψία μία οντότητα, θα πρέπει να συμπεριλάβετε όλο το ιστορικό της, ώστε τα συγκεντρωτικά στοιχεία σε επίπεδο οντότητας να υπολογίζονται σωστά. Λάβετε υπόψη ότι εάν στείλετε μόνο ένα υποσύνολο δεδομένων στο Amazon Fraud Detector, τα συγκεντρωτικά στοιχεία σε πραγματικό χρόνο κατά τη διάρκεια της εξαγωγής συμπερασμάτων ενδέχεται να είναι ανακριβή εάν δεν αποσταλούν τα προηγούμενα συμβάντα των οντοτήτων.

Μια άλλη ακατάλληλη δειγματοληψία δεδομένων θα μπορούσε να είναι η χρήση μόνο μικρής περιόδου δεδομένων, όπως δεδομένα μιας ημέρας, για τη δημιουργία του μοντέλου. Τα δεδομένα ενδέχεται να είναι προκατειλημμένα, ειδικά εάν η επιχείρησή σας ή οι επιθέσεις απάτης έχουν εποχικότητα. Συνήθως συνιστούμε τη συμπερίληψη δεδομένων αξίας τουλάχιστον δύο κύκλων (όπως 2 εβδομάδων ή 2 μηνών) στη μοντελοποίηση για να διασφαλιστεί η ποικιλομορφία των τύπων απάτης.

Συμπέρασμα

Μετά τη διάγνωση και την επίλυση όλων των πιθανών ζητημάτων, θα πρέπει να αποκτήσετε ένα χρήσιμο μοντέλο Amazon Fraud Detector και να είστε σίγουροι για την απόδοσή του. Για το επόμενο βήμα, εσείς μπορεί να δημιουργήσει έναν ανιχνευτή με το μοντέλο και τους κανόνες της επιχείρησής σας, και να είστε έτοιμοι να το αναπτύξετε στην παραγωγή για αξιολόγηση σκιώδους λειτουργίας.

Παράρτημα

Πώς να εξαιρέσετε μεταβλητές για εκπαίδευση μοντέλων

Μετά τη βαθιά κατάδυση, μπορεί να εντοπίσετε μια μεταβλητή διαρροή πληροφοριών στόχου και να θέλετε να την εξαιρέσετε από την εκπαίδευση μοντέλων. Μπορείτε να επανεκπαιδεύσετε μια έκδοση μοντέλου εξαιρουμένων των μεταβλητών που δεν θέλετε, ολοκληρώνοντας τα παρακάτω βήματα:

Στην κονσόλα Amazon Fraud Detector, στο παράθυρο πλοήγησης, επιλέξτε Μοντέλα.
Στις Μοντέλα σελίδα, επιλέξτε το μοντέλο που θέλετε να επανεκπαιδεύσετε.
Στις Δράσεις μενού, επιλέξτε Train νέα έκδοση.
Επιλέξτε το εύρος ημερομηνιών που θέλετε να χρησιμοποιήσετε και επιλέξτε Επόμενο.
Στις Διαμορφώστε την εκπαίδευση σελίδα, καταργήστε την επιλογή της μεταβλητής που δεν θέλετε να χρησιμοποιήσετε στην εκπαίδευση μοντέλων.
Προσδιορίστε τις ετικέτες απάτης και τις νόμιμες ετικέτες σας και πώς θέλετε το Amazon Fraud Detector να χρησιμοποιεί συμβάντα χωρίς ετικέτα και, στη συνέχεια, επιλέξτε Επόμενο.
Ελέγξτε τη διαμόρφωση του μοντέλου και επιλέξτε Δημιουργήστε και εκπαιδεύστε μοντέλο.

Πώς να αλλάξετε τον τύπο μεταβλητής συμβάντος

Οι μεταβλητές αντιπροσωπεύουν στοιχεία δεδομένων που χρησιμοποιούνται για την πρόληψη της απάτης. Στο Amazon Fraud Detector, όλες οι μεταβλητές είναι καθολικές και μοιράζονται σε όλα τα συμβάντα και τα μοντέλα, πράγμα που σημαίνει ότι μια μεταβλητή θα μπορούσε να χρησιμοποιηθεί σε πολλά συμβάντα. Για παράδειγμα, η IP θα μπορούσε να συσχετιστεί με συμβάντα σύνδεσης και θα μπορούσε επίσης να συσχετιστεί με συμβάντα συναλλαγής. Φυσικά, το Amazon Fraud Detector κλείδωσε τον τύπο και τον τύπο της μεταβλητής μόλις δημιουργηθεί μια μεταβλητή. Για να διαγράψετε μια υπάρχουσα μεταβλητή, πρέπει πρώτα να διαγράψετε όλους τους σχετικούς τύπους και μοντέλα συμβάντων. Μπορείτε να ελέγξετε τους πόρους που σχετίζονται με τη συγκεκριμένη μεταβλητή μεταβαίνοντας στο Amazon Fraud Detector, επιλέγοντας Μεταβλητές στο παράθυρο πλοήγησης και επιλέγοντας το όνομα της μεταβλητής και Συναφείς πόροι.

Διαγράψτε τη μεταβλητή και όλους τους σχετικούς τύπους συμβάντων

Για να διαγράψετε τη μεταβλητή, ολοκληρώστε τα παρακάτω βήματα:

Στην κονσόλα Amazon Fraud Detector, στο παράθυρο πλοήγησης, επιλέξτε Μεταβλητές.
Επιλέξτε τη μεταβλητή που θέλετε να διαγράψετε.
Επιλέξτε Συναφείς πόροι για να δείτε μια λίστα με όλους τους τύπους συμβάντων που χρησιμοποιούνται αυτή η μεταβλητή.
Πρέπει να διαγράψετε αυτούς τους συσχετιζόμενους τύπους συμβάντων πριν διαγράψετε τη μεταβλητή.
Επιλέξτε τους τύπους συμβάντων στη λίστα για να μεταβείτε στη σχετική σελίδα τύπου συμβάντος.
Επιλέξτε Αποθηκευμένα συμβάντα για να ελέγξετε εάν υπάρχουν αποθηκευμένα δεδομένα σε αυτόν τον τύπο συμβάντος.
Εάν υπάρχουν συμβάντα αποθηκευμένα στο Amazon Fraud Detector, επιλέξτε Διαγραφή αποθηκευμένων συμβάντων για να διαγράψετε τα αποθηκευμένα συμβάντα.
Όταν ολοκληρωθεί η εργασία διαγραφής, εμφανίζεται το μήνυμα "Τα αποθηκευμένα συμβάντα για αυτόν τον τύπο συμβάντος διαγράφηκαν επιτυχώς".
Επιλέξτε Συναφείς πόροι.
Εάν οι ανιχνευτές και τα μοντέλα συσχετίζονται με αυτόν τον τύπο συμβάντος, πρέπει πρώτα να διαγράψετε αυτούς τους πόρους.
Εάν συσχετίζονται ανιχνευτές, ολοκληρώστε τα ακόλουθα βήματα για να διαγράψετε όλους τους σχετικούς ανιχνευτές:
1. Επιλέξτε τον ανιχνευτή για να μεταβείτε στο Στοιχεία ανιχνευτή .
2. Στο Εκδόσεις μοντέλου στο παράθυρο, επιλέξτε την έκδοση του ανιχνευτή.
3. Στη σελίδα έκδοσης ανιχνευτή, επιλέξτε Δράσεις.
4. Εάν η έκδοση ανιχνευτή είναι ενεργή, επιλέξτε απενεργοποίηση, επιλέξτε Απενεργοποιήστε αυτήν την έκδοση ανιχνευτή χωρίς να την αντικαταστήσετε με διαφορετική έκδοση, και επιλέξτε Απενεργοποιήστε την έκδοση ανιχνευτή.
5. Αφού απενεργοποιηθεί η έκδοση ανιχνευτή, επιλέξτε Δράσεις και στη συνέχεια Διαγραφή.
6. Επαναλάβετε αυτά τα βήματα για να διαγράψετε όλες τις εκδόσεις ανιχνευτών.
7. Στις Στοιχεία ανιχνευτή σελίδα, επιλέξτε Συναφείς κανόνες.
8. Επιλέξτε τον κανόνα για διαγραφή.
9. Επιλέξτε Δράσεις και Διαγραφή έκδοσης κανόνα.
10. Εισαγάγετε το όνομα του κανόνα για επιβεβαίωση και επιλέξτε Διαγραφή έκδοσης.
11. Επαναλάβετε αυτά τα βήματα για να διαγράψετε όλους τους σχετικούς κανόνες.
12. Αφού διαγραφούν όλες οι εκδόσεις ανιχνευτή και οι σχετικοί κανόνες, μεταβείτε στο Στοιχεία ανιχνευτή σελίδα, επιλέξτε Δράσεις, και επιλέξτε Διαγραφή ανιχνευτή.
13. Εισαγάγετε το όνομα του ανιχνευτή και επιλέξτε Διαγραφή ανιχνευτή.
14. Επαναλάβετε αυτά τα βήματα για να διαγράψετε τον επόμενο ανιχνευτή.
Εάν κάποια μοντέλα συσχετίζονται με τον τύπο συμβάντος, ολοκληρώστε τα παρακάτω βήματα για να τα διαγράψετε:
1. Επιλέξτε το όνομα του μοντέλου.
2. Στο Εκδόσεις μοντέλου παράθυρο, επιλέξτε την έκδοση.
3. Εάν η κατάσταση του μοντέλου είναι Active, επιλέξτε Δράσεις και Undeploy έκδοση μοντέλου.
4. εισάγετε undeploy για επιβεβαίωση και επιλογή Undeploy έκδοση μοντέλου.
  Η κατάσταση αλλάζει σε Undeploying. Η διαδικασία διαρκεί λίγα λεπτά για να ολοκληρωθεί.
5. Αφού γίνει η κατάσταση Ready to deploy, επιλέξτε Ενέργειες και Διαγραφή.
6. Επαναλάβετε αυτά τα βήματα για να διαγράψετε όλες τις εκδόσεις του μοντέλου.
7. Στη σελίδα Λεπτομέρειες μοντέλου, επιλέξτε Ενέργειες και Διαγραφή μοντέλου.
8. Εισαγάγετε το όνομα του μοντέλου και επιλέξτε Διαγραφή μοντέλου.
9. Επαναλάβετε αυτά τα βήματα για να διαγράψετε το επόμενο μοντέλο.
Αφού διαγραφούν όλοι οι σχετικοί ανιχνευτές και μοντέλα, επιλέξτε Δράσεις και Διαγραφή τύπου συμβάντος σχετικά με την λεπτομέρειες συμβάντος .
Εισαγάγετε το όνομα του τύπου συμβάντος και επιλέξτε Διαγραφή τύπου συμβάντος.
Στο παράθυρο πλοήγησης, επιλέξτε Μεταβλητέςκαι επιλέξτε τη μεταβλητή που θέλετε να διαγράψετε.
Επαναλάβετε τα προηγούμενα βήματα για να διαγράψετε όλους τους τύπους συμβάντων που σχετίζονται με τη μεταβλητή.
Στις Μεταβλητές λεπτομέρειες σελίδα, επιλέξτε Δράσεις και Διαγραφή.
Εισαγάγετε το όνομα της μεταβλητής και επιλέξτε Διαγραφή μεταβλητής.

Δημιουργήστε μια νέα μεταβλητή με τον σωστό τύπο μεταβλητής

Αφού διαγράψετε τη μεταβλητή και όλους τους σχετικούς τύπους συμβάντων, τα αποθηκευμένα συμβάντα, τα μοντέλα και τους ανιχνευτές από το Amazon Fraud Detector, μπορείτε να δημιουργήσετε μια νέα μεταβλητή με το ίδιο όνομα και να την αντιστοιχίσετε στον σωστό τύπο μεταβλητής.

Στην κονσόλα Amazon Fraud Detector, στο παράθυρο πλοήγησης, επιλέξτε Μεταβλητές.
Επιλέξτε Δημιουργία.
Εισαγάγετε το όνομα της μεταβλητής που θέλετε να τροποποιήσετε (αυτό που διαγράψατε νωρίτερα).
Επιλέξτε τον σωστό τύπο μεταβλητής στον οποίο θέλετε να αλλάξετε.
Επιλέξτε Δημιουργία μεταβλητής.

Μεταφορτώστε δεδομένα και επανεκπαιδεύστε το μοντέλο

Αφού ενημερώσετε τον τύπο μεταβλητής, μπορείτε να ανεβάσετε ξανά τα δεδομένα και να εκπαιδεύσετε ένα νέο μοντέλο. Για οδηγίες, ανατρέξτε στο Εντοπίστε διαδικτυακή απάτη συναλλαγών με νέες δυνατότητες ανιχνευτή απάτης Amazon.

Πώς να προσθέσετε νέες μεταβλητές σε έναν υπάρχοντα τύπο συμβάντος

Για να προσθέσετε νέες μεταβλητές στον υπάρχοντα τύπο συμβάντος, ολοκληρώστε τα ακόλουθα βήματα:

Προσθέστε τις νέες μεταβλητές στο προηγούμενο αρχείο CVS εκπαίδευσης.
Ανεβάστε το νέο αρχείο δεδομένων εκπαίδευσης σε έναν κάδο S3. Σημειώστε τη θέση Amazon S3 του αρχείου εκπαίδευσης (για παράδειγμα, s3://bucketname/path/to/some/object.csv) και το όνομα του ρόλου σας.
Στην κονσόλα Amazon Fraud Detector, στο παράθυρο πλοήγησης, επιλέξτε Εκδηλώσεις.
Στις Τύποι συμβάντων σελίδα, επιλέξτε το όνομα του τύπου συμβάντος που θέλετε να προσθέσετε μεταβλητές.
Στις Τύπος συμβάντος σελίδα λεπτομερειών, επιλέξτε Δράσεις, Τότε Προσθήκη μεταβλητών.
Κάτω από Επιλέξτε τον τρόπο καθορισμού των μεταβλητών αυτού του συμβάντος, επιλέξτε Επιλέξτε μεταβλητές από ένα σύνολο δεδομένων εκπαίδευσης.
Για ρόλο IAM, επιλέξτε έναν υπάρχοντα ρόλο IAM ή δημιουργήστε έναν νέο ρόλο για πρόσβαση σε δεδομένα στο Amazon S3.
Για Τοποθεσία δεδομένων, εισάγετε τη θέση S3 του νέου αρχείου εκπαίδευσης και επιλέξτε Μεταφόρτωση.
Οι νέες μεταβλητές που δεν υπάρχουν στον υπάρχοντα τύπο συμβάντος θα πρέπει να εμφανίζονται στη λίστα.
Επιλέξτε Προσθήκη μεταβλητών.

Τώρα, οι νέες μεταβλητές έχουν προστεθεί στον υπάρχοντα τύπο συμβάντος. Εάν χρησιμοποιείτε αποθηκευμένα συμβάντα στο Amazon Fraud Detector, οι νέες μεταβλητές των αποθηκευμένων συμβάντων εξακολουθούν να λείπουν. Πρέπει να εισαγάγετε τα δεδομένα εκπαίδευσης με τις νέες μεταβλητές στο Amazon Fraud Detector και στη συνέχεια να επανεκπαιδεύσετε μια νέα έκδοση μοντέλου. Κατά τη μεταφόρτωση των νέων δεδομένων εκπαίδευσης με το ίδιο EVENT_ID και EVENT_TIMESTAMP, οι νέες μεταβλητές συμβάντος αντικαθιστούν τις προηγούμενες μεταβλητές συμβάντων που είναι αποθηκευμένες στο Amazon Fraud Detector.

Σχετικά με τους Συγγραφείς

Τζούλια Σου είναι ερευνητής με το Amazon Fraud Detector. Είναι παθιασμένη με την επίλυση προκλήσεων των πελατών χρησιμοποιώντας τεχνικές Μηχανικής Μάθησης. Στον ελεύθερο χρόνο της, της αρέσει η πεζοπορία, η ζωγραφική και η εξερεύνηση νέων καφέ.

Χάο Ζου είναι ερευνητής με το Amazon Fraud Detector. Είναι διδάκτωρ ηλεκτρολόγου μηχανικού από το Northwestern University των Η.Π.Α. Είναι παθιασμένος με την εφαρμογή τεχνικών μηχανικής μάθησης για την καταπολέμηση της απάτης και της κατάχρησης.

Abhishek Ravi είναι Ανώτερος Διευθυντής Προϊόντων με το Amazon Fraud Detector. Είναι παθιασμένος με την αξιοποίηση των τεχνικών δυνατοτήτων για την κατασκευή προϊόντων που ευχαριστούν τους πελάτες.

Σφραγίδα ώρας: Ιούνιος 29, 2022

Σφραγίδα ώρας: 29 Φεβρουαρίου 2024

Αναδημοσίευση από τον Πλάτωνα

Δημιουργήστε μια πλατφόρμα γεωπονικών δεδομένων με τις γεωχωρικές δυνατότητες του Amazon SageMaker

Πώς να αξιολογήσετε την ποιότητα των συνθετικών δεδομένων – μέτρηση από την άποψη της πιστότητας, της χρησιμότητας και της ιδιωτικότητας

Χρησιμοποιήστε το Amazon Lex για να καταγράψετε διευθύνσεις οδών

Επιτάχυνση μεγάλης κλίμακας εκπαίδευσης νευρωνικών δικτύων σε CPU με ThirdAI και AWS Graviton | Υπηρεσίες Ιστού της Amazon

Σχετικά με μας

Κάθετη αναζήτηση & Ai

Πλατφόρμα

Μείνετε συνδεδεμένοι

Λογαριασμός