Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα

Από την παγκόσμια χρηματοπιστωτική κρίση, η διαχείριση κινδύνων έχει διαδραματίσει σημαντικό ρόλο στη διαμόρφωση της λήψης αποφάσεων για τις τράπεζες, συμπεριλαμβανομένης της πρόβλεψης της κατάστασης δανείων για πιθανούς πελάτες. Αυτή είναι συχνά μια άσκηση έντασης δεδομένων που απαιτεί μηχανική μάθηση (ML). Ωστόσο, δεν έχουν όλοι οι οργανισμοί τους πόρους και την τεχνογνωσία της επιστήμης δεδομένων για να δημιουργήσουν μια ροή εργασίας ML διαχείρισης κινδύνου.

Amazon Sage Maker είναι μια πλήρως διαχειριζόμενη πλατφόρμα ML που επιτρέπει στους μηχανικούς δεδομένων και στους επιχειρησιακούς αναλυτές να δημιουργούν, να εκπαιδεύουν και να αναπτύσσουν μοντέλα ML γρήγορα και εύκολα. Οι μηχανικοί δεδομένων και οι επιχειρησιακοί αναλυτές μπορούν να συνεργαστούν χρησιμοποιώντας τις δυνατότητες χωρίς κώδικα/χαμηλό κώδικα του SageMaker. Οι μηχανικοί δεδομένων μπορούν να χρησιμοποιήσουν Amazon SageMaker Data Wrangler για γρήγορη συγκέντρωση και προετοιμασία δεδομένων για τη δημιουργία μοντέλου χωρίς εγγραφή κώδικα. Στη συνέχεια, οι επιχειρηματικοί αναλυτές μπορούν να χρησιμοποιήσουν την οπτική διεπαφή point-and-click του Καμβάς Amazon SageMaker να δημιουργούν ακριβείς προβλέψεις ML από μόνες τους.

Σε αυτήν την ανάρτηση, δείχνουμε πόσο απλό είναι για τους μηχανικούς δεδομένων και τους επιχειρησιακούς αναλυτές να συνεργάζονται για να δημιουργήσουν μια ροή εργασιών ML που περιλαμβάνει προετοιμασία δεδομένων, δημιουργία μοντέλων και συμπερασματικά στοιχεία χωρίς να γράφουν κώδικα.

Επισκόπηση λύσεων

Αν και η ανάπτυξη ML είναι μια πολύπλοκη και επαναληπτική διαδικασία, μπορείτε να γενικεύσετε μια ροή εργασίας ML στα στάδια προετοιμασίας δεδομένων, ανάπτυξης μοντέλου και ανάπτυξης μοντέλου.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το Data Wrangler και το Canvas αφαιρούν την πολυπλοκότητα της προετοιμασίας δεδομένων και της ανάπτυξης μοντέλων, ώστε να μπορείτε να εστιάσετε στην παροχή αξίας στην επιχείρησή σας αντλώντας πληροφορίες από τα δεδομένα σας χωρίς να είστε ειδικός στην ανάπτυξη κώδικα. Το ακόλουθο διάγραμμα αρχιτεκτονικής επισημαίνει τα στοιχεία σε μια λύση χωρίς κώδικα/χαμηλό κώδικα.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3) λειτουργεί ως το αποθετήριο δεδομένων μας για ανεπεξέργαστα δεδομένα, μηχανικά δεδομένα και τεχνουργήματα μοντέλων. Μπορείτε επίσης να επιλέξετε να εισάγετε δεδομένα από Amazon RedShift, Αμαζόν Αθηνά, Databricks και Snowflake.

Ως επιστήμονες δεδομένων, χρησιμοποιούμε στη συνέχεια το Data Wrangler για διερευνητική ανάλυση δεδομένων και μηχανική χαρακτηριστικών. Αν και το Canvas μπορεί να εκτελέσει εργασίες μηχανικής χαρακτηριστικών, η μηχανική χαρακτηριστικών συνήθως απαιτεί κάποιες στατιστικές γνώσεις και γνώσεις τομέα για να εμπλουτιστεί ένα σύνολο δεδομένων στη σωστή μορφή για ανάπτυξη μοντέλου. Ως εκ τούτου, αναθέτουμε αυτήν την ευθύνη στους μηχανικούς δεδομένων, ώστε να μπορούν να μετασχηματίσουν δεδομένα χωρίς να γράφουν κώδικα με το Data Wrangler.

Μετά την προετοιμασία των δεδομένων, μεταβιβάζουμε τις ευθύνες κατασκευής μοντέλων σε αναλυτές δεδομένων, οι οποίοι μπορούν να χρησιμοποιήσουν το Canvas για να εκπαιδεύσουν ένα μοντέλο χωρίς να χρειάζεται να γράψουν κώδικα.

Τέλος, κάνουμε προβλέψεις μεμονωμένων και παρτίδων απευθείας μέσα στο Canvas από το μοντέλο που προκύπτει χωρίς να χρειάζεται να αναπτύξουμε μόνοι μας τελικά σημεία του μοντέλου.

Επισκόπηση συνόλου δεδομένων

Χρησιμοποιούμε τις δυνατότητες του SageMaker για να προβλέψουμε την κατάσταση ενός δανείου χρησιμοποιώντας μια τροποποιημένη έκδοση του Lending Club's δημοσίως διαθέσιμο σύνολο δεδομένων ανάλυσης δανείων. Το σύνολο δεδομένων περιέχει δεδομένα δανείων για δάνεια που εκδόθηκαν κατά την περίοδο 2007–2011. Οι στήλες που περιγράφουν το δάνειο και τον δανειολήπτη είναι τα χαρακτηριστικά μας. Η στήλη loan_status είναι η μεταβλητή στόχος, την οποία προσπαθούμε να προβλέψουμε.

Για να δείξουμε στο Data Wrangler, χωρίζουμε το σύνολο δεδομένων σε δύο αρχεία CSV: μέρος πρώτο και μέρος δεύτερο. Καταργήσαμε ορισμένες στήλες από το αρχικό σύνολο δεδομένων του Lending Club για να απλοποιήσουμε την επίδειξη. Το σύνολο δεδομένων μας περιέχει περισσότερες από 37,000 σειρές και 21 στήλες χαρακτηριστικών, όπως περιγράφεται στον παρακάτω πίνακα.

Όνομα στήλης Περιγραφή
loan_status Τρέχουσα κατάσταση του δανείου (μεταβλητή στόχος).
loan_amount Το αναγραφόμενο ποσό του δανείου που ζητήθηκε από τον δανειολήπτη. Εάν το πιστωτικό τμήμα μειώσει το ποσό του δανείου, αυτό αντικατοπτρίζεται σε αυτήν την αξία.
funded_amount_by_investors Το συνολικό ποσό που δεσμεύτηκαν από τους επενδυτές για αυτό το δάνειο εκείνη τη στιγμή.
term Ο αριθμός των πληρωμών για το δάνειο. Οι τιμές είναι σε μήνες και μπορεί να είναι είτε 36 είτε 60.
interest_rate Επιτόκιο του δανείου.
installment Η μηνιαία πληρωμή που οφείλει ο δανειολήπτης εάν το δάνειο προέρχεται.
grade LC εκχωρήθηκε βαθμός δανείου.
sub_grade Υποβάθμιση δανείου που εκχωρήθηκε σε LC.
employment_length Διάρκεια απασχόλησης σε χρόνια. Οι πιθανές τιμές είναι μεταξύ 0-10, όπου το 0 σημαίνει λιγότερο από ένα έτος και το 10 σημαίνει δέκα ή περισσότερα χρόνια.
home_ownership Το καθεστώς ιδιοκτησίας κατοικίας που παρέχεται από τον δανειολήπτη κατά την εγγραφή. Οι αξίες μας είναι ΕΝΟΙΚΙΑ, ΙΔΙΟ, ΥΠΟΘΗΚΗ και ΑΛΛΑ.
annual_income Το αυτοδηλούμενο ετήσιο εισόδημα που παρέχει ο δανειολήπτης κατά την εγγραφή.
verification_status Υποδεικνύει εάν το εισόδημα επαληθεύτηκε ή όχι από το LC.
issued_amount Ο μήνας κατά τον οποίο χρηματοδοτήθηκε το δάνειο.
purpose Μια κατηγορία που παρέχεται από τον δανειολήπτη για το αίτημα δανείου.
dti Ένας λόγος που υπολογίζεται χρησιμοποιώντας τις συνολικές μηνιαίες πληρωμές χρέους του δανειολήπτη στις συνολικές υποχρεώσεις χρέους, εξαιρουμένων των στεγαστικών δανείων και του αιτούμενου δανείου LC, διαιρούμενος με το μηνιαίο εισόδημα που δηλώνει ο ίδιος ο δανειολήπτης.
earliest_credit_line Ο μήνας που άνοιξε η πρώτη αναφερόμενη πιστωτική γραμμή του δανειολήπτη.
inquiries_last_6_months Ο αριθμός των ερωτημάτων τους τελευταίους 6 μήνες (εξαιρουμένων των ερωτημάτων για αυτοκίνητα και στεγαστικά δάνεια).
open_credit_lines Ο αριθμός των ανοιχτών πιστωτικών ορίων στο πιστωτικό αρχείο του δανειολήπτη.
derogatory_public_records Ο αριθμός των υποτιμητικών δημόσιων αρχείων.
revolving_line_utilization_rate Ποσοστό χρήσης ανακυκλούμενης γραμμής ή το ποσό της πίστωσης που χρησιμοποιεί ο δανειολήπτης σε σχέση με όλη τη διαθέσιμη ανακυκλούμενη πίστωση.
total_credit_lines Ο συνολικός αριθμός των πιστωτικών γραμμών που βρίσκονται στο πιστωτικό αρχείο του δανειολήπτη.

Χρησιμοποιούμε αυτό το σύνολο δεδομένων για την προετοιμασία δεδομένων και την εκπαίδευση μοντέλων.

Προϋποθέσεις

Ολοκληρώστε τα παρακάτω προαπαιτούμενα βήματα:

  1. Μεταφορτώστε και τα δύο αρχεία δανείου σε έναν κάδο S3 της επιλογής σας.
  2. Βεβαιωθείτε ότι έχετε τα απαραίτητα δικαιώματα. Για περισσότερες πληροφορίες, ανατρέξτε στο Ξεκινήστε με το Data Wrangler.
  3. Ρυθμίστε έναν τομέα SageMaker που έχει ρυθμιστεί να χρησιμοποιεί το Data Wrangler. Για οδηγίες, ανατρέξτε στο Ενσωματωμένος στον τομέα Amazon SageMaker.

Εισαγάγετε τα δεδομένα

Δημιουργήστε μια νέα ροή δεδομένων Data Wrangler από το Διεπαφή χρήστη Amazon SageMaker Studio.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Εισαγάγετε δεδομένα από το Amazon S3 επιλέγοντας τα αρχεία CSV από τον κάδο S3 όπου τοποθετήσατε το σύνολο δεδομένων σας. Αφού εισαγάγετε και τα δύο αρχεία, μπορείτε να δείτε δύο ξεχωριστές ροές εργασίας στο Ροή δεδομένων θέα.

Μπορείτε να επιλέξετε πολλές επιλογές δειγματοληψίας κατά την εισαγωγή των δεδομένων σας σε μια ροή δεδομένων Wrangler. Η δειγματοληψία μπορεί να βοηθήσει όταν έχετε ένα σύνολο δεδομένων που είναι πολύ μεγάλο για να προετοιμαστεί διαδραστικά ή όταν θέλετε να διατηρήσετε το ποσοστό των σπάνιων συμβάντων στο σύνολο δεδομένων του δείγματος. Επειδή το σύνολο δεδομένων μας είναι μικρό, δεν χρησιμοποιούμε δειγματοληψία.

Προετοιμάστε τα δεδομένα

Για την περίπτωση χρήσης μας, έχουμε δύο σύνολα δεδομένων με κοινή στήλη: id. Ως πρώτο βήμα στην προετοιμασία των δεδομένων, θέλουμε να συνδυάσουμε αυτά τα αρχεία συνδέοντάς τα. Για οδηγίες, ανατρέξτε στο Μετασχηματισμός Δεδομένων.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Χρησιμοποιούμε το Συμμετοχή βήμα μετασχηματισμού δεδομένων και χρησιμοποιήστε το Εσωτερικός τύπος ένωσης στο id στήλη.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Ως αποτέλεσμα του μετασχηματισμού της ένωσης, το Data Wrangler δημιουργεί δύο επιπλέον στήλες: id_0 και id_1. Ωστόσο, αυτές οι στήλες δεν είναι απαραίτητες για τους σκοπούς κατασκευής μοντέλων μας. Ρίχνουμε αυτές τις περιττές στήλες χρησιμοποιώντας το Διαχείριση στηλών βήμα μετασχηματισμού.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Εισαγάγαμε τα σύνολα δεδομένων μας, τα ενώσαμε και αφαιρέσαμε τις περιττές στήλες. Τώρα είμαστε έτοιμοι να εμπλουτίσουμε τα δεδομένα μας μέσω της μηχανικής χαρακτηριστικών και να προετοιμαστούμε για την κατασκευή μοντέλων.

Εκτελέστε μηχανική χαρακτηριστικών

Χρησιμοποιήσαμε το Data Wrangler για την προετοιμασία δεδομένων. Μπορείτε επίσης να χρησιμοποιήσετε το Λειτουργία αναφοράς ποιότητας δεδομένων και πληροφοριών στο Data Wrangler για να επαληθεύσετε την ποιότητα των δεδομένων σας και να εντοπίσετε ανωμαλίες στα δεδομένα σας. Οι επιστήμονες δεδομένων συχνά χρειάζεται να χρησιμοποιήσουν αυτές τις πληροφορίες δεδομένων για να εφαρμόσουν αποτελεσματικά τη σωστή γνώση τομέα σε χαρακτηριστικά μηχανικής. Για αυτήν την ανάρτηση, υποθέτουμε ότι έχουμε ολοκληρώσει αυτές τις αξιολογήσεις ποιότητας και μπορούμε να προχωρήσουμε στη μηχανική χαρακτηριστικών.

Σε αυτό το βήμα, εφαρμόζουμε μερικούς μετασχηματισμούς σε στήλες αριθμών, κατηγοριών και κειμένου.

Αρχικά κανονικοποιούμε το επιτόκιο για να κλιμακώσουμε τις τιμές μεταξύ 0-1. Αυτό το κάνουμε χρησιμοποιώντας το Αριθμητική διαδικασία μετατροπή σε κλίμακα το interest_rate στήλη με χρήση κλίμακας ελάχιστης μέγιστης κλίμακας. Ο σκοπός της κανονικοποίησης (ή τυποποίησης) είναι να εξαλειφθεί η μεροληψία από το μοντέλο μας. Οι μεταβλητές που μετρώνται σε διαφορετικές κλίμακες δεν θα συμβάλλουν εξίσου στη διαδικασία εκμάθησης του μοντέλου. Επομένως, μια συνάρτηση μετασχηματισμού όπως ένας μετασχηματισμός κλίμακας min-max βοηθά στην κανονικοποίηση των χαρακτηριστικών.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Για να μετατρέψουμε μια μεταβλητή κατηγορίας σε αριθμητική τιμή, χρησιμοποιούμε κωδικοποίηση one-hot. Επιλέγουμε το Κωδικοποιήστε κατηγορηματικά μεταμορφώστε και μετά επιλέξτε One-hot κωδικοποίηση. Η κωδικοποίηση One-hot βελτιώνει την προγνωστική ικανότητα ενός μοντέλου ML. Αυτή η διαδικασία μετατρέπει μια κατηγορική τιμή σε ένα νέο χαρακτηριστικό εκχωρώντας μια δυαδική τιμή 1 ή 0 στο χαρακτηριστικό. Ως απλό παράδειγμα, εάν είχατε μία στήλη που είχε τιμή είτε από yes or no, η κωδικοποίηση μίας σύνδεσης θα μετατρέψει αυτήν τη στήλη σε δύο στήλες: α Yes στήλη και α No στήλη. Μια τιμή ναι θα είχε 1 στο Yes στήλη και ένα 0 στο No στήλη. Η απλή κωδικοποίηση καθιστά τα δεδομένα μας πιο χρήσιμα επειδή οι αριθμητικές τιμές μπορούν να προσδιορίσουν πιο εύκολα μια πιθανότητα για τις προβλέψεις μας.

Τέλος, παρουσιάζουμε το employer_title στήλη για να μετατρέψει τις τιμές συμβολοσειράς της σε αριθμητικό διάνυσμα. Εφαρμόζουμε το Count Vectorizer και ένα τυπικό tokenizer εντός του Διάνυσμα μεταμορφώνω. Το tokenization διασπά μια πρόταση ή μια σειρά κειμένου σε λέξεις, ενώ ένα vectorizer μετατρέπει τα δεδομένα κειμένου σε μια μηχανικά αναγνώσιμη μορφή. Αυτές οι λέξεις αναπαρίστανται ως διανύσματα.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Με την ολοκλήρωση όλων των βημάτων μηχανικής των χαρακτηριστικών, μπορούμε να εξάγουμε τα δεδομένα και να εξάγουμε τα αποτελέσματα στον κάδο S3 μας. Εναλλακτικά, μπορείτε να εξαγάγετε τη ροή σας ως κώδικα Python ή ένα σημειωματάριο Jupyter για να δημιουργήσετε μια διοχέτευση με την προβολή σας χρησιμοποιώντας Αγωγοί Amazon SageMaker. Σκεφτείτε αυτό όταν θέλετε να εκτελέσετε τα βήματα μηχανικής των χαρακτηριστικών σας σε κλίμακα ή ως μέρος μιας διοχέτευσης ML.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Μπορούμε τώρα να χρησιμοποιήσουμε το αρχείο εξόδου Data Wrangler ως είσοδο για το Canvas. Το αναφέρουμε ως σύνολο δεδομένων στον Καμβά για να δημιουργήσουμε το μοντέλο ML μας.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Στην περίπτωσή μας, εξάγαμε το προετοιμασμένο σύνολο δεδομένων μας στον προεπιλεγμένο κάδο Studio με ένα output πρόθεμα. Αναφέρουμε αυτήν τη θέση δεδομένων κατά τη φόρτωση των δεδομένων στον Καμβά για τη δημιουργία μοντέλου στη συνέχεια.

Δημιουργήστε και εκπαιδεύστε το μοντέλο σας ML με το Canvas

Στην κονσόλα SageMaker, εκκινήστε την εφαρμογή Canvas. Για να δημιουργήσουμε ένα μοντέλο ML από τα προετοιμασμένα δεδομένα στην προηγούμενη ενότητα, εκτελούμε τα ακόλουθα βήματα:

  1. Εισαγάγετε το προετοιμασμένο σύνολο δεδομένων στο Canvas από τον κάδο S3.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Αναφέρουμε την ίδια διαδρομή S3 όπου εξάγαμε τα αποτελέσματα του Data Wrangler από την προηγούμενη ενότητα.

  1. Δημιουργήστε νέο μοντέλο στο Canvas και ονομάστε το loan_prediction_model.
  2. Επιλέξτε το εισαγόμενο σύνολο δεδομένων και προσθέστε το στο αντικείμενο μοντέλου.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Για να δημιουργήσουμε ένα μοντέλο από το Canvas, πρέπει να επιλέξουμε τη στήλη προορισμού.

  1. Επειδή ο στόχος μας είναι να προβλέψουμε την πιθανότητα ικανότητας ενός δανειστή να αποπληρώσει ένα δάνειο, επιλέγουμε loan_status στήλη.

Το Canvas προσδιορίζει αυτόματα τον τύπο της δήλωσης προβλήματος ML. Κατά τη στιγμή της γραφής, το Canvas υποστηρίζει προβλήματα παλινδρόμησης, ταξινόμησης και πρόβλεψης χρονοσειρών. Μπορείτε να καθορίσετε τον τύπο του προβλήματος ή να ζητήσετε από το Canvas να συμπεράνει αυτόματα το πρόβλημα από τα δεδομένα σας.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

  1. Επιλέξτε την επιλογή σας για να ξεκινήσετε τη διαδικασία κατασκευής μοντέλου: Γρήγορη κατασκευή or Τυπική κατασκευή.

Η Γρήγορη κατασκευή Η επιλογή χρησιμοποιεί το σύνολο δεδομένων σας για να εκπαιδεύσει ένα μοντέλο μέσα σε 2–15 λεπτά. Αυτό είναι χρήσιμο όταν πειραματίζεστε με ένα νέο σύνολο δεδομένων για να προσδιορίσετε εάν το σύνολο δεδομένων που έχετε θα είναι αρκετό για να κάνετε προβλέψεις. Χρησιμοποιούμε αυτήν την επιλογή για αυτήν την ανάρτηση.

Η Τυπική κατασκευή Η επιλογή επιλέγει την ακρίβεια έναντι της ταχύτητας και χρησιμοποιεί περίπου 250 υποψήφια μοντέλα για να εκπαιδεύσει το μοντέλο. Η διαδικασία διαρκεί συνήθως 1-2 ώρες.

Αφού κατασκευαστεί το μοντέλο, μπορείτε να ελέγξετε τα αποτελέσματα του μοντέλου. Ο Canvas εκτιμά ότι το μοντέλο σας είναι σε θέση να προβλέψει το σωστό αποτέλεσμα στο 82.9% των περιπτώσεων. Τα δικά σας αποτελέσματα ενδέχεται να διαφέρουν λόγω της μεταβλητότητας στα μοντέλα προπόνησης.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Επιπλέον, μπορείτε να βουτήξετε βαθιά στην ανάλυση λεπτομερειών του μοντέλου για να μάθετε περισσότερα για το μοντέλο.

Η σημασία χαρακτηριστικών αντιπροσωπεύει την εκτιμώμενη σημασία κάθε χαρακτηριστικού στην πρόβλεψη της στήλης στόχου. Σε αυτήν την περίπτωση, η στήλη της πιστωτικής γραμμής έχει τον πιο σημαντικό αντίκτυπο στην πρόβλεψη του εάν ένας πελάτης θα αποπληρώσει το ποσό του δανείου, ακολουθούμενη από το επιτόκιο και το ετήσιο εισόδημα.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η μήτρα σύγχυσης στο Σύνθετες μετρήσεις Η ενότητα περιέχει πληροφορίες για χρήστες που θέλουν μια βαθύτερη κατανόηση της απόδοσης του μοντέλου τους.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Προτού μπορέσετε να αναπτύξετε το μοντέλο σας για φόρτους εργασίας παραγωγής, χρησιμοποιήστε το Canvas για να δοκιμάσετε το μοντέλο. Το Canvas διαχειρίζεται το τελικό σημείο του μοντέλου μας και μας επιτρέπει να κάνουμε προβλέψεις απευθείας στη διεπαφή χρήστη του Canvas.

  1. Επιλέξτε Προλέγω και αναθεωρήστε τα ευρήματα είτε για τα Πρόβλεψη παρτίδας or Ενιαία πρόβλεψη Tab.

Στο παρακάτω παράδειγμα, κάνουμε μια μεμονωμένη πρόβλεψη τροποποιώντας τιμές για να προβλέψουμε τη μεταβλητή-στόχο μας loan_status σε πραγματικό χρόνο

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Μπορούμε επίσης να επιλέξουμε ένα μεγαλύτερο σύνολο δεδομένων και να βάλουμε το Canvas να δημιουργήσει προβλέψεις παρτίδας για λογαριασμό μας.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Συμπέρασμα

Η μηχανική μάθηση από άκρο σε άκρο είναι πολύπλοκη και επαναληπτική και συχνά περιλαμβάνει πολλαπλά πρόσωπα, τεχνολογίες και διαδικασίες. Το Data Wrangler και το Canvas επιτρέπουν τη συνεργασία μεταξύ ομάδων χωρίς να απαιτείται από αυτές τις ομάδες να γράψουν κώδικα.

Ένας μηχανικός δεδομένων μπορεί εύκολα να προετοιμάσει δεδομένα χρησιμοποιώντας το Data Wrangler χωρίς να γράψει κανέναν κώδικα και να περάσει το προετοιμασμένο σύνολο δεδομένων σε έναν επιχειρησιακό αναλυτή. Ένας επιχειρηματικός αναλυτής μπορεί στη συνέχεια να δημιουργήσει εύκολα ακριβή μοντέλα ML με λίγα μόνο κλικ χρησιμοποιώντας το Canvas και να λάβει ακριβείς προβλέψεις σε πραγματικό χρόνο ή ομαδικά.

Ξεκινήστε με το Data Wrangler χρησιμοποιώντας αυτά τα εργαλεία χωρίς να χρειάζεται να διαχειριστείτε καμία υποδομή. Μπορείς ρυθμίστε τον Καμβά ξεκινήστε γρήγορα και αμέσως να δημιουργείτε μοντέλα ML για να υποστηρίξετε τις ανάγκες της επιχείρησής σας.


Σχετικά με τους Συγγραφείς

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Πέτερ Τσανγκ είναι αρχιτέκτονας λύσεων για το AWS και είναι παθιασμένος με το να βοηθά τους πελάτες να ανακαλύψουν πληροφορίες από τα δεδομένα τους. Έχει δημιουργήσει λύσεις για να βοηθήσει τους οργανισμούς να λαμβάνουν αποφάσεις βάσει δεδομένων τόσο στον δημόσιο όσο και στον ιδιωτικό τομέα. Κατέχει όλες τις πιστοποιήσεις AWS καθώς και δύο πιστοποιήσεις GCP.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. Meenakshisundaram Thandavarayan είναι Ανώτερος ειδικός AI/ML με AWS. Βοηθά στρατηγικούς λογαριασμούς υψηλής τεχνολογίας στο ταξίδι τους σε AI και ML. Είναι πολύ παθιασμένος με την τεχνητή νοημοσύνη που βασίζεται σε δεδομένα.

Δημιουργήστε μια ροή εργασιών μηχανικής εκμάθησης διαχείρισης κινδύνου στο Amazon SageMaker χωρίς κώδικα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Νταν Φέργκιουσον είναι αρχιτέκτονας λύσεων στην AWS, με έδρα τη Νέα Υόρκη, ΗΠΑ. Ως ειδικός στις υπηρεσίες μηχανικής μάθησης, ο Dan εργάζεται για να υποστηρίξει τους πελάτες στο ταξίδι τους για την ενσωμάτωση των ροών εργασίας ML αποτελεσματικά, αποτελεσματικά και βιώσιμα.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS

Προωθήστε την ανακάλυψη και επαναχρησιμοποίηση χαρακτηριστικών σε ολόκληρο τον οργανισμό σας χρησιμοποιώντας το Amazon SageMaker Feature Store και τη δυνατότητα μεταδεδομένων σε επίπεδο χαρακτηριστικών

Κόμβος πηγής: 1606966
Σφραγίδα ώρας: 3 Αυγούστου 2022