Δημιουργία, κοινή χρήση, ανάπτυξη: πώς οι επιχειρησιακοί αναλυτές και οι επιστήμονες δεδομένων επιτυγχάνουν ταχύτερο χρόνο εισόδου στην αγορά χρησιμοποιώντας ML χωρίς κώδικα και το Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Δημιουργία, κοινή χρήση, ανάπτυξη: πώς οι επιχειρησιακοί αναλυτές και οι επιστήμονες δεδομένων επιτυγχάνουν ταχύτερο χρόνο για την αγορά χρησιμοποιώντας ML χωρίς κώδικα και το Amazon SageMaker Canvas

Η μηχανική μάθηση (ML) βοηθά τους οργανισμούς να αυξήσουν τα έσοδα, να προωθήσουν την ανάπτυξη των επιχειρήσεων και να μειώσουν το κόστος βελτιστοποιώντας τις βασικές επιχειρηματικές λειτουργίες σε πολλαπλούς κλάδους, όπως η πρόβλεψη ζήτησης, η βαθμολόγηση πίστωσης, η τιμολόγηση, η πρόβλεψη της απόσυρσης πελατών, ο εντοπισμός επόμενων καλύτερων προσφορών, η πρόβλεψη καθυστερημένων αποστολών και βελτίωση της ποιότητας παραγωγής. Οι παραδοσιακοί κύκλοι ανάπτυξης ML διαρκούν μήνες και απαιτούν σπάνιες δεξιότητες επιστήμης δεδομένων και μηχανικής ML. Οι ιδέες των αναλυτών για τα μοντέλα ML συχνά βρίσκονται σε μεγάλες εκκρεμότητες αναμένοντας το εύρος ζώνης της ομάδας επιστήμης δεδομένων, ενώ οι επιστήμονες δεδομένων επικεντρώνονται σε πιο σύνθετα έργα ML που απαιτούν το πλήρες σύνολο δεξιοτήτων τους.

Για να βοηθήσουμε να σπάσει αυτό το αδιέξοδο, έχουμε παρουσίασε το Amazon SageMaker Canvas, μια λύση ML χωρίς κώδικα που μπορεί να βοηθήσει τις εταιρείες να επιταχύνουν την παράδοση λύσεων ML σε ώρες ή ημέρες. Το SageMaker Canvas επιτρέπει στους αναλυτές να χρησιμοποιούν εύκολα τα διαθέσιμα δεδομένα σε λίμνες δεδομένων, αποθήκες δεδομένων και λειτουργικές αποθήκες δεδομένων. Δημιουργία μοντέλων ML. και χρησιμοποιήστε τα για να κάνετε προβλέψεις διαδραστικά και για ομαδική βαθμολογία σε μαζικά σύνολα δεδομένων — όλα αυτά χωρίς να γράψετε ούτε μια γραμμή κώδικα.

Σε αυτήν την ανάρτηση, δείχνουμε πώς το SageMaker Canvas επιτρέπει τη συνεργασία μεταξύ επιστημόνων δεδομένων και επιχειρηματικών αναλυτών, επιτυγχάνοντας ταχύτερο χρόνο διάθεσης στην αγορά και επιταχύνοντας την ανάπτυξη λύσεων ML. Οι αναλυτές αποκτούν τον δικό τους χώρο εργασίας ML χωρίς κώδικα στο SageMaker Canvas, χωρίς να χρειάζεται να γίνουν ειδικοί ML. Οι αναλυτές μπορούν στη συνέχεια να μοιραστούν τα μοντέλα τους από το Canvas με μερικά κλικ, με τα οποία θα μπορούν να εργαστούν οι επιστήμονες δεδομένων Στούντιο Amazon SageMaker, ένα ολοκληρωμένο περιβάλλον ανάπτυξης ML (IDE). Με τη συνεργασία, οι επιχειρησιακοί αναλυτές μπορούν να φέρουν τις γνώσεις τους στον τομέα και τα αποτελέσματα του πειραματισμού, ενώ οι επιστήμονες δεδομένων μπορούν να δημιουργήσουν αποτελεσματικά αγωγούς και να εξορθολογίσουν τη διαδικασία.

Ας δούμε σε βάθος πώς θα μοιάζει η ροή εργασίας.

Οι επιχειρηματικοί αναλυτές κατασκευάζουν ένα μοντέλο και μετά το μοιράζονται

Για να κατανοήσουμε πώς το SageMaker Canvas απλοποιεί τη συνεργασία μεταξύ επιχειρηματικών αναλυτών και επιστημόνων δεδομένων (ή μηχανικών ML), προσεγγίζουμε πρώτα τη διαδικασία ως επιχειρηματικός αναλυτής. Πριν ξεκινήσετε, ανατρέξτε στο Ανακοινώνουμε το Amazon SageMaker Canvas – μια οπτική ικανότητα εκμάθησης μηχανών χωρίς κώδικα για επιχειρησιακούς αναλυτές για οδηγίες σχετικά με την κατασκευή και τη δοκιμή του μοντέλου με το SageMaker Canvas.

Για αυτήν την ανάρτηση, χρησιμοποιούμε μια τροποποιημένη έκδοση του Σύνολο δεδομένων ανίχνευσης απάτης πιστωτικών καρτών από το Kaggle, ένα πολύ γνωστό σύνολο δεδομένων για ένα πρόβλημα δυαδικής ταξινόμησης. Το σύνολο δεδομένων είναι αρχικά εξαιρετικά μη ισορροπημένο — έχει πολύ λίγες εγγραφές που ταξινομούνται ως αρνητική κατηγορία (ανώμαλες συναλλαγές). Ανεξάρτητα από την κατανομή των χαρακτηριστικών στόχου, μπορούμε να χρησιμοποιήσουμε αυτό το σύνολο δεδομένων, επειδή το SageMaker Canvas χειρίζεται αυτήν την ανισορροπία καθώς εκπαιδεύει και συντονίζει αυτόματα ένα μοντέλο. Αυτό το σύνολο δεδομένων αποτελείται από περίπου 9 εκατομμύρια κελιά. Μπορείτε επίσης να κατεβάσετε ένα μειωμένη έκδοση αυτού του συνόλου δεδομένων. Το μέγεθος του συνόλου δεδομένων είναι πολύ μικρότερο, σε περίπου 500,000 κελιά, επειδή έχει υποβληθεί τυχαία υποδειγματοληψία και στη συνέχεια υπερδειγματοληψία με την τεχνική SMOTE για να διασφαλιστεί ότι θα χαθούν όσο το δυνατόν λιγότερες πληροφορίες κατά τη διάρκεια αυτής της διαδικασίας. Η εκτέλεση ενός ολόκληρου πειράματος με αυτό το μειωμένο σύνολο δεδομένων σας κοστίζει 0 $ στο πλαίσιο του SageMaker Canvas Free Tier.

Αφού κατασκευαστεί το μοντέλο, οι αναλυτές μπορούν να το χρησιμοποιήσουν για να κάνουν προβλέψεις απευθείας στον Καμβά είτε για μεμονωμένα αιτήματα είτε για ένα ολόκληρο σύνολο δεδομένων εισόδου μαζικά.

Χρησιμοποιήστε το εκπαιδευμένο μοντέλο για να δημιουργήσετε προβλέψεις

Τα μοντέλα που έχουν κατασκευαστεί με το Canvas Standard Build μπορούν επίσης να κοινοποιηθούν εύκολα με ένα πάτημα ενός κουμπιού με επιστήμονες δεδομένων και μηχανικούς ML που χρησιμοποιούν το SageMaker Studio. Αυτό επιτρέπει σε έναν επιστήμονα δεδομένων να επικυρώσει την απόδοση του μοντέλου που έχετε δημιουργήσει και να παρέχει σχόλια. Οι μηχανικοί ML μπορούν να παραλάβουν το μοντέλο σας και να το ενσωματώσουν με υπάρχουσες ροές εργασίας και προϊόντα που είναι διαθέσιμα στην εταιρεία και τους πελάτες σας. Λάβετε υπόψη ότι, κατά τη στιγμή της σύνταξης, δεν είναι δυνατή η κοινή χρήση ενός μοντέλου που δημιουργήθηκε με το Canvas Quick Build ή ενός μοντέλου πρόβλεψης χρονοσειρών.

Η κοινή χρήση ενός μοντέλου μέσω του Canvas UI είναι απλή:

  1. Στη σελίδα που δείχνει τα μοντέλα που έχετε δημιουργήσει, επιλέξτε ένα μοντέλο.
  2. Επιλέξτε Κοινοποίηση.Μοιραστείτε το εκπαιδευμένο μοντέλο από την καρτέλα Ανάλυση
  3. Επιλέξτε μία ή περισσότερες εκδόσεις του μοντέλου που θέλετε να μοιραστείτε.
  4. Προαιρετικά, συμπεριλάβετε μια σημείωση που δίνει περισσότερο περιεχόμενο σχετικά με το μοντέλο ή τη βοήθεια που αναζητάτε.
  5. Επιλέξτε Δημιουργία συνδέσμου SageMaker Studio.Μοιραστείτε το μοντέλο με το SageMaker Studio
  6. Αντιγράψτε τον σύνδεσμο που δημιουργήθηκε.Αντιγράψτε τον σύνδεσμο που δημιουργήθηκε

Και τέλος! Τώρα μπορείτε να μοιραστείτε τον σύνδεσμο με τους συναδέλφους σας μέσω Slack, email ή οποιασδήποτε άλλης μεθόδου της προτίμησής σας. Ο επιστήμονας δεδομένων πρέπει να βρίσκεται στον ίδιο τομέα του SageMaker Studio για να έχει πρόσβαση στο μοντέλο σας, επομένως βεβαιωθείτε ότι αυτό συμβαίνει με τον διαχειριστή του οργανισμού σας.

Μοιραστείτε το μοντέλο στέλνοντας ένα μήνυμα Slack ή ένα email

Οι επιστήμονες δεδομένων έχουν πρόσβαση στις πληροφορίες του μοντέλου από το SageMaker Studio

Τώρα, ας παίξουμε το ρόλο ενός επιστήμονα δεδομένων ή ενός μηχανικού ML και ας δούμε τα πράγματα από τη σκοπιά τους χρησιμοποιώντας το SageMaker Studio.

Ο σύνδεσμος που μοιράστηκε ο αναλυτής μας μεταφέρει στο SageMaker Studio, το πρώτο IDE που βασίζεται σε σύννεφο για τη ροή εργασιών ML από άκρο σε άκρο.

Εμφάνιση της επισκόπησης του μοντέλου όπως φαίνεται στο SageMaker Studio

Η καρτέλα ανοίγει αυτόματα και εμφανίζει μια επισκόπηση του μοντέλου που δημιουργήθηκε από τον αναλυτή στο SageMaker Canvas. Μπορείτε να δείτε γρήγορα το όνομα του μοντέλου, τον τύπο προβλήματος ML, την έκδοση του μοντέλου και ποιος χρήστης δημιούργησε το μοντέλο (κάτω από το πεδίο Αναγνωριστικό χρήστη Canvas). Έχετε επίσης πρόσβαση σε λεπτομέρειες σχετικά με το σύνολο δεδομένων εισόδου και το καλύτερο μοντέλο που μπόρεσε να δημιουργήσει το SageMaker. Θα το αναλύσουμε αργότερα στην ανάρτηση.

Στις Σύνολο δεδομένων εισόδου καρτέλα, μπορείτε επίσης να δείτε τη ροή δεδομένων από την πηγή στο σύνολο δεδομένων εισόδου. Σε αυτήν την περίπτωση, χρησιμοποιείται μόνο μία πηγή δεδομένων και δεν έχουν εφαρμοστεί λειτουργίες σύνδεσης, επομένως εμφανίζεται μία μόνο πηγή. Μπορείτε να αναλύσετε στατιστικά στοιχεία και λεπτομέρειες σχετικά με το σύνολο δεδομένων επιλέγοντας Ανοίξτε σημειωματάριο εξερεύνησης δεδομένων. Αυτό το σημειωματάριο σάς επιτρέπει να εξερευνήσετε τα δεδομένα που ήταν διαθέσιμα πριν από την εκπαίδευση του μοντέλου και περιέχει μια ανάλυση της μεταβλητής στόχου, ένα δείγμα των δεδομένων εισόδου, στατιστικά στοιχεία και περιγραφές στηλών και γραμμών, καθώς και άλλες χρήσιμες πληροφορίες για τον επιστήμονα δεδομένων. μάθετε περισσότερα για το σύνολο δεδομένων. Για να μάθετε περισσότερα σχετικά με αυτήν την αναφορά, ανατρέξτε στο Έκθεση εξερεύνησης δεδομένων.

Εμφάνιση της επισκόπησης του μοντέλου, με τις ολοκληρωμένες εργασίες και τις πληροφορίες εργασίας

Αφού αναλύσουμε το σύνολο δεδομένων εισόδου, ας προχωρήσουμε στη δεύτερη καρτέλα της επισκόπησης του μοντέλου, Εργασία AutoML. Αυτή η καρτέλα περιέχει μια περιγραφή της εργασίας AutoML όταν επιλέξατε την επιλογή Standard Build στο SageMaker Canvas.

Η τεχνολογία AutoML κάτω από το SageMaker Canvas εξαλείφει τη βαριά ανύψωση των μοντέλων ML κατασκευής. Δημιουργεί αυτόματα, εκπαιδεύει και συντονίζει το καλύτερο μοντέλο ML με βάση τα δεδομένα σας χρησιμοποιώντας μια αυτοματοποιημένη προσέγγιση, ενώ σας επιτρέπει να διατηρείτε τον πλήρη έλεγχο και την ορατότητα. Αυτή η ορατότητα στα υποψήφια μοντέλα που δημιουργήθηκαν καθώς και στις υπερ-παράμετρους που χρησιμοποιούνται κατά τη διαδικασία AutoML περιέχεται στο σημειωματάριο της γενιάς υποψηφίων, το οποίο είναι διαθέσιμο σε αυτήν την καρτέλα.

Η Εργασία AutoML Η καρτέλα περιέχει επίσης μια λίστα με κάθε μοντέλο που δημιουργήθηκε ως μέρος της διαδικασίας AutoML, ταξινομημένη με βάση τη μέτρηση στόχου F1. Για να επισημάνετε το καλύτερο μοντέλο από τις εργασίες εκπαίδευσης που κυκλοφόρησαν, χρησιμοποιείται μια ετικέτα με πράσινο κύκλο στο Καλύτερο μοντέλο στήλη. Μπορείτε επίσης να οπτικοποιήσετε εύκολα άλλες μετρήσεις που χρησιμοποιούνται κατά τη φάση εκπαίδευσης και αξιολόγησης, όπως η βαθμολογία ακρίβειας και η περιοχή κάτω από την καμπύλη (AUC). Για να μάθετε περισσότερα σχετικά με τα μοντέλα που μπορείτε να εκπαιδεύσετε κατά τη διάρκεια μιας εργασίας AutoML και τις μετρήσεις που χρησιμοποιούνται για την αξιολόγηση των επιδόσεων του εκπαιδευμένου μοντέλου, ανατρέξτε στο Υποστήριξη μοντέλου, μετρήσεις και επικύρωση.

Για να μάθετε περισσότερα σχετικά με το μοντέλο, μπορείτε τώρα να κάνετε δεξί κλικ στο καλύτερο μοντέλο και να επιλέξετε Ανοίξτε τις λεπτομέρειες του μοντέλου. Εναλλακτικά, μπορείτε να επιλέξετε το Καλύτερο μοντέλο σύνδεσμος στην κορυφή του Επισκόπηση μοντέλου ενότητα που επισκεφτήκατε για πρώτη φορά.

Λεπτομέρειες μοντέλου με σημασία και μετρήσεις χαρακτηριστικών

Η σελίδα λεπτομερειών μοντέλου περιέχει μια πληθώρα χρήσιμων πληροφοριών σχετικά με το μοντέλο που απέδωσε καλύτερα με αυτά τα δεδομένα εισόδου. Ας εστιάσουμε πρώτα στη σύνοψη στο επάνω μέρος της σελίδας. Το στιγμιότυπο οθόνης του προηγούμενου παραδείγματος δείχνει ότι, από τις εκατοντάδες εκτελέσεις εκπαίδευσης μοντέλων, ένα μοντέλο XGBoost είχε καλύτερη απόδοση στο σύνολο δεδομένων εισόδου. Τη στιγμή που γράφεται αυτό το άρθρο, το SageMaker Canvas μπορεί να εκπαιδεύσει τρεις τύπους αλγορίθμων ML: linear Learner, XGBoost και ένα multilayer perceptron (MLP), το καθένα με μια μεγάλη ποικιλία αγωγών προεπεξεργασίας και υπερπαραμέτρων. Για να μάθετε περισσότερα για κάθε αλγόριθμο, ανατρέξτε στο σελίδα υποστηριζόμενων αλγορίθμων.

Το SageMaker περιλαμβάνει επίσης μια επεξηγηματική λειτουργικότητα χάρη σε μια επεκτάσιμη και αποτελεσματική εφαρμογή του KernelSHAP, με βάση την έννοια της τιμής Shapley από το πεδίο της συνεταιριστικής θεωρίας παιγνίων που αποδίδει σε κάθε χαρακτηριστικό μια τιμή σημασίας για μια συγκεκριμένη πρόβλεψη. Αυτό επιτρέπει τη διαφάνεια σχετικά με τον τρόπο με τον οποίο το μοντέλο έφτασε στις προβλέψεις του και είναι πολύ χρήσιμο να ορίσουμε τη σημασία των χαρακτηριστικών. Μια πλήρης αναφορά επεξήγησης, συμπεριλαμβανομένης της σημασίας των χαρακτηριστικών, είναι δυνατή η λήψη σε μορφή PDF, σημειωματάριου ή μη επεξεργασμένων δεδομένων. Σε αυτήν την αναφορά, εμφανίζεται ένα ευρύτερο σύνολο μετρήσεων, καθώς και μια πλήρης λίστα υπερπαραμέτρων που χρησιμοποιούνται κατά την εργασία AutoML. Για να μάθετε περισσότερα σχετικά με το πώς το SageMaker παρέχει ολοκληρωμένα εργαλεία επεξήγησης για λύσεις AutoML και τυπικούς αλγόριθμους ML, βλ. Χρησιμοποιήστε ενσωματωμένα εργαλεία επεξήγησης και βελτιώστε την ποιότητα του μοντέλου χρησιμοποιώντας το Amazon SageMaker Autopilot.

Τέλος, οι άλλες καρτέλες σε αυτήν την προβολή εμφανίζουν πληροφορίες σχετικά με λεπτομέρειες απόδοσης (πίνακας σύγχυσης, καμπύλη ανάκλησης ακριβείας, καμπύλη ROC), τεχνουργήματα που χρησιμοποιούνται για εισόδους και δημιουργούνται κατά την εργασία AutoML και λεπτομέρειες δικτύου.

Σε αυτό το σημείο, ο επιστήμονας δεδομένων έχει δύο επιλογές: να αναπτύξει απευθείας το μοντέλο ή να δημιουργήσει έναν αγωγό εκπαίδευσης που μπορεί να προγραμματιστεί ή να ενεργοποιηθεί χειροκίνητα ή αυτόματα. Οι ακόλουθες ενότητες παρέχουν ορισμένες πληροφορίες και για τις δύο επιλογές.

Αναπτύξτε το μοντέλο απευθείας

Εάν ο επιστήμονας δεδομένων είναι ικανοποιημένος με τα αποτελέσματα που προέκυψαν από την εργασία AutoML, μπορεί να αναπτύξει απευθείας το μοντέλο από το Λεπτομέρειες μοντέλου σελίδα. Είναι τόσο απλό όσο η επιλογή Ανάπτυξη μοντέλου δίπλα στο όνομα του μοντέλου.

Πρόσθετες λεπτομέρειες μοντέλου, από πού να αναπτυχθεί το μοντέλο

Το SageMaker σάς δείχνει δύο επιλογές για ανάπτυξη: ένα τελικό σημείο σε πραγματικό χρόνο, που υποστηρίζεται από Καταληκτικά σημεία Amazon SageMaker, και συμπεράσματα παρτίδας, που υποστηρίζονται από Μετατροπή παρτίδας Amazon SageMaker.

Επιλογή εκκίνησης πρόβλεψης από το AutoML

Το SageMaker παρέχει επίσης άλλους τρόπους εξαγωγής συμπερασμάτων. Για να μάθετε περισσότερα, δείτε Ανάπτυξη μοντέλων για συμπέρασμα.

Για να ενεργοποιήσετε τη λειτουργία προβλέψεων σε πραγματικό χρόνο, δίνετε απλώς στο τελικό σημείο ένα όνομα, έναν τύπο παρουσίας και έναν αριθμό παρουσιών. Επειδή αυτό το μοντέλο δεν απαιτεί μεγάλους υπολογιστικούς πόρους, μπορείτε να χρησιμοποιήσετε ένα στιγμιότυπο που βασίζεται σε CPU με αρχικό πλήθος 1. Μπορείτε να μάθετε περισσότερα για τα διάφορα είδη παρουσιών που είναι διαθέσιμα και τις προδιαγραφές τους στο Σελίδα τιμών Amazon SageMaker (στο Τιμολόγηση κατ' απαίτηση ενότητα, επιλέξτε το Συμπεράσματα σε πραγματικό χρόνο αυτί). Εάν δεν γνωρίζετε ποια περίπτωση θα πρέπει να επιλέξετε για την ανάπτυξή σας, μπορείτε επίσης να ζητήσετε από το SageMaker να βρει την καλύτερη για εσάς σύμφωνα με τους KPI σας χρησιμοποιώντας το SageMaker Inference Recommender. Μπορείτε επίσης να παρέχετε πρόσθετες προαιρετικές παραμέτρους, σχετικά με το εάν θέλετε ή όχι να καταγράψετε δεδομένα αιτήματος και απόκρισης προς ή από το τελικό σημείο. Αυτό μπορεί να αποδειχθεί χρήσιμο εάν το σχεδιάζετε παρακολούθηση του μοντέλου σας. Μπορείτε επίσης να επιλέξετε ποιο περιεχόμενο θέλετε να παρέχετε ως μέρος της απάντησής σας—είτε πρόκειται απλώς για την πρόβλεψη είτε για την πιθανότητα πρόβλεψης, την πιθανότητα όλων των κλάσεων και τις ετικέτες-στόχους.

Για να εκτελέσετε μια εργασία βαθμολογίας παρτίδας λαμβάνοντας προβλέψεις για ένα ολόκληρο σύνολο εισόδων ταυτόχρονα, μπορείτε να ξεκινήσετε την εργασία μετασχηματισμού παρτίδας από το Κονσόλα διαχείρισης AWS ή μέσω του SageMaker Python SDK. Για να μάθετε περισσότερα σχετικά με τον μετασχηματισμό παρτίδας, ανατρέξτε στο Χρησιμοποιήστε το Batch Transform και τα παραδείγματα τετράδια.

Καθορίστε έναν αγωγό εκπαίδευσης

Τα μοντέλα ML μπορούν πολύ σπάνια, έως ποτέ, να θεωρηθούν στατικά και αμετάβλητα, επειδή απομακρύνονται από τη γραμμή βάσης στην οποία έχουν εκπαιδευτεί. Τα δεδομένα του πραγματικού κόσμου εξελίσσονται με την πάροδο του χρόνου και περισσότερα μοτίβα και ιδέες προκύπτουν από αυτά, τα οποία μπορεί ή όχι να αποτυπωθούν από το αρχικό μοντέλο που έχει εκπαιδευτεί σε ιστορικά δεδομένα. Για να λύσετε αυτό το πρόβλημα, μπορείτε να ρυθμίσετε μια γραμμή εκπαίδευσης που επανεκπαιδεύει αυτόματα τα μοντέλα σας με τα πιο πρόσφατα διαθέσιμα δεδομένα.

Κατά τον καθορισμό αυτού του αγωγού, μία από τις επιλογές του επιστήμονα δεδομένων είναι να χρησιμοποιήσει ξανά το AutoML για τον αγωγό εκπαίδευσης. Μπορείτε να ξεκινήσετε μια εργασία AutoML μέσω προγραμματισμού επικαλώντας το API create_auto_ml_job() από το AWS Boto3 SDK. Μπορείτε να καλέσετε αυτήν τη λειτουργία από ένα AWS Lambda λειτουργία εντός ενός Λειτουργίες βημάτων AWS ροή εργασίας ή από ένα LambdaStep in Αγωγοί Amazon SageMaker.

Εναλλακτικά, ο επιστήμονας δεδομένων μπορεί να χρησιμοποιήσει τις γνώσεις, τα τεχνουργήματα και τις υπερπαραμέτρους που αποκτήθηκαν από την εργασία AutoML για να ορίσει μια πλήρη διοχέτευση εκπαίδευσης. Χρειάζεστε τους ακόλουθους πόρους:

  • Ο αλγόριθμος που λειτούργησε καλύτερα για την περίπτωση χρήσης – Λάβατε ήδη αυτές τις πληροφορίες από τη σύνοψη του μοντέλου που δημιουργήθηκε από το Canvas. Για αυτήν την περίπτωση χρήσης, είναι ο ενσωματωμένος αλγόριθμος XGBoost. Για οδηγίες σχετικά με τον τρόπο χρήσης του SageMaker Python SDK για την εκπαίδευση του αλγόριθμου XGBoost με το SageMaker, ανατρέξτε στο Χρησιμοποιήστε το XGBoost με το SageMaker Python SDK.
    Πληροφορίες σχετικά με τον αλγόριθμο που εκπαιδεύτηκε με την εργασία Canvas
  • Οι υπερπαράμετροι που προέρχονται από την εργασία AutoML – Αυτά είναι διαθέσιμα στο Επεξήγηση Ενότητα. Μπορείτε να τα χρησιμοποιήσετε ως εισόδους κατά τον καθορισμό της εργασίας εκπαίδευσης με το SageMaker Python SDK.
    Οι υπερπαράμετροι του μοντέλου
  • Ο κωδικός μηχανικής χαρακτηριστικών που παρέχεται στην ενότητα Artifacts – Μπορείτε να χρησιμοποιήσετε αυτόν τον κώδικα τόσο για την προεπεξεργασία των δεδομένων πριν από την εκπαίδευση (για παράδειγμα, μέσω του Amazon SageMaker Processing), όσο και πριν από την εξαγωγή συμπερασμάτων (για παράδειγμα, ως μέρος μιας διοχέτευσης συμπερασμάτων SageMaker).
    Το S3 URI του Feature Engineering Code

Μπορείτε να συνδυάσετε αυτούς τους πόρους ως μέρος μιας διοχέτευσης του SageMaker. Παραλείπουμε τις λεπτομέρειες εφαρμογής σε αυτήν την ανάρτηση—μείνετε συντονισμένοι για περισσότερο περιεχόμενο σχετικά με αυτό το θέμα.

Συμπέρασμα

Το SageMaker Canvas σάς επιτρέπει να χρησιμοποιείτε το ML για να δημιουργείτε προβλέψεις χωρίς να χρειάζεται να γράψετε κώδικα. Ένας επιχειρησιακός αναλυτής μπορεί αυτόνομα να αρχίσει να το χρησιμοποιεί με τοπικά σύνολα δεδομένων, καθώς και δεδομένα που είναι ήδη αποθηκευμένα σε Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3), Amazon RedShift, ή νιφάδα χιονιού. Με λίγα μόνο κλικ, μπορούν να προετοιμάσουν και να ενώσουν τα σύνολα δεδομένων τους, να αναλύσουν την εκτιμώμενη ακρίβεια, να επαληθεύσουν ποιες στήλες έχουν αντίκτυπο, να εκπαιδεύσουν το μοντέλο με την καλύτερη απόδοση και να δημιουργήσουν νέες μεμονωμένες ή παρτίδες προβλέψεις, όλα αυτά χωρίς να χρειάζεται να προσελκύσουν έναν ειδικό επιστήμονα δεδομένων. Στη συνέχεια, όπως χρειάζεται, μπορούν να μοιραστούν το μοντέλο με μια ομάδα επιστημόνων δεδομένων ή μηχανικών MLOps, οι οποίοι εισάγουν τα μοντέλα στο SageMaker Studio και συνεργάζονται μαζί με τον αναλυτή για την παροχή μιας λύσης παραγωγής.

Οι επιχειρηματικοί αναλυτές μπορούν να αποκτήσουν ανεξάρτητα πληροφορίες από τα δεδομένα τους χωρίς να έχουν πτυχίο ML και χωρίς να χρειάζεται να γράψουν ούτε μια γραμμή κώδικα. Οι επιστήμονες δεδομένων μπορούν πλέον να έχουν επιπλέον χρόνο για να εργαστούν σε πιο απαιτητικά έργα που μπορούν να χρησιμοποιήσουν καλύτερα τις εκτεταμένες γνώσεις τους για την τεχνητή νοημοσύνη και την ML.

Πιστεύουμε ότι αυτή η νέα συνεργασία ανοίγει την πόρτα για τη δημιουργία πολλών πιο ισχυρών λύσεων ML για την επιχείρησή σας. Τώρα έχετε αναλυτές που παράγουν πολύτιμες επιχειρηματικές πληροφορίες, ενώ αφήνετε τους επιστήμονες δεδομένων και τους μηχανικούς ML να βοηθήσουν στη βελτίωση, τον συντονισμό και την επέκταση ανάλογα με τις ανάγκες.

Επιπρόσθετοι πόροι

  • Για να μάθετε περισσότερα σχετικά με το πώς το SageMaker μπορεί να βοηθήσει περαιτέρω τους επιχειρηματικούς αναλυτές, ανατρέξτε στο Amazon SageMaker για Επιχειρηματικούς Αναλυτές.
  • Για να μάθετε περισσότερα σχετικά με το πώς το SageMaker επιτρέπει στους επιστήμονες δεδομένων να αναπτύσσουν, να εκπαιδεύουν και να αναπτύσσουν τα μοντέλα ML τους, ρίξτε μια ματιά Amazon SageMaker για Επιστήμονες Δεδομένων.
  • Για περισσότερες πληροφορίες σχετικά με το πώς το SageMaker μπορεί να βοηθήσει τους μηχανικούς MLOps στον εξορθολογισμό του κύκλου ζωής του ML χρησιμοποιώντας τα MLOps, ανατρέξτε στο Amazon SageMaker για Μηχανικούς MLOps.

Σχετικά με τους Συγγραφείς

Δημιουργία, κοινή χρήση, ανάπτυξη: πώς οι επιχειρησιακοί αναλυτές και οι επιστήμονες δεδομένων επιτυγχάνουν ταχύτερο χρόνο εισόδου στην αγορά χρησιμοποιώντας ML χωρίς κώδικα και το Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Davide Gallitelli είναι Ειδικός Αρχιτέκτονας Λύσεων για AI/ML στην περιοχή EMEA. Εδρεύει στις Βρυξέλλες και συνεργάζεται στενά με πελάτες σε όλη τη Μπενελούξ. Είναι προγραμματιστής από πολύ μικρός, ξεκινώντας να κωδικοποιεί σε ηλικία 7 ετών. Άρχισε να μαθαίνει AI/ML στο πανεπιστήμιο και από τότε το ερωτεύτηκε.

Δημιουργία, κοινή χρήση, ανάπτυξη: πώς οι επιχειρησιακοί αναλυτές και οι επιστήμονες δεδομένων επιτυγχάνουν ταχύτερο χρόνο εισόδου στην αγορά χρησιμοποιώντας ML χωρίς κώδικα και το Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Μαρκ Ρόι είναι ένας κύριος αρχιτέκτονας μηχανικής μάθησης για AWS, βοηθώντας τους πελάτες να σχεδιάσουν και να κατασκευάσουν λύσεις AI / ML. Το έργο του Mark καλύπτει ένα ευρύ φάσμα περιπτώσεων χρήσης ML, με πρωταρχικό ενδιαφέρον για την όραση του υπολογιστή, τη βαθιά μάθηση και την κλιμάκωση του ML σε ολόκληρη την επιχείρηση. Έχει βοηθήσει εταιρείες σε πολλούς κλάδους, συμπεριλαμβανομένων των ασφαλίσεων, των χρηματοοικονομικών υπηρεσιών, των μέσων ενημέρωσης και της ψυχαγωγίας, της υγειονομικής περίθαλψης, των υπηρεσιών κοινής ωφέλειας και της κατασκευής. Ο Mark κατέχει έξι πιστοποιήσεις AWS, συμπεριλαμβανομένης της πιστοποίησης ML Speciality. Πριν από την ένταξή του στην AWS, ο Mark ήταν αρχιτέκτονας, προγραμματιστής και ηγέτης τεχνολογίας για πάνω από 25 χρόνια, συμπεριλαμβανομένων 19 ετών σε χρηματοοικονομικές υπηρεσίες.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS