Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Μέρος 2

Ανάλογα με την ποιότητα και την πολυπλοκότητα των δεδομένων, οι επιστήμονες δεδομένων ξοδεύουν μεταξύ 45-80% του χρόνου τους σε εργασίες προετοιμασίας δεδομένων. Αυτό σημαίνει ότι η προετοιμασία και ο καθαρισμός δεδομένων αφαιρούν πολύτιμο χρόνο από την πραγματική εργασία της επιστήμης δεδομένων. Αφού ένα μοντέλο μηχανικής μάθησης (ML) εκπαιδευτεί με έτοιμα δεδομένα και ετοιμαστεί για ανάπτυξη, οι επιστήμονες δεδομένων πρέπει συχνά να ξαναγράψουν τους μετασχηματισμούς δεδομένων που χρησιμοποιούνται για την προετοιμασία δεδομένων για συμπέρασμα ML. Αυτό μπορεί να παρατείνει το χρόνο που χρειάζεται για την ανάπτυξη ενός χρήσιμου μοντέλου που μπορεί να συμπεράνει και να βαθμολογεί τα δεδομένα από το ακατέργαστο σχήμα και τη μορφή του.

Στο Μέρος 1 αυτής της σειράς, δείξαμε πώς το Data Wrangler ενεργοποιεί α ενοποιημένη προετοιμασία δεδομένων και εκπαίδευση μοντέλων εμπειρία με Αυτόματος πιλότος Amazon SageMaker σε λίγα μόνο κλικ. Σε αυτό το δεύτερο και τελευταίο μέρος αυτής της σειράς, εστιάζουμε σε ένα χαρακτηριστικό που περιλαμβάνει και επαναχρησιμοποιεί Amazon SageMaker Data Wrangler μετασχηματισμούς, όπως υπολογιστές τιμών που λείπουν, κωδικοποιητές τακτικού ή μονού και πολλά άλλα, μαζί με τα μοντέλα Autopilot για συμπέρασμα ML. Αυτή η δυνατότητα επιτρέπει την αυτόματη προεπεξεργασία των πρωτογενών δεδομένων με την επαναχρησιμοποίηση των μετασχηματισμών χαρακτηριστικών Data Wrangler τη στιγμή της εξαγωγής συμπερασμάτων, μειώνοντας περαιτέρω τον χρόνο που απαιτείται για την ανάπτυξη ενός εκπαιδευμένου μοντέλου στην παραγωγή.

Επισκόπηση λύσεων

Το Data Wrangler μειώνει τον χρόνο συγκέντρωσης και προετοιμασίας δεδομένων για ML από εβδομάδες σε λεπτά και ο Autopilot δημιουργεί αυτόματα, εκπαιδεύει και συντονίζει τα καλύτερα μοντέλα ML με βάση τα δεδομένα σας. Με τον αυτόματο πιλότο, εξακολουθείτε να διατηρείτε τον πλήρη έλεγχο και την ορατότητα των δεδομένων και του μοντέλου σας. Και οι δύο υπηρεσίες έχουν σχεδιαστεί ειδικά για να κάνουν τους επαγγελματίες ML πιο παραγωγικούς και να επιταχύνουν το χρόνο για να αποκτήσουν αξία.

Το παρακάτω διάγραμμα απεικονίζει την αρχιτεκτονική λύσεών μας.

Προϋποθέσεις

Επειδή αυτή η ανάρτηση είναι η δεύτερη από μια σειρά δύο μερών, βεβαιωθείτε ότι έχετε διαβάσει και εφαρμόσει με επιτυχία Μέρος 1 πριν συνεχίσετε.

Εξαγωγή και εκπαίδευση του μοντέλου

Στο Μέρος 1, μετά την προετοιμασία δεδομένων για ML, συζητήσαμε πώς μπορείτε να χρησιμοποιήσετε την ενσωματωμένη εμπειρία στο Data Wrangler για να αναλύσετε σύνολα δεδομένων και να δημιουργήσετε εύκολα μοντέλα ML υψηλής ποιότητας στον Αυτόματο πιλότο.

Αυτή τη φορά, χρησιμοποιούμε την ενσωμάτωση Autopilot για άλλη μια φορά για να εκπαιδεύσουμε ένα μοντέλο με βάση το ίδιο σύνολο δεδομένων εκπαίδευσης, αλλά αντί να κάνουμε μαζική εξαγωγή συμπερασμάτων, εκτελούμε συμπεράσματα σε πραγματικό χρόνο με Amazon Sage Maker τελικό σημείο συμπερασμάτων που δημιουργείται αυτόματα για εμάς.

Εκτός από την ευκολία που παρέχει η αυτόματη ανάπτυξη τελικού σημείου, δείχνουμε πώς μπορείτε επίσης να αναπτύξετε με όλους τους μετασχηματισμούς των χαρακτηριστικών Data Wrangler ως διοχέτευση σειριακών συμπερασμάτων του SageMaker. Αυτό επιτρέπει την αυτόματη προεπεξεργασία των ακατέργαστων δεδομένων με την επαναχρησιμοποίηση των μετασχηματισμών χαρακτηριστικών Data Wrangler τη στιγμή της εξαγωγής συμπερασμάτων.

Λάβετε υπόψη ότι αυτή η δυνατότητα υποστηρίζεται προς το παρόν μόνο για ροές Data Wrangler που δεν χρησιμοποιούν μετασχηματισμούς σύνδεσης, ομαδοποίησης, συνένωσης και χρονοσειρών.

Μπορούμε να χρησιμοποιήσουμε τη νέα ενσωμάτωση του Data Wrangler με τον Autopilot για να εκπαιδεύσουμε απευθείας ένα μοντέλο από τη διεπαφή χρήστη ροής δεδομένων Data Wrangler.

  1. Επιλέξτε το σύμβολο συν δίπλα στο Τιμές κλίμακας κόμβο και επιλέξτε Μοντέλο αμαξοστοιχίας.
  2. Για Τοποθεσία Amazon S3, καθορίστε το Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3) τοποθεσία όπου το SageMaker εξάγει τα δεδομένα σας.
    Εάν παρουσιάζεται από προεπιλογή μια διαδρομή κάδου ρίζας, το Data Wrangler δημιουργεί έναν μοναδικό υποκατάλογο εξαγωγής κάτω από αυτόν—δεν χρειάζεται να τροποποιήσετε αυτήν την προεπιλεγμένη ριζική διαδρομή εκτός και αν το θέλετε. Το Autopilot χρησιμοποιεί αυτήν τη θέση για να εκπαιδεύσει αυτόματα ένα μοντέλο, εξοικονομώντας σας χρόνος από τον καθορισμό της θέσης εξόδου της ροής Data Wrangler και, στη συνέχεια, τον καθορισμό της θέσης εισόδου των δεδομένων εκπαίδευσης Αυτόματου πιλότου. Αυτό δημιουργεί μια πιο απρόσκοπτη εμπειρία.
  3. Επιλέξτε Εξαγωγή και τρένο για εξαγωγή των μετασχηματισμένων δεδομένων στο Amazon S3.
    Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
    Όταν η εξαγωγή είναι επιτυχής, ανακατευθύνεστε στο Δημιουργήστε ένα πείραμα αυτόματου πιλότου σελίδα, με το Εισαγωγή δεδομένων Η τοποθεσία S3 έχει ήδη συμπληρωθεί για εσάς (συμπληρώθηκε από τα αποτελέσματα της προηγούμενης σελίδας).
  4. Για Όνομα πειράματος, πληκτρολογήστε ένα όνομα (ή διατηρήστε το προεπιλεγμένο όνομα).
  5. Για στόχος, επιλέξτε Αποτέλεσμα ως τη στήλη που θέλετε να προβλέψετε.
  6. Επιλέξτε Επόμενο: Μέθοδος προπόνησης.
    Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Όπως αναλυτικά στην ανάρτηση Το Amazon SageMaker Autopilot είναι έως και οκτώ φορές πιο γρήγορο με τη νέα λειτουργία εκπαίδευσης συνόλου που υποστηρίζεται από το AutoGluon, μπορείτε είτε να επιτρέψετε στον Αυτόματο πιλότο να επιλέξει τη λειτουργία εκπαίδευσης αυτόματα με βάση το μέγεθος του συνόλου δεδομένων είτε να επιλέξετε τη λειτουργία εκπαίδευσης με μη αυτόματο τρόπο είτε για βελτιστοποίηση συνόλου είτε για βελτιστοποίηση υπερπαραμέτρων (HPO).

Οι λεπτομέρειες για κάθε επιλογή είναι οι εξής:

  • AUTO – Ο Αυτόματος πιλότος επιλέγει αυτόματα τη λειτουργία συνόλου ή HPO με βάση το μέγεθος των δεδομένων σας. Εάν το σύνολο δεδομένων σας είναι μεγαλύτερο από 100 MB, ο Autopilot επιλέγει HPO. αλλιώς επιλέγει το ensembling.
  • Συναρμολόγηση – Ο αυτόματος πιλότος χρησιμοποιεί το AutoGluon τεχνική συνόλου για την εκπαίδευση πολλών βασικών μοντέλων και συνδυάζει τις προβλέψεις τους χρησιμοποιώντας στοίβαξη μοντέλων σε ένα βέλτιστο προγνωστικό μοντέλο.
  • Βελτιστοποίηση υπερπαραμέτρων – Ο Αυτόματος πιλότος βρίσκει την καλύτερη έκδοση ενός μοντέλου ρυθμίζοντας υπερπαραμέτρους χρησιμοποιώντας την τεχνική βελτιστοποίησης Bayes και εκτελώντας εργασίες εκπαίδευσης στο σύνολο δεδομένων σας. Το HPO επιλέγει τους αλγόριθμους που σχετίζονται περισσότερο με το σύνολο δεδομένων σας και επιλέγει το καλύτερο εύρος υπερπαραμέτρων για να συντονίσει τα μοντέλα. Για το παράδειγμά μας, αφήνουμε την προεπιλεγμένη επιλογή του AUTO.
  1. Επιλέξτε Επόμενο: Ανάπτυξη και σύνθετες ρυθμίσεις για να συνεχίσετε.
    Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  2. Στις Ανάπτυξη και σύνθετες ρυθμίσεις σελίδα, επιλέξτε μια επιλογή ανάπτυξης.
    Είναι σημαντικό να κατανοήσετε τις επιλογές ανάπτυξης με περισσότερες λεπτομέρειες. αυτό που θα επιλέξουμε θα επηρεάσει το εάν οι μετασχηματισμοί που κάναμε νωρίτερα στο Data Wrangler θα συμπεριληφθούν ή όχι στη γραμμή συμπερασμάτων:
    • Αυτόματη ανάπτυξη του καλύτερου μοντέλου με μετασχηματισμούς από το Data Wrangler – Με αυτήν την επιλογή ανάπτυξης, όταν προετοιμάζετε δεδομένα στο Data Wrangler και εκπαιδεύετε ένα μοντέλο επικαλώντας τον αυτόματο πιλότο, το εκπαιδευμένο μοντέλο αναπτύσσεται παράλληλα με όλους τους μετασχηματισμούς της δυνατότητας Data Wrangler ως Σειριακός αγωγός συμπερασμάτων SageMaker. Αυτό επιτρέπει την αυτόματη προεπεξεργασία των ακατέργαστων δεδομένων με την επαναχρησιμοποίηση των μετασχηματισμών χαρακτηριστικών Data Wrangler τη στιγμή της εξαγωγής συμπερασμάτων. Λάβετε υπόψη ότι το τελικό σημείο συμπερασμάτων αναμένει ότι η μορφή των δεδομένων σας θα είναι στην ίδια μορφή όπως όταν εισάγονται στη ροή δεδομένων Wrangler.
    • Αυτόματη ανάπτυξη του καλύτερου μοντέλου χωρίς μετασχηματισμούς από το Data Wrangler – Αυτή η επιλογή αναπτύσσει ένα τελικό σημείο σε πραγματικό χρόνο που δεν χρησιμοποιεί μετασχηματισμούς Data Wrangler. Σε αυτήν την περίπτωση, πρέπει να εφαρμόσετε τους μετασχηματισμούς που ορίζονται στη ροή του Data Wrangler στα δεδομένα σας πριν από το συμπέρασμα.
    • Μην αναπτύσσετε αυτόματα το καλύτερο μοντέλο – Θα πρέπει να χρησιμοποιείτε αυτήν την επιλογή όταν δεν θέλετε να δημιουργήσετε καθόλου τελικό σημείο συμπερασμάτων. Είναι χρήσιμο εάν θέλετε να δημιουργήσετε ένα καλύτερο μοντέλο για μεταγενέστερη χρήση, όπως συμπέρασμα μαζικής εκτέλεσης τοπικά. (Αυτή είναι η επιλογή ανάπτυξης που επιλέξαμε στο Μέρος 1 της σειράς.) Σημειώστε ότι όταν κάνετε αυτήν την επιλογή, το μοντέλο που δημιουργήθηκε (από τον καλύτερο υποψήφιο του Αυτόματου πιλότου μέσω του SageMaker SDK) περιλαμβάνει τους μετασχηματισμούς της δυνατότητας Data Wrangler ως διοχέτευση σειριακών συμπερασμάτων του SageMaker.

    Για αυτήν την ανάρτηση, χρησιμοποιούμε το Αυτόματη ανάπτυξη του καλύτερου μοντέλου με μετασχηματισμούς από το Data Wrangler επιλογή.

  3. Για Επιλογή ανάπτυξης, Επιλέξτε Αυτόματη ανάπτυξη του καλύτερου μοντέλου με μετασχηματισμούς από το Data Wrangler.
  4. Αφήστε τις υπόλοιπες ρυθμίσεις ως προεπιλεγμένες.
  5. Επιλέξτε Επόμενο: Ελέγξτε και δημιουργήστε για να συνεχίσετε.
    Στις Ελέγξτε και δημιουργήστε σελίδα, βλέπουμε μια σύνοψη των ρυθμίσεων που επιλέχθηκαν για το πείραμα αυτόματου πιλότου.
  6. Επιλέξτε Δημιουργία πειράματος για να ξεκινήσει η διαδικασία δημιουργίας μοντέλου.
    Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Ανακατευθυνθείτε στη σελίδα περιγραφής εργασίας του Αυτόματου πιλότου. Τα μοντέλα εμφανίζονται στο Μοντέλα καρτέλα καθώς δημιουργούνται. Για να επιβεβαιώσετε ότι η διαδικασία έχει ολοκληρωθεί, μεταβείτε στο Εργασιακό προφίλ καρτέλα και αναζητήστε ένα Completed αξία για το Κατάσταση τομέα.

Μπορείτε να επιστρέψετε σε αυτήν τη σελίδα περιγραφής εργασίας Αυτόματου πιλότου ανά πάσα στιγμή από Στούντιο Amazon SageMaker:

  1. Επιλέξτε Πειράματα και Δοκιμές σχετικά με την Πόροι SageMaker πτυσώμενο μενού.
  2. Επιλέξτε το όνομα της εργασίας Autopilot που δημιουργήσατε.
  3. Επιλέξτε (κάντε δεξί κλικ) το πείραμα και επιλέξτε Περιγράψτε την εργασία AutoML.

Δείτε την εκπαίδευση και την ανάπτυξη

Όταν ο Αυτόματος πιλότος ολοκληρώσει το πείραμα, μπορούμε να προβάλουμε τα αποτελέσματα της εκπαίδευσης και να εξερευνήσουμε το καλύτερο μοντέλο από τη σελίδα περιγραφής εργασίας του Αυτόματου πιλότου.

Επιλέξτε (κάντε δεξί κλικ) το μοντέλο με την ετικέτα Καλύτερο μοντέλο, και επιλέξτε Ανοίξτε τις λεπτομέρειες του μοντέλου.

Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η επίδοση Η καρτέλα εμφανίζει πολλές δοκιμές μέτρησης μοντέλων, συμπεριλαμβανομένου ενός πίνακα σύγχυσης, της περιοχής κάτω από την καμπύλη ακριβείας/ανάκλησης (AUCPR) και της περιοχής κάτω από τη χαρακτηριστική καμπύλη λειτουργίας δέκτη (ROC). Αυτά απεικονίζουν τη συνολική απόδοση επικύρωσης του μοντέλου, αλλά δεν μας λένε αν το μοντέλο θα γενικευτεί καλά. Χρειάζεται ακόμα να κάνουμε αξιολογήσεις σε μη ορατά δεδομένα δοκιμών για να δούμε πόσο ακριβείς κάνει προβλέψεις το μοντέλο (για αυτό το παράδειγμα, προβλέπουμε εάν ένα άτομο θα έχει διαβήτη).

Εκτελέστε συμπεράσματα σε σχέση με το τελικό σημείο σε πραγματικό χρόνο

Δημιουργήστε ένα νέο σημειωματάριο SageMaker για την εκτέλεση συμπερασμάτων σε πραγματικό χρόνο για την αξιολόγηση της απόδοσης του μοντέλου. Εισαγάγετε τον ακόλουθο κώδικα σε ένα σημειωματάριο για να εκτελέσετε τα συμπεράσματα σε πραγματικό χρόνο για επικύρωση:

import boto3

### Define required boto3 clients

sm_client = boto3.client(service_name="sagemaker")
runtime_sm_client = boto3.client(service_name="sagemaker-runtime")

### Define endpoint name

endpoint_name = ""

### Define input data

payload_str = '5,166.0,72.0,19.0,175.0,25.8,0.587,51'
payload = payload_str.encode()
response = runtime_sm_client.invoke_endpoint(
    EndpointName=endpoint_name,
    ContentType="text/csv",
    Body=payload,
)

response["Body"].read()

Αφού ρυθμίσετε τον κώδικα για εκτέλεση στο σημειωματάριό σας, πρέπει να διαμορφώσετε δύο μεταβλητές:

  • endpoint_name
  • payload_str

Διαμόρφωση endpoint_name

endpoint_name αντιπροσωπεύει το όνομα του τελικού σημείου συμπερασμάτων σε πραγματικό χρόνο που η ανάπτυξη δημιουργήθηκε αυτόματα για εμάς. Πριν το ρυθμίσουμε, πρέπει να βρούμε το όνομά του.

  1. Επιλέξτε Τελικά σημεία σχετικά με την Πόροι SageMaker πτυσώμενο μενού.
  2. Εντοπίστε το όνομα του τερματικού σημείου που έχει το όνομα της εργασίας Αυτόματου πιλότου που δημιουργήσατε με μια τυχαία συμβολοσειρά προσαρτημένη σε αυτήν.
  3. Επιλέξτε (κάντε δεξί κλικ) το πείραμα και επιλέξτε Περιγράψτε το τελικό σημείο.
    Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
    Η Λεπτομέρειες τελικού σημείου εμφανίζεται η σελίδα.
  4. Επισημάνετε το πλήρες όνομα τελικού σημείου και πατήστε Ctrl + C για να το αντιγράψετε στο πρόχειρο.
    Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  5. Εισαγάγετε αυτήν την τιμή (βεβαιωθείτε ότι είναι εισηγμένη) για endpoint_name στο τετράδιο συμπερασμάτων.
    Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Διαμόρφωση payload_str

Το σημειωματάριο συνοδεύεται από μια προεπιλεγμένη συμβολοσειρά ωφέλιμου φορτίου payload_str που μπορείτε να χρησιμοποιήσετε για να δοκιμάσετε το τελικό σημείο σας, αλλά μη διστάσετε να πειραματιστείτε με διαφορετικές τιμές, όπως αυτές από το σύνολο δεδομένων δοκιμής σας.

Για να τραβήξετε τιμές από το σύνολο δεδομένων δοκιμής, ακολουθήστε τις οδηγίες στο Μέρος 1 για να εξαγάγετε το δοκιμαστικό σύνολο δεδομένων στο Amazon S3. Στη συνέχεια, στην κονσόλα Amazon S3, μπορείτε να το κατεβάσετε και να επιλέξετε τις σειρές για να χρησιμοποιήσετε το αρχείο από το Amazon S3.

Κάθε γραμμή στο δοκιμαστικό σας σύνολο έχει εννέα στήλες, με την τελευταία στήλη να είναι η outcome αξία. Για αυτόν τον κωδικό σημειωματάριου, βεβαιωθείτε ότι χρησιμοποιείτε μόνο μία γραμμή δεδομένων (ποτέ κεφαλίδα CSV) για payload_str. Επίσης, βεβαιωθείτε ότι στέλνετε μόνο ένα payload_str με οκτώ στήλες, όπου έχετε αφαιρέσει την τιμή του αποτελέσματος.

Για παράδειγμα, εάν τα δοκιμαστικά αρχεία συνόλου δεδομένων σας μοιάζουν με τον ακόλουθο κώδικα και θέλουμε να εκτελέσουμε συμπέρασμα σε πραγματικό χρόνο για την πρώτη σειρά:

Pregnancies,Glucose,BloodPressure,SkinThickness,Insulin,BMI,DiabetesPedigreeFunction,Age,Outcome 
10,115,0,0,0,35.3,0.134,29,0 
10,168,74,0,0,38.0,0.537,34,1 
1,103,30,38,83,43.3,0.183,33,0

Ορίσαμε payload_str προς την 10,115,0,0,0,35.3,0.134,29. Σημειώστε πώς παραλείψαμε το outcome αξία 0 στο τέλος.

Εάν κατά τύχη η τιμή-στόχος του συνόλου δεδομένων σας δεν είναι η πρώτη ή η τελευταία τιμή, απλώς αφαιρέστε την τιμή με ανέπαφη τη δομή του κόμματος. Για παράδειγμα, ας υποθέσουμε ότι προβλέπουμε τη γραμμή και το σύνολο δεδομένων μας μοιάζει με τον ακόλουθο κώδικα:

foo,bar,foobar
85,17,20

Σε αυτή την περίπτωση, ορίζουμε payload_str προς την 85,,20.

Όταν το σημειωματάριο εκτελείται με το σωστά διαμορφωμένο payload_str και endpoint_name τιμές, λαμβάνετε μια απάντηση CSV στη μορφή του outcome (0 ή 1), confidence (0-1).

Καθαρισμό

Για να βεβαιωθείτε ότι δεν θα επιβαρυνθείτε με χρεώσεις που σχετίζονται με το σεμινάριο μετά την ολοκλήρωση αυτού του σεμιναρίου, φροντίστε να τερματίσετε την εφαρμογή Data Wrangler (https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-shut-down.html), καθώς και όλα τα στιγμιότυπα σημειωματάριων που χρησιμοποιούνται για την εκτέλεση εργασιών συμπερασμάτων. Τα τελικά σημεία συμπερασμάτων που δημιουργούνται μέσω της ανάπτυξης του Auto Pilot θα πρέπει να διαγραφούν για να αποφευχθούν επιπλέον χρεώσεις.

Συμπέρασμα

Σε αυτήν την ανάρτηση, δείξαμε πώς να ενσωματώσετε την επεξεργασία των δεδομένων σας, με τη μηχανική και την κατασκευή μοντέλων χρησιμοποιώντας Data Wrangler και Autopilot. Βασιζόμενοι στο Μέρος 1 της σειράς, επισημάναμε πώς μπορείτε εύκολα να εκπαιδεύσετε, να συντονίσετε και να αναπτύξετε ένα μοντέλο σε ένα τελικό σημείο συμπερασμάτων σε πραγματικό χρόνο με τον Αυτόματο πιλότο απευθείας από τη διεπαφή χρήστη του Data Wrangler. Εκτός από την ευκολία που παρέχει η αυτόματη ανάπτυξη τελικού σημείου, δείξαμε πώς μπορείτε επίσης να αναπτύξετε με όλους τους μετασχηματισμούς χαρακτηριστικών Data Wrangler ως σειριακό αγωγό συμπερασμάτων SageMaker, παρέχοντας αυτόματη προεπεξεργασία των πρωτογενών δεδομένων, με την επαναχρησιμοποίηση των μετασχηματισμών χαρακτηριστικών Data Wrangler στο η ώρα του συμπεράσματος.

Λύσεις χαμηλού κώδικα και AutoML, όπως το Data Wrangler και το Autopilot, αφαιρούν την ανάγκη να έχετε βαθιά γνώση κωδικοποίησης για τη δημιουργία ισχυρών μοντέλων ML. Ξεκινήστε να χρησιμοποιείτε το Data Wrangler σήμερα για να βιώσετε πόσο εύκολο είναι να δημιουργήσετε μοντέλα ML χρησιμοποιώντας τον αυτόματο πιλότο.


Σχετικά με τους συγγραφείς

Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Τζέρεμι Κοέν είναι ένας αρχιτέκτονας λύσεων με AWS, όπου βοηθά τους πελάτες να δημιουργήσουν πρωτοποριακές λύσεις που βασίζονται στο cloud. Στον ελεύθερο χρόνο του, απολαμβάνει μικρούς περιπάτους στην παραλία, εξερευνά την περιοχή του κόλπου με την οικογένειά του, διορθώνει πράγματα γύρω από το σπίτι, σπάει τα πράγματα γύρω από το σπίτι και μπάρμπεκιου.

Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Πραντίπ Ρέντι είναι Ανώτερος Διευθυντής Προϊόντων στην ομάδα SageMaker Low/No Code ML, η οποία περιλαμβάνει SageMaker Autopilot, SageMaker Automatic Model Tuner. Εκτός δουλειάς, ο Pradeep του αρέσει να διαβάζει, να τρέχει και να βγαίνει με υπολογιστές μεγέθους παλάμης, όπως το raspberry pi και άλλες τεχνολογίες οικιακού αυτοματισμού.

Ενοποιημένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και ανάπτυξη με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot – Part 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Ο Δρ Τζον Χε είναι ανώτερος μηχανικός ανάπτυξης λογισμικού με την Amazon AI, όπου εστιάζει στη μηχανική μάθηση και στον κατανεμημένο υπολογισμό. Είναι κάτοχος διδακτορικού διπλώματος από το CMU.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS