Η προετοιμασία δεδομένων είναι ένα κρίσιμο βήμα σε κάθε έργο που βασίζεται σε δεδομένα και η ύπαρξη των κατάλληλων εργαλείων μπορεί να βελτιώσει σημαντικά τη λειτουργική αποτελεσματικότητα. Amazon SageMaker Data Wrangler μειώνει τον χρόνο που χρειάζεται για τη συγκέντρωση και την προετοιμασία δεδομένων πινάκων και εικόνας για μηχανική εκμάθηση (ML) από εβδομάδες σε λεπτά. Με το SageMaker Data Wrangler, μπορείτε να απλοποιήσετε τη διαδικασία προετοιμασίας δεδομένων και τη μηχανική χαρακτηριστικών και να ολοκληρώσετε κάθε βήμα της ροής εργασιών προετοιμασίας δεδομένων, συμπεριλαμβανομένης της επιλογής δεδομένων, του καθαρισμού, της εξερεύνησης και της οπτικοποίησης από μια ενιαία οπτική διεπαφή.
Σε αυτήν την ανάρτηση, εξερευνούμε τις πιο πρόσφατες δυνατότητες του SageMaker Data Wrangler που έχουν σχεδιαστεί ειδικά για τη βελτίωση της λειτουργικής εμπειρίας. Εμβαθύνουμε στην υποστήριξη του Απλή υπηρεσία αποθήκευσης (Amazon S3) δηλωτικό αρχεία, τεχνουργήματα συμπερασμάτων σε μια διαδραστική ροή δεδομένων και η απρόσκοπτη ενσωμάτωση με JSON (Σημειογραφία αντικειμένου JavaScript) μορφή για συμπέρασμα, τονίζοντας πώς αυτές οι βελτιώσεις καθιστούν την προετοιμασία δεδομένων ευκολότερη και πιο αποτελεσματική.
Παρουσίαση νέων χαρακτηριστικών
Σε αυτήν την ενότητα, συζητάμε τις νέες δυνατότητες του SageMaker Data Wrangler για βέλτιστη προετοιμασία δεδομένων.
Υποστήριξη αρχείου μανιφέστου S3 με το SageMaker Autopilot για συμπέρασμα ML
Το SageMaker Data Wrangler ενεργοποιεί α ενοποιημένη προετοιμασία δεδομένων και εκπαίδευση μοντέλων εμπειρία με Αυτόματος πιλότος Amazon SageMaker σε λίγα μόνο κλικ. Μπορείτε να χρησιμοποιήσετε το SageMaker Autopilot για αυτόματη εκπαίδευση, συντονισμό και ανάπτυξη μοντέλων στα δεδομένα που έχετε μετατρέψει στη ροή δεδομένων σας.
Αυτή η εμπειρία έχει πλέον απλοποιηθεί περαιτέρω με την υποστήριξη αρχείων μανιφέστου S3. Ένα αρχείο δήλωσης S3 είναι ένα αρχείο κειμένου που παραθέτει τα αντικείμενα (αρχεία) που είναι αποθηκευμένα σε έναν κάδο S3. Εάν το εξαγόμενο σύνολο δεδομένων σας στο SageMaker Data Wrangler είναι αρκετά μεγάλο και χωρίζεται σε αρχεία δεδομένων πολλαπλών τμημάτων στο Amazon S3, τώρα το SageMaker Data Wrangler θα δημιουργήσει αυτόματα ένα αρχείο δήλωσης στο S3 που αντιπροσωπεύει όλα αυτά τα αρχεία δεδομένων. Αυτό το αρχείο δήλωσης που δημιουργήθηκε μπορεί τώρα να χρησιμοποιηθεί με το SageMaker Autopilot UI στο SageMaker Data Wrangler για να συλλέξει όλα τα κατατμημένα δεδομένα για εκπαίδευση.
Πριν από την εκκίνηση αυτής της δυνατότητας, όταν χρησιμοποιείτε μοντέλα SageMaker Autopilot που έχουν εκπαιδευτεί σε προετοιμασμένα δεδομένα από το SageMaker Data Wrangler, μπορούσατε να επιλέξετε μόνο ένα αρχείο δεδομένων, το οποίο ενδέχεται να μην αντιπροσωπεύει ολόκληρο το σύνολο δεδομένων, ειδικά εάν το σύνολο δεδομένων είναι πολύ μεγάλο. Με αυτήν τη νέα εμπειρία αρχείου δήλωσης, δεν περιορίζεστε σε ένα υποσύνολο του συνόλου δεδομένων σας. Μπορείτε να δημιουργήσετε ένα μοντέλο ML με το SageMaker Autopilot που αντιπροσωπεύει όλα τα δεδομένα σας χρησιμοποιώντας το αρχείο δήλωσης και να το χρησιμοποιήσετε για την εξαγωγή συμπερασμάτων ML και την ανάπτυξη παραγωγής. Αυτή η δυνατότητα ενισχύει τη λειτουργική απόδοση απλοποιώντας τα μοντέλα εκπαίδευσης ML με το SageMaker Autopilot και απλοποιώντας τις ροές εργασίας επεξεργασίας δεδομένων.
Προστέθηκε υποστήριξη για τη ροή συμπερασμάτων σε δημιουργούμενα τεχνουργήματα
Οι πελάτες θέλουν να λάβουν τους μετασχηματισμούς δεδομένων που έχουν εφαρμόσει στα δεδομένα εκπαίδευσης μοντέλων τους, όπως κωδικοποίηση one-hot, PCA και να καταλογίσουν τιμές που λείπουν, και να εφαρμόσουν αυτούς τους μετασχηματισμούς δεδομένων σε συμπεράσματα σε πραγματικό χρόνο ή συμπεράσματα παρτίδας στην παραγωγή. Για να το κάνετε αυτό, πρέπει να έχετε ένα τεχνούργημα συμπερασμάτων SageMaker Data Wrangler, το οποίο καταναλώνεται από ένα μοντέλο SageMaker.
Προηγουμένως, τα τεχνουργήματα συμπερασμάτων μπορούσαν να δημιουργηθούν μόνο από τη διεπαφή χρήστη κατά την εξαγωγή σε εκπαίδευση αυτόματου πιλότου του SageMaker ή κατά την εξαγωγή ενός σημειωματάριου διοχέτευσης συμπερασμάτων. Αυτό δεν παρείχε ευελιξία εάν θέλατε να μεταφέρετε τις ροές δεδομένων του SageMaker Data Wrangler εκτός Στούντιο Amazon SageMaker περιβάλλον. Τώρα, μπορείτε να δημιουργήσετε ένα τεχνούργημα συμπερασμάτων για οποιοδήποτε συμβατό αρχείο ροής μέσω μιας εργασίας επεξεργασίας δεδομένων Wrangler του SageMaker. Αυτό δίνει τη δυνατότητα προγραμματισμού, από άκρο σε άκρο MLO με ροές SageMaker Data Wrangler για πρόσωπα MLOps πρώτου κώδικα, καθώς και μια διαισθητική διαδρομή χωρίς κώδικα για να λάβετε ένα τεχνούργημα συμπερασμάτων δημιουργώντας μια εργασία από τη διεπαφή χρήστη.
Βελτιστοποίηση της προετοιμασίας δεδομένων
Το JSON έχει γίνει μια ευρέως διαδεδομένη μορφή για την ανταλλαγή δεδομένων στα σύγχρονα οικοσυστήματα δεδομένων. Η ενσωμάτωση του SageMaker Data Wrangler με τη μορφή JSON σάς επιτρέπει να χειρίζεστε απρόσκοπτα τα δεδομένα JSON για μετασχηματισμό και καθαρισμό. Παρέχοντας εγγενή υποστήριξη για το JSON, το SageMaker Data Wrangler απλοποιεί τη διαδικασία εργασίας με δομημένα και ημι-δομημένα δεδομένα, επιτρέποντάς σας να εξάγετε πολύτιμες πληροφορίες και να προετοιμάζετε δεδομένα αποτελεσματικά. Το SageMaker Data Wrangler υποστηρίζει πλέον τη μορφή JSON για ανάπτυξη συμπερασμάτων κατά παρτίδες και σε πραγματικό χρόνο.
Επισκόπηση λύσεων
Για την περίπτωση χρήσης μας, χρησιμοποιούμε το δείγμα Σύνολο κριτικών πελατών της Amazon για να δείξετε πώς το SageMaker Data Wrangler μπορεί να απλοποιήσει την επιχειρησιακή προσπάθεια για την κατασκευή ενός νέου μοντέλου ML χρησιμοποιώντας το SageMaker Autopilot. Το σύνολο δεδομένων κριτικών πελατών της Amazon περιέχει κριτικές προϊόντων και μεταδεδομένα από την Amazon, συμπεριλαμβανομένων 142.8 εκατομμυρίων κριτικών από τον Μάιο του 1996 έως τον Ιούλιο του 2014.
Σε υψηλό επίπεδο, χρησιμοποιούμε το SageMaker Data Wrangler για να διαχειριστούμε αυτό το μεγάλο σύνολο δεδομένων και να εκτελέσουμε τις ακόλουθες ενέργειες:
- Αναπτύξτε ένα μοντέλο ML στο SageMaker Autopilot χρησιμοποιώντας όλο το σύνολο δεδομένων, όχι μόνο ένα δείγμα.
- Δημιουργήστε μια διοχέτευση συμπερασμάτων σε πραγματικό χρόνο με το τεχνούργημα συμπερασμάτων που δημιουργείται από το SageMaker Data Wrangler και χρησιμοποιήστε τη μορφοποίηση JSON για είσοδο και έξοδο.
Υποστήριξη αρχείου μανιφέστου S3 με το SageMaker Autopilot
Όταν δημιουργείτε ένα πείραμα αυτόματου πιλότου SageMaker χρησιμοποιώντας το SageMaker Data Wrangler, προηγουμένως μπορούσατε να καθορίσετε μόνο ένα αρχείο CSV ή Parquet. Τώρα μπορείτε επίσης να χρησιμοποιήσετε ένα αρχείο μανιφέστου S3, που σας επιτρέπει να χρησιμοποιείτε μεγάλες ποσότητες δεδομένων για πειράματα SageMaker Autopilot. Το SageMaker Data Wrangler θα χωρίσει αυτόματα τα αρχεία δεδομένων εισόδου σε πολλά μικρότερα αρχεία και θα δημιουργήσει ένα μανιφέστο που μπορεί να χρησιμοποιηθεί σε ένα πείραμα αυτόματου πιλότου SageMaker για να αντλήσει όλα τα δεδομένα από τη διαδραστική περίοδο λειτουργίας, όχι μόνο ένα μικρό δείγμα.
Ολοκληρώστε τα παρακάτω βήματα:
- Εισαγάγετε τα δεδομένα αξιολόγησης πελατών της Amazon από ένα αρχείο CSV στο SageMaker Data Wrangler. Φροντίστε να απενεργοποιήσετε τη δειγματοληψία κατά την εισαγωγή των δεδομένων.
- Καθορίστε τους μετασχηματισμούς που κανονικοποιούν τα δεδομένα. Για αυτό το παράδειγμα, αφαιρέστε σύμβολα και μετατρέψτε τα πάντα σε πεζά χρησιμοποιώντας τους ενσωματωμένους μετασχηματισμούς του SageMaker Data Wrangler.
- Επιλέξτε Μοντέλο αμαξοστοιχίας για να ξεκινήσετε την προπόνηση.
Για να εκπαιδεύσει ένα μοντέλο με το SageMaker Autopilot, το SageMaker εξάγει αυτόματα δεδομένα σε έναν κάδο S3. Για μεγάλα σύνολα δεδομένων όπως αυτό, θα χωρίσει αυτόματα το αρχείο σε μικρότερα αρχεία και θα δημιουργήσει ένα μανιφέστο που περιλαμβάνει τη θέση των μικρότερων αρχείων.
- Πρώτα, επιλέξτε τα δεδομένα εισόδου σας.
Νωρίτερα, το SageMaker Data Wrangler δεν είχε την επιλογή να δημιουργήσει ένα αρχείο δήλωσης για χρήση με το SageMaker Autopilot. Σήμερα, με την απελευθέρωση της υποστήριξης για το αρχείο δήλωσης, το SageMaker Data Wrangler θα εξαγάγει αυτόματα ένα αρχείο δήλωσης στο Amazon S3, θα προγεμίσει τη θέση S3 της εκπαίδευσης SageMaker Autopilot με τη θέση του αρχείου δήλωσης S3 και θα αλλάξει την επιλογή αρχείου δήλωσης σε Ναι. Δεν απαιτείται εργασία για τη δημιουργία ή τη χρήση του αρχείου δήλωσης.
- Διαμορφώστε το πείραμά σας επιλέγοντας τον στόχο για πρόβλεψη του μοντέλου.
- Στη συνέχεια, επιλέξτε μια μέθοδο εκπαίδευσης. Σε αυτή την περίπτωση επιλέγουμε AUTO και αφήστε το SageMaker Autopilot να αποφασίσει την καλύτερη μέθοδο εκπαίδευσης με βάση το μέγεθος δεδομένων.
- Καθορίστε τις ρυθμίσεις ανάπτυξης.
- Τέλος, ελέγξτε τη διαμόρφωση της εργασίας και υποβάλετε το πείραμα SageMaker Autopilot για εκπαίδευση. Όταν το SageMaker Autopilot ολοκληρώσει το πείραμα, μπορείτε να δείτε τα αποτελέσματα της εκπαίδευσης και να εξερευνήσετε το καλύτερο μοντέλο.
Χάρη στην υποστήριξη για αρχεία μανιφέστου, μπορείτε να χρησιμοποιήσετε ολόκληρο το σύνολο δεδομένων σας για το πείραμα αυτόματου πιλότου SageMaker, όχι απλώς ένα υποσύνολο των δεδομένων σας.
Για περισσότερες πληροφορίες σχετικά με τη χρήση του SageMaker Autopilot με το SageMaker Data Wrangler, βλ Ενοποιημένη προετοιμασία δεδομένων και εκπαίδευση μοντέλων με το Amazon SageMaker Data Wrangler και το Amazon SageMaker Autopilot.
Δημιουργήστε τεχνουργήματα συμπερασμάτων από εργασίες επεξεργασίας SageMaker
Τώρα, ας δούμε πώς μπορούμε να δημιουργήσουμε τεχνουργήματα συμπερασμάτων μέσω τόσο του SageMaker Data Wrangler UI όσο και του SageMaker Data Wrangler notebook.
Διεπαφή χρήστη SageMaker Data Wrangler
Για την περίπτωση χρήσης μας, θέλουμε να επεξεργαστούμε τα δεδομένα μας μέσω του UI και στη συνέχεια να χρησιμοποιήσουμε τα δεδομένα που προκύπτουν για να εκπαιδεύσουμε και να αναπτύξουμε ένα μοντέλο μέσω της κονσόλας SageMaker. Ολοκληρώστε τα παρακάτω βήματα:
- Ανοίξτε τη ροή δεδομένων που δημιουργήσατε στην προηγούμενη ενότητα.
- Επιλέξτε το σύμβολο συν δίπλα στον τελευταίο μετασχηματισμό, επιλέξτε Προσθήκη προορισμού, και επιλέξτε Amazon S3. Εδώ θα αποθηκεύονται τα επεξεργασμένα δεδομένα.
- Επιλέξτε Δημιουργήστε εργασία.
- Αγορά Δημιουργήστε τεχνουργήματα συμπερασμάτων στην ενότητα Παράμετροι συμπερασμάτων για να δημιουργήσετε ένα τεχνούργημα συμπερασμάτων.
- Για το όνομα του τεχνουργήματος Inference, εισαγάγετε το όνομα του τεχνουργήματος συμπερασμάτων σας (με .tar.gz ως επέκταση αρχείου).
- Για τον κόμβο εξόδου συμπερασμάτων, εισαγάγετε τον κόμβο προορισμού που αντιστοιχεί στους μετασχηματισμούς που εφαρμόζονται στα δεδομένα εκπαίδευσης.
- Επιλέξτε Διαμόρφωση εργασίας.
- Κάτω από Διαμόρφωση εργασίας, εισαγάγετε μια διαδρομή για Θέση αρχείου ροής S3. Κάλεσε έναν φάκελο
data_wrangler_flows
θα δημιουργηθεί σε αυτήν τη θέση και το τεχνούργημα συμπερασμάτων θα μεταφορτωθεί σε αυτόν τον φάκελο. Για να αλλάξετε τη θέση μεταφόρτωσης, ορίστε μια διαφορετική τοποθεσία S3. - Αφήστε τις προεπιλογές για όλες τις άλλες επιλογές και επιλέξτε Δημιουργία για τη δημιουργία της εργασίας επεξεργασίας.
Η εργασία επεξεργασίας θα δημιουργήσει έναtarball (.tar.gz)
που περιέχει ένα τροποποιημένο αρχείο ροής δεδομένων με μια πρόσφατα προστιθέμενη ενότητα συμπερασμάτων που σας επιτρέπει να το χρησιμοποιήσετε για εξαγωγή συμπερασμάτων. Χρειάζεστε το ομοιόμορφο αναγνωριστικό πόρου S3 (URI) του τεχνουργήματος συμπερασμάτων για να παρέχετε το τεχνούργημα σε ένα μοντέλο SageMaker κατά την ανάπτυξη της λύσης συμπερασμάτων σας. Το URI θα είναι στη μορφή{Flow file S3 location}/data_wrangler_flows/{inference artifact name}.tar.gz
. - Εάν δεν σημειώσατε αυτές τις τιμές νωρίτερα, μπορείτε να επιλέξετε τον σύνδεσμο προς την εργασία επεξεργασίας για να βρείτε τις σχετικές λεπτομέρειες. Στο παράδειγμά μας, το URI είναι
s3://sagemaker-us-east-1-43257985977/data_wrangler_flows/example-2023-05-30T12-20-18.tar.gz.
- Αντιγράψτε την τιμή του Επεξεργασία εικόνας; Χρειαζόμαστε αυτό το URI κατά τη δημιουργία του μοντέλου μας, επίσης.
- Μπορούμε τώρα να χρησιμοποιήσουμε αυτό το URI για να δημιουργήσουμε ένα μοντέλο SageMaker στην κονσόλα SageMaker, το οποίο μπορούμε αργότερα να αναπτύξουμε σε μια εργασία τερματικού ή ομαδικού μετασχηματισμού.
- Κάτω από Ρυθμίσεις μοντέλου¸ Εισαγάγετε ένα όνομα μοντέλου και καθορίστε τον ρόλο σας στο IAM.
- Για Επιλογές εισαγωγής κοντέινερ, Επιλέξτε Παρέχετε τεχνουργήματα μοντέλων και συμπερασματική τοποθεσία εικόνας.
- Για Θέση εικόνας κώδικα συμπερασμάτων, εισαγάγετε το URI της εικόνας επεξεργασίας.
- Για Θέση μοντέλων αντικειμένων, εισαγάγετε το URI του τεχνουργήματος συμπερασμάτων.
- Επιπλέον, εάν τα δεδομένα σας έχουν μια στήλη στόχο που θα προβλεφθεί από ένα εκπαιδευμένο μοντέλο ML, καθορίστε το όνομα αυτής της στήλης στο Μεταβλητές περιβάλλοντος, με
INFERENCE_TARGET_COLUMN_NAME
as Κλειδί και το όνομα της στήλης ως αξία. - Ολοκληρώστε τη δημιουργία του μοντέλου σας επιλέγοντας Δημιουργήστε μοντέλο.
Τώρα έχουμε ένα μοντέλο που μπορούμε να αναπτύξουμε σε μια εργασία τερματικού ή ομαδικού μετασχηματισμού.
Σημειωματάρια SageMaker Data Wrangler
Για μια προσέγγιση πρώτου κώδικα για τη δημιουργία του τεχνουργήματος συμπερασμάτων από μια εργασία επεξεργασίας, μπορούμε να βρούμε το παράδειγμα κώδικα επιλέγοντας Εξαγωγή στο στο μενού του κόμβου και επιλέγοντας ένα από τα δύο Amazon S3, Αγωγοί SageMaker, ή SageMaker Inference Pipeline. Εμείς διαλέγουμε SageMaker Inference Pipeline σε αυτό το παράδειγμα.
Σε αυτό το σημειωματάριο, υπάρχει μια ενότητα με τίτλο Δημιουργία επεξεργαστή (αυτό είναι πανομοιότυπο στο σημειωματάριο SageMaker Pipelines, αλλά στο σημειωματάριο Amazon S3, ο ισοδύναμος κωδικός θα βρίσκεται κάτω από το Διαμορφώσεις εργασιών Ενότητα). Στο κάτω μέρος αυτής της ενότητας υπάρχει μια διαμόρφωση για το τεχνούργημα συμπερασμάτων μας που ονομάζεται inference_params
. Περιέχει τις ίδιες πληροφορίες που είδαμε στη διεπαφή χρήστη, δηλαδή το όνομα του τεχνουργήματος συμπερασμάτων και τον κόμβο εξόδου συμπερασμάτων. Αυτές οι τιμές θα συμπληρωθούν εκ των προτέρων, αλλά μπορούν να τροποποιηθούν. Υπάρχει επιπλέον μια παράμετρος που ονομάζεται use_inference_params
, το οποίο πρέπει να ρυθμιστεί σε True
για να χρησιμοποιήσετε αυτήν τη διαμόρφωση στην εργασία επεξεργασίας.
Πιο κάτω υπάρχει μια ενότητα με τίτλο Καθορίστε τα βήματα του αγωγού, Όπου η inference_params
Η διαμόρφωση προσαρτάται σε μια λίστα ορισμάτων εργασίας και μεταβιβάζεται στον ορισμό για ένα βήμα επεξεργασίας δεδομένων Wrangler του SageMaker. Στο σημειωματάριο Amazon S3, job_arguments
ορίζεται αμέσως μετά την Διαμορφώσεις εργασιών τμήμα.
Με αυτές τις απλές διαμορφώσεις, η εργασία επεξεργασίας που δημιουργείται από αυτό το σημειωματάριο θα δημιουργήσει ένα τεχνούργημα συμπερασμάτων στην ίδια θέση S3 με το αρχείο ροής μας (που ορίστηκε νωρίτερα στο σημειωματάριό μας). Μπορούμε να προσδιορίσουμε μέσω προγραμματισμού αυτήν τη θέση S3 και να χρησιμοποιήσουμε αυτό το τεχνούργημα για να δημιουργήσουμε ένα μοντέλο SageMaker χρησιμοποιώντας το SDK SageMaker Python, το οποίο παρουσιάζεται στο σημειωματάριο SageMaker Inference Pipeline.
Η ίδια προσέγγιση μπορεί να εφαρμοστεί σε οποιονδήποτε κώδικα Python που δημιουργεί μια εργασία επεξεργασίας δεδομένων του SageMaker Data Wrangler.
Υποστήριξη μορφής αρχείου JSON για είσοδο και έξοδο κατά την εξαγωγή συμπερασμάτων
Είναι αρκετά συνηθισμένο για ιστότοπους και εφαρμογές να χρησιμοποιούν το JSON ως αίτημα/απόκριση για API, έτσι ώστε οι πληροφορίες να είναι εύκολο να αναλυθούν από διαφορετικές γλώσσες προγραμματισμού.
Προηγουμένως, αφού είχατε ένα εκπαιδευμένο μοντέλο, μπορούσατε να αλληλεπιδράσετε μαζί του μόνο μέσω CSV ως μορφή εισόδου σε μια διοχέτευση συμπερασμάτων SageMaker Data Wrangler. Σήμερα, μπορείτε να χρησιμοποιήσετε το JSON ως μορφή εισόδου και εξόδου, παρέχοντας μεγαλύτερη ευελιξία κατά την αλληλεπίδραση με δοχεία συμπερασμάτων SageMaker Data Wrangler.
Για να ξεκινήσετε με τη χρήση του JSON για είσοδο και έξοδο στο σημειωματάριο διοχέτευσης συμπερασμάτων, ολοκληρώστε τα παρακάτω βήματα:
- Ορίστε ένα ωφέλιμο φορτίο.
Για κάθε ωφέλιμο φορτίο, το μοντέλο αναμένει ένα κλειδί με όνομα στιγμιότυπα. Η τιμή είναι μια λίστα αντικειμένων, καθένα από τα οποία είναι το δικό του σημείο δεδομένων. Τα αντικείμενα απαιτούν ένα κλειδί που ονομάζεται χαρακτηριστικά και οι τιμές πρέπει να είναι τα χαρακτηριστικά ενός μόνο σημείου δεδομένων που πρόκειται να υποβληθούν στο μοντέλο. Μπορούν να υποβληθούν πολλαπλά σημεία δεδομένων σε ένα μόνο αίτημα, μέχρι συνολικού μεγέθους 6 MB ανά αίτημα.
Δείτε τον ακόλουθο κώδικα:
- Καθορίστε το
ContentType
asapplication/json
. - Παρέχετε δεδομένα στο μοντέλο και λαμβάνετε συμπεράσματα σε μορφή JSON.
Βλέπω Κοινές Μορφές Δεδομένων για Συμπεράσματα για δείγματα εισόδου και εξόδου JSON.
εκκαθάριση
Όταν ολοκληρώσετε τη χρήση του SageMaker Data Wrangler, συνιστούμε να τερματίσετε τη λειτουργία του στιγμιότυπου στο οποίο εκτελείται για να αποφύγετε πρόσθετες χρεώσεις. Για οδηγίες σχετικά με τον τερματισμό της εφαρμογής SageMaker Data Wrangler και της σχετικής παρουσίας, δείτε Τερματίστε το Data Wrangler.
Συμπέρασμα
Οι νέες δυνατότητες του SageMaker Data Wrangler, συμπεριλαμβανομένης της υποστήριξης για αρχεία μανιφέστου S3, των δυνατοτήτων συμπερασμάτων και της ενσωμάτωσης μορφής JSON, μεταμορφώνουν τη λειτουργική εμπειρία της προετοιμασίας δεδομένων. Αυτές οι βελτιώσεις απλοποιούν την εισαγωγή δεδομένων, αυτοματοποιούν τους μετασχηματισμούς δεδομένων και απλοποιούν την εργασία με δεδομένα JSON. Με αυτές τις δυνατότητες, μπορείτε να βελτιώσετε τη λειτουργική σας απόδοση, να μειώσετε τη μη αυτόματη προσπάθεια και να εξάγετε πολύτιμες πληροφορίες από τα δεδομένα σας με ευκολία. Αγκαλιάστε τη δύναμη των νέων δυνατοτήτων του SageMaker Data Wrangler και ξεκλειδώστε πλήρως τις δυνατότητες των ροών εργασιών προετοιμασίας δεδομένων σας.
Για να ξεκινήσετε με το SageMaker Data Wrangler, ανατρέξτε στις πιο πρόσφατες πληροφορίες για το Σελίδα προϊόντος SageMaker Data Wrangler.
Σχετικά με τους συγγραφείς
Munish Dabra είναι κύριος αρχιτέκτονας λύσεων στο Amazon Web Services (AWS). Οι τρέχοντες τομείς εστίασής του είναι η AI/ML και η Παρατηρησιμότητα. Έχει ισχυρό υπόβαθρο στο σχεδιασμό και την κατασκευή κλιμακούμενων κατανεμημένων συστημάτων. Του αρέσει να βοηθά τους πελάτες να καινοτομούν και να μεταμορφώνουν την επιχείρησή τους στο AWS. LinkedIn: /mdabra
Πάτρικ Λιν είναι Μηχανικός Ανάπτυξης Λογισμικού με το Amazon SageMaker Data Wrangler. Δεσμεύεται να κάνει το Amazon SageMaker Data Wrangler το νούμερο ένα εργαλείο προετοιμασίας δεδομένων για παραγωγικές ροές εργασίας ML. Εκτός δουλειάς, μπορείτε να τον βρείτε να διαβάζει, να ακούει μουσική, να συνομιλεί με φίλους και να υπηρετεί στην εκκλησία του.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Αυτοκίνητο / EVs, Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- BlockOffsets. Εκσυγχρονισμός της περιβαλλοντικής αντιστάθμισης ιδιοκτησίας. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/optimize-data-preparation-with-new-features-in-aws-sagemaker-data-wrangler/
- :έχει
- :είναι
- :δεν
- :που
- $UP
- 100
- 1996
- 2014
- 7
- 8
- 9
- a
- ενεργειών
- προστιθέμενη
- Πρόσθετος
- Επιπλέον
- θετός
- Μετά το
- AI / ML
- Όλα
- Επιτρέποντας
- επιτρέπει
- Επίσης
- Amazon
- Amazon Sage Maker
- Αυτόματος πιλότος Amazon SageMaker
- Amazon SageMaker Data Wrangler
- Amazon υπηρεσίες Web
- Amazon Web Services (AWS)
- Ποσά
- an
- και
- κάθε
- APIs
- app
- εφαρμογές
- εφαρμοσμένος
- Εφαρμογή
- πλησιάζω
- ΕΙΝΑΙ
- περιοχές
- επιχειρήματα
- AS
- συσχετισμένη
- At
- αυτοματοποίηση
- αυτομάτως
- αποφύγετε
- AWS
- φόντο
- βασίζονται
- BE
- γίνονται
- είναι
- ΚΑΛΎΤΕΡΟΣ
- Μεγάλος
- και οι δύο
- Κάτω μέρος
- Διακοπή
- χτίζω
- Κτίριο
- ενσωματωμένο
- επιχείρηση
- αλλά
- by
- που ονομάζεται
- CAN
- δυνατότητες
- περίπτωση
- αλλαγή
- φορτία
- έλεγχος
- Επιλέξτε
- επιλέγοντας
- εκκλησία
- Καθάρισμα
- κωδικός
- Στήλη
- δεσμεύεται
- Κοινός
- σύμφωνος
- πλήρης
- Ολοκληρώνει
- διαμόρφωση
- πρόξενος
- καταναλώνεται
- Εμπορευματοκιβώτια
- Περιέχει
- συνομιλίες
- Αντίστοιχος
- θα μπορούσε να
- δημιουργία
- δημιουργήθηκε
- δημιουργεί
- δημιουργία
- κρίσιμης
- Ρεύμα
- πελάτης
- Πελάτες
- ημερομηνία
- Ανταλλαγή δεδομένων
- σημεία δεδομένων
- Προετοιμασία δεδομένων
- επεξεργασία δεδομένων
- βασίζονται σε δεδομένα
- σύνολα δεδομένων
- ημέρα
- αποφασίζει
- προεπιλογές
- ορίζεται
- ορισμός
- σκάβω
- κατέδειξε
- παρατάσσω
- ανάπτυξη
- ανάπτυξη
- σχεδιασμένα
- σχέδιο
- προορισμός
- καθέκαστα
- Προσδιορίστε
- Ανάπτυξη
- διαφορετικές
- συζητήσουν
- διανέμονται
- κατανεμημένα συστήματα
- do
- κάτω
- κατά την διάρκεια
- κάθε
- Νωρίτερα
- ευκολία
- ευκολότερη
- εύκολος
- οικοσυστήματα
- αποδοτικότητα
- αποτελεσματικός
- αποτελεσματικά
- προσπάθεια
- είτε
- αγκαλιάζω
- δίνει τη δυνατότητα
- ενεργοποίηση
- από άκρη σε άκρη
- Τελικό σημείο
- μηχανικός
- Μηχανική
- ενίσχυση
- βελτιώσεις
- Ενισχύει
- εισάγετε
- Ολόκληρος
- Περιβάλλον
- Ισοδύναμος
- ειδικά
- ΠΑΝΤΑ
- Κάθε
- κάθε μέρα
- πάντα
- παράδειγμα
- παραδείγματα
- ανταλλαγή
- αναμένουν
- εμπειρία
- πείραμα
- πειράματα
- εξερεύνηση
- διερευνήσει
- εξαγωγή
- εξαγωγές
- επέκταση
- εκχύλισμα
- Χαρακτηριστικό
- Χαρακτηριστικά
- λίγοι
- Αρχεία
- Αρχεία
- Εύρεση
- Ευελιξία
- ροή
- Ροές
- Συγκέντρωση
- ακολουθήστε
- Εξής
- Για
- μορφή
- μορφή
- φίλους
- από
- πλήρη
- περαιτέρω
- παράγουν
- παράγεται
- παίρνω
- σε μεγάλο βαθμό
- είχε
- λαβή
- Έχω
- που έχει
- he
- βοήθεια
- Ψηλά
- επισήμανση
- αυτόν
- του
- Πως
- Πώς να
- HTML
- HTTPS
- i
- identiques
- αναγνωριστικό
- if
- εικόνα
- αμέσως
- εισαγωγή
- εισαγωγή
- βελτίωση
- in
- περιλαμβάνει
- Συμπεριλαμβανομένου
- πληροφορίες
- νεωτερίζω
- εισαγωγή
- ιδέες
- παράδειγμα
- οδηγίες
- ολοκλήρωση
- προορίζονται
- αλληλεπιδρούν
- αλληλεπιδρώντας
- διαδραστικό
- περιβάλλον λειτουργίας
- σε
- διαισθητική
- IT
- ΤΟΥ
- το JavaScript
- Δουλειά
- jpg
- json
- Ιούλιος
- μόλις
- Κλειδί
- Γλώσσες
- large
- Επίθετο
- αργότερα
- αργότερο
- ξεκινήσει
- μάθηση
- ας
- Επίπεδο
- Μου αρέσει
- Περιωρισμένος
- LINK
- Λιστα
- Ακούγοντας
- Λίστες
- τοποθεσία
- ματιά
- μηχανή
- μάθηση μηχανής
- κάνω
- Κατασκευή
- διαχείριση
- Ταχύτητες
- Ενδέχεται..
- Μενού
- Μεταδεδομένα
- μέθοδος
- ενδέχεται να
- εκατομμύριο
- Λεπτ.
- Λείπει
- ML
- MLOps
- μοντέλο
- μοντέλα
- ΜΟΝΤΕΡΝΑ
- τροποποιημένο
- περισσότερο
- πιο αποτελεσματικό
- πολλαπλούς
- Μουσική
- πρέπει
- όνομα
- Ονομάστηκε
- και συγκεκριμένα
- ντόπιος
- απαραίτητος
- Ανάγκη
- ανάγκες
- Νέα
- Νέες δυνατότητες
- πρόσφατα
- επόμενη
- Όχι.
- κόμβος
- σημειωματάριο
- τώρα
- αριθμός
- αντικείμενο
- αντικειμένων
- of
- on
- ONE
- αποκλειστικά
- επιχειρήσεων
- βέλτιστη
- Βελτιστοποίηση
- Επιλογή
- Επιλογές
- or
- ΑΛΛΑ
- δικός μας
- έξω
- παραγωγή
- εκτός
- δική
- παράμετρος
- παράμετροι
- πέρασε
- μονοπάτι
- για
- Εκτελέστε
- επιλέξτε
- αγωγού
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- συν
- Σημείο
- σημεία
- Θέση
- δυναμικού
- δύναμη
- προβλέψει
- προβλεπόμενη
- προετοιμασία
- Προετοιμάστε
- έτοιμος
- αρκετά
- προηγουμένως
- Κύριος
- διαδικασια μας
- Επεξεργασμένο
- μεταποίηση
- Προϊόν
- Κριτικές Προϊόντων
- παραγωγή
- προγραμματικός
- Προγραμματισμός
- γλώσσες προγραμματισμού
- σχέδιο
- παρέχουν
- χορήγηση
- Python
- Ανάγνωση
- σε πραγματικό χρόνο
- λαμβάνω
- συνιστώ
- μείωση
- μειώνει
- απελευθερώνουν
- αφαιρέστε
- εκπροσωπώ
- εκπροσωπούν
- ζητήσει
- απαιτούν
- πόρος
- με αποτέλεσμα
- Αποτελέσματα
- ανασκόπηση
- Κριτικές
- δεξιά
- Ρόλος
- τρέχει
- s
- σοφός
- Συμπεράσματα SageMaker
- Αγωγοί SageMaker
- ίδιο
- πριόνι
- επεκτάσιμη
- αδιάλειπτη
- άψογα
- Τμήμα
- δείτε
- επιλογή
- επιλογή
- Υπηρεσίες
- εξυπηρετούν
- Συνεδρίαση
- σειρά
- ρυθμίσεις
- διάφοροι
- θα πρέπει να
- δείχνουν
- τερματίστε
- υπογράψουν
- Απλούς
- απλοποιημένη
- απλοποίηση
- απλουστεύοντας
- ενιαίας
- Μέγεθος
- small
- μικρότερος
- So
- λογισμικό
- ανάπτυξη λογισμικού
- λύση
- Λύσεις
- ειδικά
- διαίρεση
- Εκκίνηση
- ξεκίνησε
- Βήμα
- Βήματα
- χώρος στο δίσκο
- αποθηκεύονται
- εξορθολογισμό
- εξορθολογισμός
- ισχυρός
- δομημένος
- υποβάλουν
- υποβάλλονται
- τέτοιος
- υποστήριξη
- Υποστηρίζει
- βέβαιος
- συστήματα
- Πάρτε
- παίρνει
- στόχος
- ότι
- Η
- οι πληροφορίες
- τους
- τότε
- Εκεί.
- Αυτοί
- αυτό
- εκείνοι
- Μέσω
- ώρα
- με τίτλο
- προς την
- σήμερα
- πολύ
- εργαλείο
- εργαλεία
- Σύνολο
- Τρένο
- εκπαιδευμένο
- Εκπαίδευση
- Μεταμορφώστε
- Μεταμόρφωση
- μετασχηματισμούς
- μετασχηματίζεται
- μετασχηματισμών
- Δυο φορές
- ui
- υπό
- ξεκλειδώσετε
- Φορτώθηκε
- χρήση
- περίπτωση χρήσης
- μεταχειρισμένος
- χρησιμοποιώντας
- Πολύτιμος
- αξία
- Αξίες
- πολύ
- μέσω
- Δες
- οραματισμός
- θέλω
- ήθελε
- we
- ιστός
- διαδικτυακές υπηρεσίες
- ιστοσελίδες
- Εβδ.
- ΛΟΙΠΌΝ
- πότε
- Ποιό
- ευρέως
- θα
- με
- Εργασία
- ροής εργασίας
- ροές εργασίας
- εργαζόμενος
- Εσείς
- Σας
- zephyrnet