Αυτόματος πιλότος Amazon SageMaker δημιουργεί αυτόματα, εκπαιδεύει και συντονίζει τα καλύτερα μοντέλα μηχανικής εκμάθησης (ML) με βάση τα δεδομένα σας, ενώ σας επιτρέπει να διατηρείτε τον πλήρη έλεγχο και την ορατότητα. Έχουμε ανακοινώσει πρόσφατα υποστήριξη δεδομένων χρονοσειρών στον αυτόματο πιλότο. Μπορείτε να χρησιμοποιήσετε τον Αυτόματο πιλότο για να αντιμετωπίσετε εργασίες παλινδρόμησης και ταξινόμησης σε δεδομένα χρονοσειρών ή δεδομένα ακολουθίας γενικά. Τα δεδομένα χρονοσειρών είναι ένας ειδικός τύπος δεδομένων ακολουθίας όπου τα σημεία δεδομένων συλλέγονται σε ζυγά χρονικά διαστήματα.
Η μη αυτόματη προετοιμασία των δεδομένων, η επιλογή του σωστού μοντέλου ML και η βελτιστοποίηση των παραμέτρων του είναι μια πολύπλοκη εργασία, ακόμη και για έναν έμπειρο επαγγελματία. Αν και υπάρχουν αυτοματοποιημένες προσεγγίσεις που μπορούν να βρουν τα καλύτερα μοντέλα και τις παραμέτρους τους, αυτές συνήθως δεν μπορούν να χειριστούν δεδομένα που προέρχονται ως αλληλουχίες, όπως κίνηση δικτύου, κατανάλωση ηλεκτρικής ενέργειας ή οικιακά έξοδα που καταγράφονται με την πάροδο του χρόνου. Επειδή αυτά τα δεδομένα έχουν τη μορφή παρατηρήσεων που λαμβάνονται σε διαφορετικά χρονικά σημεία, οι διαδοχικές παρατηρήσεις δεν μπορούν να θεωρηθούν ως ανεξάρτητες η μία από την άλλη και πρέπει να υποβληθούν σε επεξεργασία ως σύνολο. Μπορείτε να χρησιμοποιήσετε τον Αυτόματο πιλότο για ένα ευρύ φάσμα προβλημάτων που σχετίζονται με διαδοχικά δεδομένα. Για παράδειγμα, μπορείτε να ταξινομήσετε την κυκλοφορία δικτύου που καταγράφεται με την πάροδο του χρόνου για να εντοπίσετε κακόβουλες δραστηριότητες ή να προσδιορίσετε εάν τα άτομα πληρούν τις προϋποθέσεις για υποθήκη με βάση το πιστωτικό ιστορικό τους. Παρέχετε ένα σύνολο δεδομένων που περιέχει δεδομένα χρονοσειρών και ο Autopilot χειρίζεται τα υπόλοιπα, επεξεργάζεται τα διαδοχικά δεδομένα μέσω εξειδικευμένων μετασχηματισμών χαρακτηριστικών και βρίσκοντας το καλύτερο μοντέλο για λογαριασμό σας.
Ο αυτόματος πιλότος εξαλείφει τη βαριά ανύψωση των μοντέλων ML κατασκευής και σας βοηθά να δημιουργήσετε, να εκπαιδεύσετε και να συντονίσετε αυτόματα το καλύτερο μοντέλο ML με βάση τα δεδομένα σας. Το Autopilot εκτελεί αρκετούς αλγόριθμους στα δεδομένα σας και συντονίζει τις υπερπαραμέτρους τους σε μια πλήρως διαχειριζόμενη υπολογιστική υποδομή. Σε αυτήν την ανάρτηση, δείχνουμε πώς μπορείτε να χρησιμοποιήσετε Αυτόματος πιλότος για την επίλυση προβλημάτων ταξινόμησης και παλινδρόμησης σε δεδομένα χρονοσειρών. Για οδηγίες σχετικά με τη δημιουργία και την εκπαίδευση ενός μοντέλου Autopilot, βλ Πελάτης Churn Prediction με το Amazon SageMaker Autopilot.
Ταξινόμηση δεδομένων χρονοσειρών με χρήση αυτόματου πιλότου
Ως τρεχούμενο παράδειγμα, θεωρούμε ένα πρόβλημα πολλαπλών κλάσεων στη χρονοσειρά σύνολο δεδομένων UWaveGestureLibraryX, που περιέχει μετρήσεις ίσης απόστασης αισθητήρων επιταχυνσιόμετρου ενώ εκτελείται μία από τις οκτώ προκαθορισμένες χειρονομίες. Για απλότητα, λαμβάνουμε υπόψη μόνο τη διάσταση Χ του επιταχυνσιόμετρου. Το καθήκον είναι να δημιουργηθεί ένα μοντέλο ταξινόμησης για να αντιστοιχίσει τα δεδομένα χρονοσειρών από τις μετρήσεις του αισθητήρα στις προκαθορισμένες χειρονομίες. Το παρακάτω σχήμα δείχνει τις πρώτες σειρές του συνόλου δεδομένων σε μορφή CSV. Ολόκληρος ο πίνακας αποτελείται από 896 σειρές και δύο στήλες: η πρώτη στήλη είναι μια ετικέτα χειρονομίας και η δεύτερη στήλη είναι μια χρονική σειρά μετρήσεων αισθητήρων.
Μετατρέψτε τα δεδομένα στη σωστή μορφή με το Amazon SageMaker Data Wrangler
Εκτός από την αποδοχή αριθμητικών, κατηγορικών και τυπικών στηλών κειμένου, ο Αυτόματος πιλότος δέχεται τώρα και μια στήλη εισαγωγής ακολουθίας. Εάν τα δεδομένα χρονοσειρών σας δεν ακολουθούν αυτήν τη μορφή, μπορείτε εύκολα να τα μετατρέψετε Amazon SageMaker Data Wrangler. Το Data Wrangler μειώνει τον χρόνο που απαιτείται για τη συγκέντρωση και την προετοιμασία δεδομένων για ML από εβδομάδες σε λεπτά. Με το Data Wrangler, μπορείτε να απλοποιήσετε τη διαδικασία προετοιμασίας δεδομένων και τη μηχανική χαρακτηριστικών και να ολοκληρώσετε κάθε βήμα της ροής εργασιών προετοιμασίας δεδομένων, συμπεριλαμβανομένης της επιλογής δεδομένων, του καθαρισμού, της εξερεύνησης και της οπτικοποίησης από μια ενιαία οπτική διεπαφή. Για παράδειγμα, εξετάστε το ίδιο σύνολο δεδομένων αλλά σε διαφορετική μορφή εισαγωγής: κάθε κίνηση (καθορίζεται από το αναγνωριστικό) είναι μια ακολουθία μετρήσεων ίσης απόστασης του επιταχυνσιόμετρου. Όταν αποθηκεύεται κατακόρυφα, κάθε σειρά περιέχει μια χρονική σήμανση και μια τιμή. Το παρακάτω σχήμα συγκρίνει αυτά τα δεδομένα στην αρχική τους μορφή και σε μια μορφή ακολουθίας.
Για να μετατρέψετε αυτό το σύνολο δεδομένων στη μορφή που περιγράφηκε προηγουμένως χρησιμοποιώντας το Data Wrangler, φορτώστε το σύνολο δεδομένων από Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3). Στη συνέχεια χρησιμοποιήστε το χρονοσειρά Ομάδα με μετασχηματισμό, όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης και εξάγετε τα δεδομένα πίσω στο Amazon S3 σε μορφή CSV.
Όταν το σύνολο δεδομένων είναι στην καθορισμένη μορφή του, μπορείτε να προχωρήσετε με τον Αυτόματο πιλότο. Για να δείτε άλλους μετασχηματιστές χρονοσειρών του Data Wrangler, ανατρέξτε στο Προετοιμάστε δεδομένα χρονοσειρών με το Amazon SageMaker Data Wrangler.
Εκκινήστε μια εργασία AutoML
Όπως και με άλλους τύπους εισόδου που υποστηρίζονται από τον Αυτόματο πιλότο, κάθε σειρά του συνόλου δεδομένων είναι μια διαφορετική παρατήρηση και κάθε στήλη είναι ένα χαρακτηριστικό. Σε αυτό το παράδειγμα, έχουμε μια στήλη που περιέχει δεδομένα χρονοσειρών, αλλά μπορείτε να έχετε πολλές στήλες χρονοσειρών. Μπορείτε επίσης να έχετε πολλές στήλες με διαφορετικούς τύπους εισόδου, όπως χρονικές σειρές, κείμενο και αριθμητικές.
Προς την δημιουργήστε ένα πείραμα αυτόματου πιλότου, τοποθετήστε το σύνολο δεδομένων σε έναν κάδο S3 και δημιουργήστε ένα νέο πείραμα μέσα Στούντιο Amazon SageMaker. Όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης, πρέπει να καθορίσετε το όνομα του πειράματος, τη θέση S3 του συνόλου δεδομένων, τη θέση S3 για τα τεχνουργήματα εξόδου και το όνομα της στήλης για πρόβλεψη.
Ο αυτόματος πιλότος αναλύει τα δεδομένα, δημιουργεί γραμμές ML και εκτελεί προεπιλεγμένες 250 επαναλήψεις βελτιστοποίησης υπερπαραμέτρων σε αυτήν την εργασία ταξινόμησης. Όπως φαίνεται στον παρακάτω πίνακα κορυφαίων μοντέλων, η ακρίβεια Autopilot φτάνει τα 0.821 και μπορείτε να αναπτύξετε το καλύτερο μοντέλο με ένα μόνο κλικ.
Επιπλέον, ο Αυτόματος πιλότος δημιουργεί ένα έκθεση εξερεύνησης δεδομένων, όπου μπορείτε να οπτικοποιήσετε και να εξερευνήσετε τα δεδομένα σας.
Η διαφάνεια είναι θεμελιώδης για τον αυτόματο πιλότο. Μπορείτε να επιθεωρήσετε και να τροποποιήσετε τις δημιουργημένες σωληνώσεις ML μέσα στο σημειωματάριο υποψηφίου ορισμού. Το ακόλουθο στιγμιότυπο οθόνης δείχνει πώς ο Αυτόματος πιλότος συνιστά μια σειρά αγωγών, συνδυάζοντας τον μετασχηματιστή χρονικής σειράς TSFeatureExtractor
με διαφορετικούς αλγόριθμους ML, όπως δέντρα αποφάσεων με ενισχυμένη κλίση και γραμμικά μοντέλα. ο TSFeatureExtractor
εξάγει εκατοντάδες λειτουργίες χρονοσειρών για εσάς, οι οποίες στη συνέχεια τροφοδοτούνται στους κατάντη αλγόριθμους για να κάνει προβλέψεις. Για την πλήρη λίστα των χαρακτηριστικών χρονοσειρών, ανατρέξτε στο Επισκόπηση των εξαγόμενων δυνατοτήτων.
Συμπέρασμα
Σε αυτήν την ανάρτηση, δείξαμε πώς να χρησιμοποιείτε το SageMaker Autopilot για την επίλυση προβλημάτων ταξινόμησης χρονοσειρών και παλινδρόμησης με λίγα μόνο κλικ.
Για περισσότερες πληροφορίες σχετικά με τον αυτόματο πιλότο, βλ Αυτόματος πιλότος Amazon SageMaker. Για να εξερευνήσετε τις σχετικές δυνατότητες του SageMaker, βλ Amazon SageMaker Data Wrangler.
Σχετικά με τους Συγγραφείς
Νικήτα Ίβκιν είναι Εφαρμοσμένος Επιστήμονας, Amazon SageMaker Data Wrangler.
Αν Μίλμπερτ είναι μηχανικός ανάπτυξης λογισμικού που εργάζεται στο Amazon SageMaker Automatic Model Tuning.
Βαλέριο Περόνε είναι Διευθυντής Εφαρμοσμένης Επιστήμης που εργάζεται στο Amazon SageMaker Automatic Model Tuning and Autopilot.
Meghana Satish είναι μηχανικός ανάπτυξης λογισμικού που εργάζεται στο Amazon SageMaker Automatic Model Tuning.
Αλί Τακμπίρι είναι αρχιτέκτονας λύσεων ειδικός σε AI/ML και βοηθά τους πελάτες χρησιμοποιώντας τη Μηχανική Μάθηση να λύσουν τις επιχειρηματικές τους προκλήσεις στο AWS Cloud.
- Coinsmart. Το καλύτερο ανταλλακτήριο Bitcoin και Crypto στην Ευρώπη.
- Platoblockchain. Web3 Metaverse Intelligence. Ενισχύθηκε η γνώση. ΕΛΕΥΘΕΡΗ ΠΡΟΣΒΑΣΗ.
- CryptoHawk. Ραντάρ Altcoin. Δωρεάν δοκιμή.
- Πηγή: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-autopilot-now-supports-time-series-data/
- "
- 100
- Σχετικά
- αποκτήθηκαν
- δραστηριοτήτων
- αλγόριθμοι
- Επιτρέποντας
- Αν και
- Amazon
- ανακοίνωσε
- Αυτοματοποιημένη
- AWS
- ΚΑΛΎΤΕΡΟΣ
- Ενισχυμένος
- χτίζω
- Κτίριο
- Χτίζει
- επιχείρηση
- προκλήσεις
- ταξινόμηση
- Backup
- Στήλη
- συγκρότημα
- Υπολογίστε
- συνεχής
- κατανάλωση
- Περιέχει
- έλεγχος
- δημιουργία
- μονάδες
- Πελάτες
- ημερομηνία
- μοιρασιά
- παρατάσσω
- Ανάπτυξη
- διαφορετικές
- Διάσταση
- Όχι
- εύκολα
- ηλεκτρικής ενέργειας
- μηχανικός
- Μηχανική
- παράδειγμα
- έξοδα
- πείραμα
- εξερεύνηση
- Εκχυλίσματα
- Χαρακτηριστικό
- Χαρακτηριστικά
- Fed
- Εικόνα
- Όνομα
- ακολουθήστε
- Εξής
- μορφή
- μορφή
- πλήρη
- General
- Group
- βοηθά
- ιστορία
- νοικοκυριό
- Πως
- Πώς να
- HTTPS
- Εκατοντάδες
- προσδιορίσει
- Συμπεριλαμβανομένου
- πληροφορίες
- Υποδομή
- περιβάλλον λειτουργίας
- IT
- μάθηση
- Λίστα
- φορτίο
- τοποθεσία
- μηχανή
- μάθηση μηχανής
- διευθυντής
- χάρτη
- ML
- μοντέλο
- μοντέλα
- δίκτυο
- επισκεψιμότητα δικτύου
- σημειωματάριο
- βελτιστοποίηση
- ΑΛΛΑ
- πρόβλεψη
- Προβλέψεις
- Πρόβλημα
- προβλήματα
- διαδικασια μας
- παρέχουν
- σειρά
- συνιστά
- ΠΕΡΙΦΕΡΕΙΑ
- τρέξιμο
- Επιστήμη
- Επιστήμονας
- Σειρές
- Απλούς
- λογισμικό
- ανάπτυξη λογισμικού
- Λύσεις
- SOLVE
- ειδικευμένος
- χώρος στο δίσκο
- υποστηριζόνται!
- Υποστηρίζει
- εργασίες
- Μέσω
- ώρα
- κορυφή
- ΚΙΝΗΣΗ στους ΔΡΟΜΟΥΣ
- Εκπαίδευση
- τρένα
- χρήση
- αξία
- ορατότητα
- οραματισμός
- εντός
- εργαζόμενος
- X