Εύκολη και ακριβής πρόβλεψη με το AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Εύκολη και ακριβής πρόβλεψη με το AutoGluon-TimeSeries

Το AutoGluon-TimeSeries είναι η πιο πρόσφατη προσθήκη στο AutoGluon, που σας βοηθά να δημιουργήσετε εύκολα ισχυρά μοντέλα πρόβλεψης χρονοσειρών με μόλις τρεις γραμμές κώδικα.

Η πρόβλεψη χρονοσειρών είναι μια κοινή εργασία σε ένα ευρύ φάσμα βιομηχανιών καθώς και σε επιστημονικούς τομείς. Η πρόσβαση σε αξιόπιστες προβλέψεις για την προσφορά, τη ζήτηση ή τη χωρητικότητα είναι ζωτικής σημασίας για τον προγραμματισμό των επιχειρήσεων. Ωστόσο, η πρόβλεψη χρονοσειρών είναι ένα δύσκολο πρόβλημα, ειδικά όταν υπάρχουν διαθέσιμες χιλιάδες πιθανές σχετικές χρονοσειρές, όπως πωλήσεις σε έναν μεγάλο κατάλογο στο ηλεκτρονικό εμπόριο ή χωρητικότητα σε εκατοντάδες λειτουργικούς ιστότοπους.

Οι απλές στατιστικές μέθοδοι πρόβλεψης ή οι μέθοδοι πρόβλεψης που βασίζονται σε κρίσεις είναι συχνά ήδη ισχυρές βασικές γραμμές που είναι δύσκολο να βελτιωθούν με τις νέες μεθόδους μηχανικής μάθησης (ML). Επιπλέον, οι εφαρμογές των πρόσφατων προόδων στην ML στην πρόβλεψη ποικίλλουν, με λίγες μεθόδους όπως π.χ Βαθεαρ [1] ή Temporal Fusion Transformers [2] που εμφανίζονται ως δημοφιλείς επιλογές. Ωστόσο, αυτές οι μέθοδοι είναι δύσκολο να εκπαιδευτούν, να συντονιστούν και να αναπτυχθούν στην παραγωγή, απαιτώντας εξειδικευμένη γνώση της ML και ανάλυσης χρονοσειρών.

Το AutoML είναι ένα ταχέως αναπτυσσόμενο θέμα στο ML, που εστιάζει στην αυτοματοποίηση κοινών εργασιών σε αγωγούς ML, συμπεριλαμβανομένης της προεπεξεργασίας χαρακτηριστικών, της επιλογής μοντέλου, του συντονισμού μοντέλου, της συναρμολόγησης και της ανάπτυξης. Το AutoGluon-TimeSeries είναι η πιο πρόσφατη προσθήκη στο AutoGluon, μία από τις κορυφαίες λύσεις AutoML ανοιχτού κώδικα και βασίζεται στο ισχυρό πλαίσιο του AutoGluon για AutoML στις εργασίες πρόβλεψης. Το AutoGluon-TimeSeries σχεδιάστηκε για να δημιουργεί ισχυρά συστήματα πρόβλεψης με μόλις τρεις γραμμές κώδικα, μετριάζοντας τις προκλήσεις της προεπεξεργασίας χαρακτηριστικών, της επιλογής μοντέλου, του συντονισμού μοντέλου και της ευκολίας ανάπτυξης.

Με μια απλή κλήση στο AutoGluon-TimeSeries's TimeSeriesPredictor, Το AutoGluon ακολουθεί μια διαισθητική σειρά προτεραιότητας στην τοποθέτηση μοντέλων: ξεκινώντας από απλές απλές γραμμές βάσης και μετάβαση σε ισχυρό παγκόσμιο νευρωνικό δίκτυο και ενισχυμένες μεθόδους που βασίζονται σε δέντρα, όλα εντός του χρονικού προϋπολογισμού που καθορίζει ο χρήστης. Όταν είναι διαθέσιμες σχετικές χρονικές σειρές (χρονικά μεταβλητές συμμεταβλητές ή εξωγενείς μεταβλητές) ή μεταδεδομένα στοιχείων (στατικά χαρακτηριστικά), το AutoGluon-TimeSeries τις συνυπολογίζει στην πρόβλεψη. Η βιβλιοθήκη χρησιμοποιεί επίσης τη Bayesian βελτιστοποίηση για συντονισμό υπερπαραμέτρων, καταλήγοντας στην καλύτερη διαμόρφωση μοντέλων συντονίζοντας πολύπλοκα μοντέλα. Τέλος, το AutoGluon-TimeSeries συνδυάζει τις καλύτερες στατιστικές μεθόδους και μεθόδους που βασίζονται σε ML σε ένα σύνολο μοντέλων βελτιστοποιημένο για το συγκεκριμένο πρόβλημα.

Σε αυτήν την ανάρτηση, παρουσιάζουμε την ευκολία χρήσης του AutoGluon-TimeSeries στη γρήγορη δημιουργία ενός ισχυρού προγνωστικού.

Ξεκινήστε με το AutoGluon-TimeSeries

Για να ξεκινήσετε, πρέπει να εγκαταστήσετε το AutoGluon, το οποίο γίνεται εύκολα με pip σε ένα κέλυφος UNIX:

pip install "autogluon>=0.6"

Το AutoGluon-TimeSeries παρουσιάζει το TimeSeriesDataFrame κλάση για εργασία με σύνολα δεδομένων που περιλαμβάνουν πολλαπλές σχετικές χρονικές σειρές (μερικές φορές ονομάζεται σύνολο δεδομένων πίνακα). Αυτά τα πλαίσια δεδομένων μπορούν να δημιουργηθούν από τα λεγόμενα πλαίσια δεδομένων μεγάλης μορφής, τα οποία έχουν αναγνωριστικά χρονοσειρών και χρονικές σημάνσεις ταξινομημένες σε σειρές. Το παρακάτω είναι ένα τέτοιο παράδειγμα δεδομένων, που λαμβάνεται από τον διαγωνισμό M4 [3]. Εδώ, το item_id Η στήλη καθορίζει το μοναδικό αναγνωριστικό μιας μεμονωμένης χρονοσειράς, όπως το αναγνωριστικό προϊόντος για δεδομένα ημερήσιων πωλήσεων πολλών προϊόντων. ο target στήλη είναι η τιμή ενδιαφέροντος που θα μάθει να προβλέπει το AutoGluon-TimeSeries. weekend είναι μια επιπλέον χρονικά μεταβλητή συμμεταβλητή που δημιουργήσαμε για να επισημάνουμε εάν η παρατήρηση ήταν το Σαββατοκύριακο ή όχι.

Μπορούμε εύκολα να παράγουμε ένα νέο TimeSeriesDataFrame από αυτό το σύνολο δεδομένων χρησιμοποιώντας το from_data_frame κατασκευαστής. Δείτε τον παρακάτω κώδικα Python:

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

Ορισμένα δεδομένα χρονοσειρών έχουν μη χρονικά μεταβαλλόμενα χαρακτηριστικά (στατικά χαρακτηριστικά ή μεταδεδομένα στοιχείων) που μπορούν να χρησιμοποιηθούν για την εκπαίδευση ενός μοντέλου πρόβλεψης. Για παράδειγμα, το σύνολο δεδομένων M4 διαθέτει μια μεταβλητή κατηγορίας για κάθε χρονοσειρά. Αυτά μπορούν να προστεθούν στο TimeSeriesDataFrame ρυθμίζοντας το static_features μεταβλητή με νέο πλαίσιο δεδομένων.

Εύκολη και ακριβής πρόβλεψη με το AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Χρησιμοποιήστε τον ακόλουθο κωδικό:

df.static_features = raw_static_features

Εκπαιδεύστε ένα TimeSeriesPredictor

Τέλος, μπορούμε να καλέσουμε το TimeSeriesPredictor να χωρέσει ένα ευρύ φάσμα μοντέλων πρόβλεψης για τη δημιουργία ενός ακριβούς συστήματος πρόβλεψης. Δείτε τον παρακάτω κώδικα:

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

Εδώ, διευκρινίζουμε ότι το TimeSeriesPredictor θα πρέπει να παράγει μοντέλα για την πρόβλεψη των επόμενων επτά χρονικών περιόδων και να κρίνει τα καλύτερα μοντέλα χρησιμοποιώντας το μέσο απόλυτο σφάλμα κλίμακας (MASE). Επιπλέον, υποδεικνύουμε ότι η χρονικά μεταβλητή συμμεταβλητή weekend είναι διαθέσιμο στο σύνολο δεδομένων. Μπορούμε τώρα να προσαρμόσουμε το αντικείμενο πρόβλεψης στο TimeSeriesDataFrame που παρήχθη νωρίτερα:

predictor.fit(df, presets="medium_quality", time_limit=1800)

Εκτός από την παροχή των δεδομένων εκπαίδευσης, ζητάμε από τον προγνωστικό να χρησιμοποιήσει “medium_quality” προεπιλογές. Το AutoGluon-TimeSeries συνοδεύεται από πολλαπλές προεπιλογές για να επιλέξετε υποσύνολα μοντέλων που πρέπει να λάβετε υπόψη και πόσο χρόνο θα αφιερώσετε για να τα συντονίσετε, διαχειριζόμενη την αντιστάθμιση μεταξύ ταχύτητας προπόνησης και ακρίβειας. Εκτός από τις προεπιλογές, οι πιο έμπειροι χρήστες μπορούν να χρησιμοποιήσουν α hyperparameters όρισμα για τον ακριβή προσδιορισμό των μοντέλων συστατικών και ποιες υπερπαράμετροι να οριστούν σε αυτά. Καθορίζουμε επίσης ένα χρονικό όριο 1,800 δευτερολέπτων, μετά το οποίο ο προγνωστικός διακόπτει την προπόνηση.

Κάτω από το καπό, το AutoGluon-TimeSeries εκπαιδεύει όσα περισσότερα μοντέλα μπορεί εντός του καθορισμένου χρονικού πλαισίου, ξεκινώντας από αφελείς αλλά ισχυρές γραμμές βάσης και εργαζόμενοι προς πιο σύνθετους προγνωστικούς που βασίζονται σε ενισχυμένα δέντρα και μοντέλα νευρωνικών δικτύων. Με την κλήση predictor.leaderboard(), μπορούμε να δούμε μια λίστα με όλα τα μοντέλα που έχει εκπαιδεύσει και τους βαθμούς ακρίβειας και τους χρόνους εκπαίδευσης για το καθένα. Λάβετε υπόψη ότι κάθε μοντέλο AutoGluon-TimeSeries αναφέρει τα λάθη του σε μια μορφή «υψηλότερο τόσο καλύτερο», πράγμα που σημαίνει ότι τα περισσότερα μέτρα σφαλμάτων πρόβλεψης πολλαπλασιάζονται επί -1 όταν αναφέρονται. Δείτε το παρακάτω παράδειγμα:

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

Πρόβλεψη με TimeSeriesPredictor

Τέλος, μπορούμε να χρησιμοποιήσουμε τον προγνωστικό για να προβλέψουμε όλες τις χρονικές σειρές σε α TimeSeriesDataFrame, 7 ημέρες στο μέλλον. Σημειώστε ότι επειδή χρησιμοποιήσαμε συνμεταβλητές χρονικά μεταβλητές που υποτίθεται ότι θα είναι γνωστές στο μέλλον, αυτές θα πρέπει επίσης να προσδιορίζονται κατά τον χρόνο πρόβλεψης. Δείτε τον παρακάτω κώδικα:

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

Από προεπιλογή, το AutoGluon-TimeSeries παρέχει τόσο σημειακές προβλέψεις όσο και πιθανοτικές (ποσοστιαίες) προβλέψεις της τιμής στόχου. Οι πιθανοτικές προβλέψεις είναι απαραίτητες σε πολλές εργασίες σχεδιασμού και μπορούν να χρησιμοποιηθούν για τον ευέλικτο υπολογισμό των διαστημάτων, επιτρέποντας εργασίες κατάντη όπως η απογραφή και ο προγραμματισμός χωρητικότητας.

Εύκολη και ακριβής πρόβλεψη με το AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το παρακάτω είναι ένα δείγμα γραφικής παράστασης πρόβλεψης που δείχνει σημειακές προβλέψεις και διαστήματα πρόβλεψης.

Εύκολη και ακριβής πρόβλεψη με το AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Συμπέρασμα

Το AutoGluon-TimeSeries παρέχει στους μετεωρολόγους και τους επιστήμονες δεδομένων έναν γρήγορο και εύκολο τρόπο να δημιουργήσουν ισχυρά μοντέλα πρόβλεψης. Εκτός από ορισμένες από τις συνήθεις λειτουργίες της βιβλιοθήκης που παρουσιάζονται σε αυτήν την ανάρτηση, το AutoGluon-TimeSeries διαθέτει ένα σύνολο τρόπων διαμόρφωσης προβλέψεων για προχωρημένους χρήστες. Τα predictors είναι επίσης εύκολο να εκπαιδεύονται, να αναπτύσσονται και να εξυπηρετούνται σε κλίμακα Amazon Sage Maker, χρησιμοποιώντας τη βαθιά εκμάθηση AutoGluon δοχεία.

Για περισσότερες λεπτομέρειες σχετικά με τη χρήση του AutoGluon, παραδείγματα, σεμινάρια, καθώς και άλλες εργασίες που αντιμετωπίζει το AutoGluon, όπως η εκμάθηση σε πίνακες ή πολυτροπικά δεδομένα, επισκεφθείτε AutoGluon. Για να ξεκινήσετε να χρησιμοποιείτε το AutoGluon-TimeSeries, ανατρέξτε στο δικό μας φροντιστήριο γρήγορης εκκίνησης ή μας σε βάθος φροντιστήριο για μια βαθύτερη ματιά σε όλες τις δυνατότητες που προσφέρει η βιβλιοθήκη. Ακολουθήστε το AutoGluon στο Twitter, και μας με αστέρι GitHub για να ενημερώνεστε για τις τελευταίες ενημερώσεις.

Για πρόβλεψη σε κλίμακα με αποκλειστικούς υπολογισμούς και ροές εργασίας, υποστήριξη σε επίπεδο επιχείρησης, επεξήγηση προβλέψεων και πολλά άλλα, ελέγξτε επίσης Πρόβλεψη του Αμαζονίου.

αναφορές

[1] Salinas, David, Valentin Flunkert, Jan Gasthaus και Tim Januschowski. "DeepAR: Πιθανοτική πρόβλεψη με αυτοπαλινδρομικά επαναλαμβανόμενα δίκτυα." International Journal of Forecasting 36. 3 (2020): 1181-1191.

[2] Lim, Bryan, Sercan O Arik, Nicolas Loeff και Tomas Pfister. "Temporal Fusion Transformers για ερμηνεύσιμη πρόβλεψη χρονοσειρών πολλαπλών οριζόντων." International Journal of Forecasting 37.4 (2021): 1748-1764.

[3] Μακριδάκης, Σπύρος, Ευάγγελος Σπηλιώτης, και Βασίλειος Ασημακόπουλος. «Ο ανταγωνισμός M4: 100,000 χρονοσειρές και 61 μέθοδοι πρόβλεψης». International Journal of Forecasting 36.1 (2020): 54-74.


Σχετικά με τους συγγραφείς

Εύκολη και ακριβής πρόβλεψη με το AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Caner Τουρκμενιστάν είναι Εφαρμοσμένος Επιστήμονας στο Amazon Web Services, όπου εργάζεται πάνω σε προβλήματα στη διασταύρωση της μηχανικής μάθησης και της πρόβλεψης, εκτός από την ανάπτυξη του AutoGluon-TimeSeries. Πριν ενταχθεί στην AWS, εργάστηκε στη βιομηχανία συμβούλων διαχείρισης ως επιστήμονας δεδομένων, υπηρετώντας τις βιομηχανίες χρηματοοικονομικών υπηρεσιών και τηλεπικοινωνιών σε έργα σε όλο τον κόσμο. Τα προσωπικά ερευνητικά ενδιαφέροντα του Caner καλύπτουν μια σειρά θεμάτων, όπως η πρόβλεψη, η αιτιώδης συναγωγή και η AutoML.

Εύκολη και ακριβής πρόβλεψη με το AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Oleksandr Shchur είναι Εφαρμοσμένος Επιστήμονας στο Amazon Web Services, όπου εργάζεται στην πρόβλεψη χρονοσειρών στο AutoGluon-TimeSeries. Πριν ενταχθεί στο AWS, ολοκλήρωσε διδακτορικό στη Μηχανική Μάθηση στο Τεχνικό Πανεπιστήμιο του Μονάχου, Γερμανία, κάνοντας έρευνα σε πιθανοτικά μοντέλα για δεδομένα συμβάντων. Τα ερευνητικά του ενδιαφέροντα περιλαμβάνουν μηχανική μάθηση για χρονικά δεδομένα και γενετική μοντελοποίηση.

Εύκολη και ακριβής πρόβλεψη με το AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Νικ Έρικσον είναι Ανώτερος Εφαρμοσμένος Επιστήμονας στο Amazon Web Services. Απέκτησε το μεταπτυχιακό του στην Επιστήμη και τη Μηχανική Υπολογιστών από το University of Minnesota Twin Cities. Είναι ο συν-συγγραφέας και κύριος προγραμματιστής του πλαισίου AutoML ανοιχτού κώδικα AutoGluon. Ξεκινώντας ως εργαλειοθήκη ML προσωπικού διαγωνισμού το 2018, ο Nick επέκτεινε συνεχώς τις δυνατότητες του AutoGluon και εντάχθηκε στην Amazon AI το 2019 για να ανοίξει τον κώδικα του έργου και να εργαστεί με πλήρες ωράριο για την προώθηση της τελευταίας τεχνολογίας στο AutoML.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS