Peramalan Mudah Dan Akurat Dengan AutoGluon-TimeSeries

Diterbitkan Ulang Oleh Plato

Followers: 0

AutoGluon-TimeSeries adalah tambahan terbaru untuk AutoGluon, yang membantu Anda dengan mudah membuat model peramalan deret waktu yang andal hanya dengan tiga baris kode.

Peramalan deret waktu adalah tugas umum dalam beragam industri serta domain ilmiah. Memiliki akses ke prakiraan pasokan, permintaan, atau kapasitas yang andal sangat penting untuk merencanakan bisnis. Namun, peramalan deret waktu merupakan masalah yang sulit, terutama ketika tersedia ribuan deret waktu yang berpotensi terkait, seperti penjualan dalam katalog besar di e-niaga, atau kapasitas di ratusan situs operasional.

Metode peramalan berbasis statistik atau penilaian sederhana seringkali sudah menjadi dasar yang kuat yang sulit ditingkatkan dengan metode pembelajaran mesin baru (ML). Selain itu, penerapan kemajuan terkini dalam ML untuk peramalan bervariasi, dengan beberapa metode seperti Jauh [1] atau Temporal Fusion Transformers [2] muncul sebagai pilihan populer. Namun, metode ini sulit untuk dilatih, disetel, dan diterapkan dalam produksi, sehingga memerlukan pengetahuan pakar tentang ML dan analisis deret waktu.

AutoML adalah topik yang berkembang pesat dalam ML, berfokus pada mengotomatiskan tugas-tugas umum dalam pipeline ML, termasuk prapemrosesan fitur, pemilihan model, penyetelan model, ensembling, dan penerapan. AutoGluon-TimeSeries adalah tambahan terbaru untuk Perekat Otomatis, salah satu solusi AutoML sumber terbuka terkemuka, dan dibangun di atas kerangka kerja AutoGluon yang kuat untuk AutoML dalam tugas perkiraan. AutoGluon-TimeSeries dirancang untuk membangun sistem peramalan yang kuat hanya dengan tiga baris kode, mengurangi tantangan prapemrosesan fitur, pemilihan model, penyetelan model, dan kemudahan penerapan.

Dengan panggilan sederhana ke AutoGluon-TimeSeries's TimeSeriesPredictor, AutoGluon mengikuti urutan prioritas yang intuitif dalam menyesuaikan model: mulai dari garis dasar naif yang sederhana dan pindah ke jaringan saraf global yang kuat dan meningkatkan metode berbasis pohon, semuanya dalam anggaran waktu yang ditentukan oleh pengguna. Ketika deret waktu terkait (kovariat bervariasi waktu atau variabel eksogen) atau metadata item (fitur statis) tersedia, AutoGluon-TimeSeries memasukkannya ke dalam perkiraan. Pustaka juga memanfaatkan pengoptimalan Bayesian untuk penyetelan hyperparameter, mencapai konfigurasi model terbaik dengan menyetel model yang kompleks. Terakhir, AutoGluon-TimeSeries menggabungkan yang terbaik dari metode berbasis statistik dan ML ke dalam ansambel model yang dioptimalkan untuk masalah yang dihadapi.

Dalam posting ini, kami menampilkan kemudahan penggunaan AutoGluon-TimeSeries dalam membangun peramal yang kuat dengan cepat.

Mulailah dengan AutoGluon-TimeSeries

Untuk memulai, Anda perlu menginstal AutoGluon, yang mudah dilakukan dengan pip pada shell UNIX:

pip install "autogluon>=0.6"

AutoGluon-TimeSeries memperkenalkan TimeSeriesDataFrame kelas untuk bekerja dengan kumpulan data yang menyertakan beberapa deret waktu terkait (terkadang disebut kumpulan data panel). Bingkai data ini dapat dibuat dari apa yang disebut bingkai data format panjang, yang memiliki ID deret waktu dan stempel waktu yang disusun dalam baris. Berikut ini adalah salah satu contoh data yang diambil dari kompetisi M4 [3]. Di sini, item_id kolom menentukan pengidentifikasi unik dari rangkaian waktu tunggal, seperti ID produk untuk data penjualan harian dari beberapa produk. Itu target kolom adalah nilai minat yang akan dipelajari oleh AutoGluon-TimeSeries untuk diramalkan. weekend adalah kovariat variasi waktu tambahan yang kami hasilkan untuk menandai apakah pengamatan dilakukan pada akhir pekan atau tidak.

Kita dapat dengan mudah menghasilkan yang baru TimeSeriesDataFrame dari dataset ini menggunakan from_data_frame konstruktor. Lihat kode Python berikut:

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

Beberapa data deret waktu memiliki fitur yang tidak berubah-waktu (fitur statis atau metadata item) yang dapat digunakan dalam melatih model peramalan. Misalnya, dataset M4 menampilkan variabel kategori untuk setiap deret waktu. Ini dapat ditambahkan ke TimeSeriesDataFrame dengan mengatur static_features variabel dengan bingkai data baru.

Gunakan kode berikut:

df.static_features = raw_static_features

Latih TimeSeriesPredictor

Akhirnya, kita bisa memanggil TimeSeriesPredictor agar sesuai dengan beragam model peramalan untuk membangun sistem peramalan yang akurat. Lihat kode berikut:

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

Di sini, kami menentukan bahwa TimeSeriesPredictor harus menghasilkan model untuk meramalkan tujuh periode waktu berikutnya dan menilai model terbaik dengan menggunakan mean absolute scaled error (MAS). Selain itu, kami menunjukkan bahwa kovariat bervariasi waktu weekend tersedia dalam kumpulan data. Kita sekarang dapat menyesuaikan objek prediktor pada TimeSeriesDataFrame diproduksi lebih awal:

predictor.fit(df, presets="medium_quality", time_limit=1800)

Selain menyediakan data pelatihan, kami meminta prediktor untuk digunakan “medium_quality” preset. AutoGluon-TimeSeries hadir dengan beberapa preset untuk memilih subset model untuk dipertimbangkan dan berapa banyak waktu yang dihabiskan untuk menyetelnya, mengelola pertukaran antara kecepatan pelatihan vs. akurasi. Selain preset, pengguna yang lebih berpengalaman dapat menggunakan a hyperparameters argumen untuk secara tepat menentukan model komponen dan hyperparameter mana yang akan ditetapkan pada mereka. Kami juga menentukan batas waktu 1,800 detik, setelah itu prediktor berhenti berlatih.

Di bawah tenda, AutoGluon-TimeSeries melatih sebanyak mungkin model dalam kerangka waktu yang ditentukan, mulai dari garis dasar yang naif namun kuat dan bekerja menuju peramal yang lebih kompleks berdasarkan pohon yang ditingkatkan dan model jaringan saraf. Dengan menyebut predictor.leaderboard(), kita dapat melihat daftar semua model yang telah dilatih dan skor akurasi serta waktu pelatihan untuk masing-masing model. Perhatikan bahwa setiap model AutoGluon-TimeSeries melaporkan kesalahannya dalam format "lebih tinggi lebih baik", yang berarti sebagian besar ukuran kesalahan perkiraan dikalikan dengan -1 saat dilaporkan. Lihat contoh berikut:

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

Prakiraan dengan TimeSeriesPredictor

Terakhir, kita dapat menggunakan prediktor untuk memprediksi semua deret waktu dalam a TimeSeriesDataFrame, 7 hari ke depan. Perhatikan bahwa karena kami menggunakan kovariat yang bervariasi waktu yang diasumsikan diketahui di masa mendatang, ini juga harus ditentukan pada waktu prediksi. Lihat kode berikut:

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

Secara default, AutoGluon-TimeSeries menyediakan prakiraan titik dan prakiraan probabilistik (kuantil) dari nilai target. Prakiraan probabilistik sangat penting dalam banyak tugas perencanaan, dan dapat digunakan untuk menghitung interval secara fleksibel, memungkinkan tugas hilir seperti perencanaan inventaris dan kapasitas.

Berikut ini adalah contoh plot prakiraan yang menunjukkan prakiraan titik dan interval prediksi.

Kesimpulan

AutoGluon-TimeSeries memberi peramal dan ilmuwan data cara cepat dan mudah untuk membangun model peramalan yang kuat. Selain beberapa fitur perpustakaan yang umum digunakan yang dipamerkan di posting ini, AutoGluon-TimeSeries menampilkan serangkaian cara untuk mengonfigurasi prakiraan bagi pengguna tingkat lanjut. Prediktor juga mudah dilatih, diterapkan, dan ditayangkan dalam skala besar Amazon SageMaker, menggunakan pembelajaran mendalam AutoGluon kontainer.

Untuk detail lebih lanjut tentang penggunaan AutoGluon, contoh, tutorial, serta tugas lain yang ditangani AutoGluon seperti mempelajari data tabular atau multimodal, kunjungi Perekat Otomatis. Untuk mulai menggunakan AutoGluon-TimeSeries, lihat kami tutorial memulai cepat atau kita tutorial mendalam untuk melihat lebih dalam ke semua fitur yang ditawarkan perpustakaan. Ikuti AutoGluon di Twitter, dan bintangi kami GitHub untuk diberitahu tentang update terbaru.

Untuk peramalan dalam skala besar dengan komputasi dan alur kerja khusus, dukungan tingkat perusahaan, penjelasan perkiraan, dan banyak lagi, lihat juga Prakiraan Amazon.

Referensi

[1] Salinas, David, Valentin Flunkert, Jan Gasthaus, dan Tim Januschowski. “DeepAR: Perkiraan probabilistik dengan jaringan berulang autoregresif.” Jurnal Peramalan Internasional 36 (3): 2020-1181.

[2] Lim, Bryan, Sercan O Arik, Nicolas Loeff, dan Tomas Pfister. "Temporal Fusion Transformers untuk prakiraan deret waktu multi-cakrawala yang dapat ditafsirkan." Jurnal Peramalan Internasional 37.4 (2021): 1748-1764.

[3] Makridakis, Spyros, Evangelos Spiliotis, dan Vassilios Assimakopoulos. “Kompetisi M4: 100,000 deret waktu dan 61 metode peramalan.” Jurnal Peramalan Internasional 36.1 (2020): 54-74.

Tentang penulis

Kaner Turkmenistan adalah Ilmuwan Terapan di Amazon Web Services, di mana dia bekerja pada masalah di persimpangan pembelajaran mesin dan peramalan, selain mengembangkan AutoGluon-TimeSeries. Sebelum bergabung dengan AWS, dia bekerja di industri konsultasi manajemen sebagai ilmuwan data, melayani layanan keuangan dan industri telekomunikasi pada proyek di seluruh dunia. Minat penelitian pribadi Caner mencakup berbagai topik, termasuk peramalan, inferensi kausal, dan AutoML.

Oleksandr Shchur adalah seorang Ilmuwan Terapan di Amazon Web Services, di mana dia mengerjakan perkiraan deret waktu di AutoGluon-TimeSeries. Sebelum bergabung dengan AWS, dia menyelesaikan PhD dalam Pembelajaran Mesin di Technical University of Munich, Jerman, melakukan penelitian tentang model probabilistik untuk data peristiwa. Minat penelitiannya meliputi pembelajaran mesin untuk data temporal dan pemodelan generatif.

Nick Erickson adalah Ilmuwan Terapan Senior di Amazon Web Services. Ia memperoleh gelar masternya di bidang Computer Science and Engineering dari University of Minnesota Twin Cities. Dia adalah rekan penulis dan pengembang utama kerangka kerja AutoML sumber terbuka AutoGluon. Dimulai sebagai toolkit ML kompetisi pribadi pada tahun 2018, Nick terus memperluas kemampuan AutoGluon dan bergabung dengan Amazon AI pada tahun 2019 untuk membuka sumber proyek dan bekerja penuh waktu untuk memajukan AutoML yang canggih.

Stempel Waktu: November 18, 2022November 18, 2022

Stempel Waktu: 2 Mei 2022

Peramalan yang mudah dan akurat dengan AutoGluon-TimeSeries

Diterbitkan Ulang Oleh Plato

Mulailah dengan AutoGluon-TimeSeries

Latih TimeSeriesPredictor

Prakiraan dengan TimeSeriesPredictor

Kesimpulan

Referensi

Tentang penulis

Lebih dari Pembelajaran Mesin AWS

Mengumumkan Pembuat Percakapan Visual untuk Amazon Lex

Perjalanan asisten virtual AI generatif PGA TOUR, mulai dari konsep hingga pengembangan hingga prototipe | Layanan Web Amazon

Fitur baru untuk Amazon SageMaker Pipelines dan Amazon SageMaker SDK

Bangun alur kerja pembelajaran mesin manajemen risiko di Amazon SageMaker tanpa kode

Intuitivo mencapai throughput yang lebih tinggi sekaligus menghemat biaya AI/ML menggunakan AWS Inferentia dan PyTorch | Layanan Web Amazon

Tingkatkan asisten layanan mandiri Anda dengan fitur AI generatif baru di Amazon Lex | Layanan Web Amazon

Otomatiskan proses untuk mengubah latar belakang gambar menggunakan Amazon Bedrock dan AWS Step Functions | Layanan Web Amazon

Tingkatkan jangkauan konten Anda dengan konversi document-to-speech otomatis menggunakan layanan Amazon AI

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun