AutoGluon-TimeSeries adalah tambahan terbaru untuk AutoGluon, yang membantu Anda dengan mudah membuat model peramalan deret waktu yang andal hanya dengan tiga baris kode.
Peramalan deret waktu adalah tugas umum dalam beragam industri serta domain ilmiah. Memiliki akses ke prakiraan pasokan, permintaan, atau kapasitas yang andal sangat penting untuk merencanakan bisnis. Namun, peramalan deret waktu merupakan masalah yang sulit, terutama ketika tersedia ribuan deret waktu yang berpotensi terkait, seperti penjualan dalam katalog besar di e-niaga, atau kapasitas di ratusan situs operasional.
Metode peramalan berbasis statistik atau penilaian sederhana seringkali sudah menjadi dasar yang kuat yang sulit ditingkatkan dengan metode pembelajaran mesin baru (ML). Selain itu, penerapan kemajuan terkini dalam ML untuk peramalan bervariasi, dengan beberapa metode seperti Jauh [1] atau Temporal Fusion Transformers [2] muncul sebagai pilihan populer. Namun, metode ini sulit untuk dilatih, disetel, dan diterapkan dalam produksi, sehingga memerlukan pengetahuan pakar tentang ML dan analisis deret waktu.
AutoML adalah topik yang berkembang pesat dalam ML, berfokus pada mengotomatiskan tugas-tugas umum dalam pipeline ML, termasuk prapemrosesan fitur, pemilihan model, penyetelan model, ensembling, dan penerapan. AutoGluon-TimeSeries adalah tambahan terbaru untuk Perekat Otomatis, salah satu solusi AutoML sumber terbuka terkemuka, dan dibangun di atas kerangka kerja AutoGluon yang kuat untuk AutoML dalam tugas perkiraan. AutoGluon-TimeSeries dirancang untuk membangun sistem peramalan yang kuat hanya dengan tiga baris kode, mengurangi tantangan prapemrosesan fitur, pemilihan model, penyetelan model, dan kemudahan penerapan.
Dengan panggilan sederhana ke AutoGluon-TimeSeries's TimeSeriesPredictor
, AutoGluon mengikuti urutan prioritas yang intuitif dalam menyesuaikan model: mulai dari garis dasar naif yang sederhana dan pindah ke jaringan saraf global yang kuat dan meningkatkan metode berbasis pohon, semuanya dalam anggaran waktu yang ditentukan oleh pengguna. Ketika deret waktu terkait (kovariat bervariasi waktu atau variabel eksogen) atau metadata item (fitur statis) tersedia, AutoGluon-TimeSeries memasukkannya ke dalam perkiraan. Pustaka juga memanfaatkan pengoptimalan Bayesian untuk penyetelan hyperparameter, mencapai konfigurasi model terbaik dengan menyetel model yang kompleks. Terakhir, AutoGluon-TimeSeries menggabungkan yang terbaik dari metode berbasis statistik dan ML ke dalam ansambel model yang dioptimalkan untuk masalah yang dihadapi.
Dalam posting ini, kami menampilkan kemudahan penggunaan AutoGluon-TimeSeries dalam membangun peramal yang kuat dengan cepat.
Mulailah dengan AutoGluon-TimeSeries
Untuk memulai, Anda perlu menginstal AutoGluon, yang mudah dilakukan dengan pip pada shell UNIX:
AutoGluon-TimeSeries memperkenalkan TimeSeriesDataFrame
kelas untuk bekerja dengan kumpulan data yang menyertakan beberapa deret waktu terkait (terkadang disebut kumpulan data panel). Bingkai data ini dapat dibuat dari apa yang disebut bingkai data format panjang, yang memiliki ID deret waktu dan stempel waktu yang disusun dalam baris. Berikut ini adalah salah satu contoh data yang diambil dari kompetisi M4 [3]. Di sini, item_id
kolom menentukan pengidentifikasi unik dari rangkaian waktu tunggal, seperti ID produk untuk data penjualan harian dari beberapa produk. Itu target
kolom adalah nilai minat yang akan dipelajari oleh AutoGluon-TimeSeries untuk diramalkan. weekend
adalah kovariat variasi waktu tambahan yang kami hasilkan untuk menandai apakah pengamatan dilakukan pada akhir pekan atau tidak.
Kita dapat dengan mudah menghasilkan yang baru TimeSeriesDataFrame
dari dataset ini menggunakan from_data_frame
konstruktor. Lihat kode Python berikut:
Beberapa data deret waktu memiliki fitur yang tidak berubah-waktu (fitur statis atau metadata item) yang dapat digunakan dalam melatih model peramalan. Misalnya, dataset M4 menampilkan variabel kategori untuk setiap deret waktu. Ini dapat ditambahkan ke TimeSeriesDataFrame
dengan mengatur static_features
variabel dengan bingkai data baru.
Gunakan kode berikut:
Latih TimeSeriesPredictor
Akhirnya, kita bisa memanggil TimeSeriesPredictor
agar sesuai dengan beragam model peramalan untuk membangun sistem peramalan yang akurat. Lihat kode berikut:
Di sini, kami menentukan bahwa TimeSeriesPredictor
harus menghasilkan model untuk meramalkan tujuh periode waktu berikutnya dan menilai model terbaik dengan menggunakan mean absolute scaled error (MAS). Selain itu, kami menunjukkan bahwa kovariat bervariasi waktu weekend
tersedia dalam kumpulan data. Kita sekarang dapat menyesuaikan objek prediktor pada TimeSeriesDataFrame
diproduksi lebih awal:
Selain menyediakan data pelatihan, kami meminta prediktor untuk digunakan โmedium_qualityโ
preset. AutoGluon-TimeSeries hadir dengan beberapa preset untuk memilih subset model untuk dipertimbangkan dan berapa banyak waktu yang dihabiskan untuk menyetelnya, mengelola pertukaran antara kecepatan pelatihan vs. akurasi. Selain preset, pengguna yang lebih berpengalaman dapat menggunakan a hyperparameters
argumen untuk secara tepat menentukan model komponen dan hyperparameter mana yang akan ditetapkan pada mereka. Kami juga menentukan batas waktu 1,800 detik, setelah itu prediktor berhenti berlatih.
Di bawah tenda, AutoGluon-TimeSeries melatih sebanyak mungkin model dalam kerangka waktu yang ditentukan, mulai dari garis dasar yang naif namun kuat dan bekerja menuju peramal yang lebih kompleks berdasarkan pohon yang ditingkatkan dan model jaringan saraf. Dengan menyebut predictor.leaderboard()
, kita dapat melihat daftar semua model yang telah dilatih dan skor akurasi serta waktu pelatihan untuk masing-masing model. Perhatikan bahwa setiap model AutoGluon-TimeSeries melaporkan kesalahannya dalam format "lebih tinggi lebih baik", yang berarti sebagian besar ukuran kesalahan perkiraan dikalikan dengan -1 saat dilaporkan. Lihat contoh berikut:
Prakiraan dengan TimeSeriesPredictor
Terakhir, kita dapat menggunakan prediktor untuk memprediksi semua deret waktu dalam a TimeSeriesDataFrame
, 7 hari ke depan. Perhatikan bahwa karena kami menggunakan kovariat yang bervariasi waktu yang diasumsikan diketahui di masa mendatang, ini juga harus ditentukan pada waktu prediksi. Lihat kode berikut:
Secara default, AutoGluon-TimeSeries menyediakan prakiraan titik dan prakiraan probabilistik (kuantil) dari nilai target. Prakiraan probabilistik sangat penting dalam banyak tugas perencanaan, dan dapat digunakan untuk menghitung interval secara fleksibel, memungkinkan tugas hilir seperti perencanaan inventaris dan kapasitas.
Berikut ini adalah contoh plot prakiraan yang menunjukkan prakiraan titik dan interval prediksi.
Kesimpulan
AutoGluon-TimeSeries memberi peramal dan ilmuwan data cara cepat dan mudah untuk membangun model peramalan yang kuat. Selain beberapa fitur perpustakaan yang umum digunakan yang dipamerkan di posting ini, AutoGluon-TimeSeries menampilkan serangkaian cara untuk mengonfigurasi prakiraan bagi pengguna tingkat lanjut. Prediktor juga mudah dilatih, diterapkan, dan ditayangkan dalam skala besar Amazon SageMaker, menggunakan pembelajaran mendalam AutoGluon kontainer.
Untuk detail lebih lanjut tentang penggunaan AutoGluon, contoh, tutorial, serta tugas lain yang ditangani AutoGluon seperti mempelajari data tabular atau multimodal, kunjungi Perekat Otomatis. Untuk mulai menggunakan AutoGluon-TimeSeries, lihat kami tutorial memulai cepat atau kita tutorial mendalam untuk melihat lebih dalam ke semua fitur yang ditawarkan perpustakaan. Ikuti AutoGluon di Twitter, dan bintangi kami GitHub untuk diberitahu tentang update terbaru.
Untuk peramalan dalam skala besar dengan komputasi dan alur kerja khusus, dukungan tingkat perusahaan, penjelasan perkiraan, dan banyak lagi, lihat juga Prakiraan Amazon.
Referensi
[1] Salinas, David, Valentin Flunkert, Jan Gasthaus, dan Tim Januschowski. โDeepAR: Perkiraan probabilistik dengan jaringan berulang autoregresif.โ Jurnal Peramalan Internasional 36 (3): 2020-1181.
[2] Lim, Bryan, Sercan O Arik, Nicolas Loeff, dan Tomas Pfister. "Temporal Fusion Transformers untuk prakiraan deret waktu multi-cakrawala yang dapat ditafsirkan." Jurnal Peramalan Internasional 37.4 (2021): 1748-1764.
[3] Makridakis, Spyros, Evangelos Spiliotis, dan Vassilios Assimakopoulos. โKompetisi M4: 100,000 deret waktu dan 61 metode peramalan.โ Jurnal Peramalan Internasional 36.1 (2020): 54-74.
Tentang penulis
Kaner Turkmenistan adalah Ilmuwan Terapan di Amazon Web Services, di mana dia bekerja pada masalah di persimpangan pembelajaran mesin dan peramalan, selain mengembangkan AutoGluon-TimeSeries. Sebelum bergabung dengan AWS, dia bekerja di industri konsultasi manajemen sebagai ilmuwan data, melayani layanan keuangan dan industri telekomunikasi pada proyek di seluruh dunia. Minat penelitian pribadi Caner mencakup berbagai topik, termasuk peramalan, inferensi kausal, dan AutoML.
Oleksandr Shchur adalah seorang Ilmuwan Terapan di Amazon Web Services, di mana dia mengerjakan perkiraan deret waktu di AutoGluon-TimeSeries. Sebelum bergabung dengan AWS, dia menyelesaikan PhD dalam Pembelajaran Mesin di Technical University of Munich, Jerman, melakukan penelitian tentang model probabilistik untuk data peristiwa. Minat penelitiannya meliputi pembelajaran mesin untuk data temporal dan pemodelan generatif.
Nick Erickson adalah Ilmuwan Terapan Senior di Amazon Web Services. Ia memperoleh gelar masternya di bidang Computer Science and Engineering dari University of Minnesota Twin Cities. Dia adalah rekan penulis dan pengembang utama kerangka kerja AutoML sumber terbuka AutoGluon. Dimulai sebagai toolkit ML kompetisi pribadi pada tahun 2018, Nick terus memperluas kemampuan AutoGluon dan bergabung dengan Amazon AI pada tahun 2019 untuk membuka sumber proyek dan bekerja penuh waktu untuk memajukan AutoML yang canggih.
- AI
- ai seni
- generator seni ai
- punya robot
- kecerdasan buatan
- sertifikasi kecerdasan buatan
- kecerdasan buatan dalam perbankan
- robot kecerdasan buatan
- robot kecerdasan buatan
- perangkat lunak kecerdasan buatan
- Pembelajaran Mesin AWS
- blockchain
- konferensi blockchain
- kecerdasan
- kecerdasan buatan percakapan
- konferensi kripto
- dall's
- belajar mendalam
- gluon
- google itu
- Menengah (200)
- Mesin belajar
- plato
- plato ai
- Kecerdasan Data Plato
- Permainan Plato
- Data Plato
- permainan plato
- skala ai
- sintaksis
- zephyrnet.dll