Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler

Data deret waktu hadir secara luas dalam kehidupan kita. Harga saham, harga rumah, informasi cuaca, dan data penjualan yang diambil dari waktu ke waktu hanyalah beberapa contoh. Ketika bisnis semakin mencari cara baru untuk mendapatkan wawasan yang berarti dari data deret waktu, kemampuan untuk memvisualisasikan data dan menerapkan transformasi yang diinginkan adalah langkah mendasar. Namun, data deret waktu memiliki karakteristik dan nuansa yang unik dibandingkan dengan jenis data tabular lainnya, dan memerlukan pertimbangan khusus. Misalnya, data tabular atau penampang standar dikumpulkan pada titik waktu tertentu. Sebaliknya, data deret waktu ditangkap berulang kali dari waktu ke waktu, dengan setiap titik data berurutan bergantung pada nilai masa lalunya.

Karena sebagian besar analisis deret waktu bergantung pada informasi yang dikumpulkan di seluruh rangkaian pengamatan yang berdekatan, data yang hilang dan sparseness bawaan dapat mengurangi keakuratan prakiraan dan menimbulkan bias. Selain itu, sebagian besar pendekatan analisis deret waktu bergantung pada jarak yang sama antara titik data, dengan kata lain, periodisitas. Oleh karena itu, kemampuan untuk memperbaiki ketidakteraturan spasi data merupakan prasyarat penting. Terakhir, analisis deret waktu sering kali memerlukan pembuatan fitur tambahan yang dapat membantu menjelaskan hubungan yang melekat antara data masukan dan prediksi masa depan. Semua faktor ini membedakan proyek deret waktu dari skenario pembelajaran mesin (ML) tradisional dan menuntut pendekatan yang berbeda untuk analisisnya.

Posting ini menjelaskan cara menggunakan Pengatur Data Amazon SageMaker untuk menerapkan transformasi deret waktu dan menyiapkan kumpulan data Anda untuk kasus penggunaan deret waktu.

Gunakan kasus untuk Data Wrangler

Data Wrangler memberikan solusi tanpa kode/kode rendah untuk analisis deret waktu dengan fitur untuk membersihkan, mengubah, dan menyiapkan data lebih cepat. Ini juga memungkinkan ilmuwan data untuk menyiapkan data deret waktu sesuai dengan persyaratan format input model peramalan mereka. Berikut adalah beberapa cara Anda dapat menggunakan kemampuan ini:

  • Analisis deskriptif– Biasanya, langkah pertama dari setiap proyek ilmu data adalah memahami data. Saat kami memplot data deret waktu, kami mendapatkan gambaran umum tingkat tinggi tentang polanya, seperti tren, musiman, siklus, dan variasi acak. Ini membantu kami memutuskan metodologi peramalan yang benar untuk secara akurat mewakili pola-pola ini. Plotting juga dapat membantu mengidentifikasi outlier, mencegah perkiraan yang tidak realistis dan tidak akurat. Data Wrangler hadir dengan visualisasi dekomposisi tren musiman untuk mewakili komponen deret waktu, dan visualisasi deteksi outlier untuk mengidentifikasi outlier.
  • Analisis penjelasan– Untuk deret waktu multivariat, kemampuan untuk mengeksplorasi, mengidentifikasi, dan memodelkan hubungan antara dua deret waktu atau lebih sangat penting untuk memperoleh prakiraan yang berarti. Itu Kelompok oleh transform di Data Wrangler membuat beberapa deret waktu dengan mengelompokkan data untuk sel tertentu. Selain itu, transformasi deret waktu Data Wrangler, jika berlaku, memungkinkan spesifikasi kolom ID tambahan untuk dikelompokkan, memungkinkan analisis deret waktu yang kompleks.
  • Persiapan data dan rekayasa fitur– Data deret waktu jarang dalam format yang diharapkan oleh model deret waktu. Seringkali memerlukan persiapan data untuk mengubah data mentah menjadi fitur khusus deret waktu. Anda mungkin ingin memvalidasi bahwa data deret waktu secara teratur atau berjarak sama sebelum analisis. Untuk kasus penggunaan peramalan, Anda mungkin juga ingin memasukkan karakteristik deret waktu tambahan, seperti autokorelasi dan properti statistik. Dengan Data Wrangler, Anda dapat dengan cepat membuat fitur deret waktu seperti kolom jeda untuk beberapa periode jeda, sampel ulang data ke beberapa perincian waktu, dan secara otomatis mengekstrak properti statistik deret waktu, untuk menyebutkan beberapa kemampuan.

Ikhtisar solusi

Posting ini menguraikan tentang bagaimana ilmuwan dan analis data dapat menggunakan Data Wrangler untuk memvisualisasikan dan menyiapkan data deret waktu. Kami menggunakan dataset cryptocurrency bitcoin dari unduhan cryptodata dengan detail perdagangan bitcoin untuk menunjukkan kemampuan ini. Kami membersihkan, memvalidasi, dan mengubah kumpulan data mentah dengan fitur deret waktu dan juga menghasilkan perkiraan harga volume bitcoin menggunakan kumpulan data yang diubah sebagai input.

Sampel data perdagangan bitcoin mulai 1 Januari – 19 November 2021, dengan 464,116 titik data. Atribut kumpulan data mencakup stempel waktu catatan harga, pembukaan atau harga pertama saat koin ditukar untuk hari tertentu, harga tertinggi saat koin ditukar pada hari itu, harga terakhir saat koin ditukarkan pada hari itu. hari itu, volume yang dipertukarkan dalam nilai mata uang kripto pada hari itu di BTC, dan mata uang USD yang sesuai.

Prasyarat

Download Bitstamp_BTCUSD_2021_minute.csv file dari unduhan cryptodata dan unggah ke Layanan Penyimpanan Sederhana Amazon (Amazon S3).

Impor dataset bitcoin di Data Wrangler

Untuk memulai proses penyerapan ke Data Wrangler, selesaikan langkah-langkah berikut:

  1. pada Studio SageMaker konsol, di File menu, pilih New, Lalu pilih Aliran Data Wrangler.
  2. Ubah nama aliran sesuai keinginan.
  3. Untuk Impor data, pilih Amazon S3.
  4. Unggah Bitstamp_BTCUSD_2021_minute.csv file dari ember S3 Anda.

Anda sekarang dapat melihat pratinjau kumpulan data Anda.

  1. Dalam majalah Rincian panel, pilih Konfigurasi lanjutan dan hapus pilihan Aktifkan pengambilan sampel.

Ini adalah kumpulan data yang relatif kecil, jadi kami tidak perlu mengambil sampel.

  1. Pilih impor.

Anda telah berhasil membuat diagram alir dan siap menambahkan langkah-langkah transformasi.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

Tambahkan transformasi

Untuk menambahkan transformasi data, pilih tanda plus di sebelah Tipe data Dan pilihlah Edit tipe data.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

Pastikan bahwa Data Wrangler secara otomatis menyimpulkan tipe data yang benar untuk kolom data.

Dalam kasus kami, tipe data yang disimpulkan sudah benar. Namun, anggaplah satu tipe data salah. Anda dapat dengan mudah memodifikasinya melalui UI, seperti yang ditunjukkan pada tangkapan layar berikut.

edit dan tinjau tipe data

Mari kita mulai analisis dan mulai menambahkan transformasi.

Pembersihan data

Kami pertama-tama melakukan beberapa transformasi pembersihan data.

Jatuhkan kolom

Mari kita mulai dengan menjatuhkan unix kolom, karena kami menggunakan date kolom sebagai indeks.

  1. Pilih Kembali ke aliran data.
  2. Pilih tanda plus di sebelah Tipe data Dan pilihlah Tambahkan transformasi.
  3. Pilih + Tambahkan langkah dalam TRANSFORMASI pane
  4. Pilih Kelola kolom.
  5. Untuk Mengubah, pilih Jatuhkan kolom.
  6. Untuk Kolom untuk dijatuhkan, pilih unix.
  7. Pilih Preview.
  8. Pilih Add untuk menyimpan langkah.

Menangani hilang

Data yang hilang adalah masalah yang terkenal dalam kumpulan data dunia nyata. Oleh karena itu, praktik terbaik adalah memverifikasi keberadaan nilai yang hilang atau nol dan menanganinya dengan tepat. Dataset kami tidak berisi nilai yang hilang. Tetapi jika ada, kami akan menggunakan Menangani hilang transformasi deret waktu untuk memperbaikinya. Strategi yang umum digunakan untuk menangani data yang hilang termasuk menjatuhkan baris dengan nilai yang hilang atau mengisi nilai yang hilang dengan perkiraan yang masuk akal. Karena data deret waktu bergantung pada urutan titik data sepanjang waktu, mengisi nilai yang hilang adalah pendekatan yang lebih disukai. Proses pengisian nilai yang hilang disebut sebagai tuduhan. itu Menangani hilang transformasi deret waktu memungkinkan Anda memilih dari beberapa strategi imputasi.

  1. Pilih + Tambahkan langkah dalam TRANSFORMASI pane
  2. Pilih Seri waktu mengubah.
  3. Untuk Mengubah, Pilih Menangani hilang.
  4. Untuk Jenis masukan deret waktu, pilih Sepanjang kolom.
  5. Untuk Metode untuk memasukkan nilai, pilih Isi maju.

Grafik Isi maju metode menggantikan nilai yang hilang dengan nilai yang tidak hilang sebelum nilai yang hilang.

menangani transformasi deret waktu yang hilang

Isi mundur, Nilai konstan, Nilai paling umum dan Menambah adalah strategi imputasi lain yang tersedia di Data Wrangler. Teknik interpolasi bergantung pada nilai tetangga untuk mengisi nilai yang hilang. Data deret waktu sering menunjukkan korelasi antara nilai-nilai tetangga, menjadikan interpolasi sebagai strategi pengisian yang efektif. Untuk detail tambahan tentang fungsi yang dapat Anda gunakan untuk menerapkan interpolasi, lihat pandas.DataFrame.interpolasi.

Validasi stempel waktu

Dalam analisis deret waktu, kolom stempel waktu bertindak sebagai kolom indeks, di mana analisis berputar. Oleh karena itu, penting untuk memastikan kolom stempel waktu tidak berisi nilai stempel waktu yang tidak valid atau formatnya salah. Karena kita menggunakan date kolom sebagai kolom stempel waktu dan indeks, mari konfirmasikan nilainya diformat dengan benar.

  1. Pilih + Tambahkan langkah dalam TRANSFORMASI pane
  2. Pilih Seri waktu mengubah.
  3. Untuk Mengubah, pilih Validasi stempel waktu.

Grafik Validasi stempel waktu transform memungkinkan Anda untuk memeriksa bahwa kolom stempel waktu di kumpulan data Anda tidak memiliki nilai dengan stempel waktu yang salah atau nilai yang hilang.

  1. Untuk Kolom stempel waktu, pilih tanggal.
  2. Untuk Kebijakan tarik-turun, pilih Menunjukkan.

Grafik Menunjukkan opsi kebijakan membuat kolom Boolean yang menunjukkan apakah nilai dalam kolom stempel waktu adalah format tanggal/waktu yang valid. Pilihan lain untuk Kebijakan meliputi:

  • error – Melempar kesalahan jika kolom stempel waktu hilang atau tidak valid
  • Menjatuhkan – Menjatuhkan baris jika kolom stempel waktu tidak ada atau tidak valid
  1. Pilih Preview.

Kolom Boolean baru bernama date_is_valid telah dibuat, dengan true nilai yang menunjukkan format yang benar dan entri non-null. Dataset kami tidak berisi nilai stempel waktu yang tidak valid di date kolom. Tetapi jika ya, Anda dapat menggunakan kolom Boolean baru untuk mengidentifikasi dan memperbaiki nilai tersebut.

Validasi transformasi deret waktu stempel waktu

  1. Pilih Add untuk menyimpan langkah ini.

Visualisasi deret waktu

Setelah kami membersihkan dan memvalidasi kumpulan data, kami dapat memvisualisasikan data dengan lebih baik untuk memahami komponennya yang berbeda.

sampel ulang

Karena kami tertarik dengan prediksi harian, mari ubah frekuensi data menjadi harian.

Grafik sampel ulang transformasi mengubah frekuensi pengamatan deret waktu ke perincian tertentu, dan dilengkapi dengan opsi upsampling dan downsampling. Menerapkan upsampling meningkatkan frekuensi pengamatan (misalnya dari harian ke per jam), sedangkan downsampling menurunkan frekuensi pengamatan (misalnya dari jam ke harian).

Karena dataset kami sangat terperinci, mari gunakan opsi downsampling.

  1. Pilih + Tambahkan langkah.
  2. Pilih Seri waktu mengubah.
  3. Untuk Mengubah, pilih sampel ulang.
  4. Untuk Timestamp, pilih tanggal.
  5. Untuk Satuan frekuensi, pilih Hari kalender.
  6. Untuk Kuantitas frekuensi, masukkan 1.
  7. Untuk Metode untuk menggabungkan nilai numerik, pilih berarti.
  8. Pilih Preview.

Frekuensi dataset kami telah berubah dari per menit menjadi harian.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

  1. Pilih Add untuk menyimpan langkah ini.

Dekomposisi Tren Musiman

Setelah resampling, kita dapat memvisualisasikan rangkaian transformasi dan komponen STL (Dekomposisi Musiman dan Tren menggunakan LOESS) yang terkait dengan menggunakan Musim-Tren-dekomposisi visualisasi. Ini memecah rangkaian waktu asli menjadi komponen tren, musiman, dan sisa yang berbeda, memberi kita pemahaman yang baik tentang bagaimana setiap pola berperilaku. Kita juga dapat menggunakan informasi tersebut ketika memodelkan masalah peramalan.

Data Wrangler menggunakan LOESS, metode statistik yang kuat dan serbaguna untuk memodelkan tren dan komponen musiman. Implementasi yang mendasarinya menggunakan regresi polinomial untuk memperkirakan hubungan nonlinier yang ada dalam komponen deret waktu (musiman, tren, dan residu).

  1. Pilih Kembali ke aliran data.
  2. Pilih tanda plus di sebelah Tangga on Aliran data.
  3. Pilih Tambahkan analisis.
  4. Dalam majalah Buat analisis panel, untuk Jenis analisis, pilih Seri waktu.
  5. Untuk Visualisasi, pilih Dekomposisi Tren Musiman.
  6. Untuk Nama Analisis, masukkan nama.
  7. Untuk Kolom stempel waktu, pilih tanggal.
  8. Untuk kolom nilai, pilih Volume Rp.
  9. Pilih Preview.

Analisis ini memungkinkan kita untuk memvisualisasikan rangkaian waktu masukan dan musiman, tren, dan residual yang terurai.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

  1. Pilih Save untuk menyimpan analisis.

Dengan visualisasi dekomposisi tren musiman, kita dapat menghasilkan empat pola, seperti yang ditunjukkan pada tangkapan layar sebelumnya:

  • Original – Rangkaian waktu asli disampel ulang ke perincian harian.
  • kecenderungan – Tren polinomial dengan pola tren keseluruhan negatif untuk tahun 2021, menunjukkan penurunan Volume USD nilai.
  • Musim – Musiman multiplikatif diwakili oleh pola osilasi yang bervariasi. Kami melihat penurunan variasi musiman, yang ditandai dengan penurunan amplitudo osilasi.
  • Sisa – Kebisingan residual atau acak yang tersisa. Deret residual adalah deret yang dihasilkan setelah komponen tren dan musiman dihilangkan. Melihat lebih dekat, kami mengamati lonjakan antara Januari dan Maret, dan antara April dan Juni, menunjukkan ruang untuk memodelkan peristiwa tertentu menggunakan data historis.

Visualisasi ini memberikan petunjuk berharga bagi ilmuwan dan analis data ke dalam pola yang ada dan dapat membantu Anda memilih strategi pemodelan. Namun, selalu merupakan praktik yang baik untuk memvalidasi keluaran dekomposisi STL dengan informasi yang dikumpulkan melalui analisis deskriptif dan keahlian domain.

Untuk meringkas, kami mengamati tren penurunan yang konsisten dengan visualisasi seri asli, yang meningkatkan kepercayaan diri kami dalam menggabungkan informasi yang disampaikan oleh visualisasi tren ke dalam pengambilan keputusan hilir. Sebaliknya, visualisasi musiman membantu menginformasikan keberadaan musiman dan kebutuhan untuk menghilangkannya dengan menerapkan teknik seperti pembedaan, itu tidak memberikan tingkat wawasan terperinci yang diinginkan ke dalam berbagai pola musiman yang ada, sehingga memerlukan analisis yang lebih dalam.

Rekayasa fitur

Setelah kami memahami pola yang ada dalam kumpulan data kami, kami dapat mulai merancang fitur baru yang bertujuan untuk meningkatkan akurasi model peramalan.

Menampilkan tanggal waktu

Mari kita mulai proses rekayasa fitur dengan fitur tanggal/waktu yang lebih mudah. Fitur tanggal/waktu dibuat dari timestamp kolom dan memberikan jalan optimal bagi ilmuwan data untuk memulai proses rekayasa fitur. Kita mulai dengan Menampilkan tanggal waktu transformasi deret waktu untuk menambahkan fitur bulan, hari dalam sebulan, hari dalam setahun, minggu dalam setahun, dan kuartal ke kumpulan data kami. Karena kami menyediakan komponen tanggal/waktu sebagai fitur terpisah, kami mengaktifkan algoritme ML untuk mendeteksi sinyal dan pola guna meningkatkan akurasi prediksi.

  1. Pilih + Tambahkan langkah.
  2. Pilih Seri waktu mengubah.
  3. Untuk Mengubah, pilih Menampilkan tanggal waktu.
  4. Untuk kolom masukan, pilih tanggal.
  5. Untuk Kolom Keluaran, Masuk date (langkah ini opsional).
  6. Untuk Mode keluaran, pilih Urut.
  7. Untuk Format output, pilih Kolom.
  8. Untuk mengekstrak fitur tanggal/waktu, pilih Bulan, Hari, Minggu tahun, Hari dalam setahun, dan Perempat.
  9. Pilih Preview.

Dataset sekarang berisi kolom baru bernama date_month, date_day, date_week_of_year, date_day_of_year, dan date_quarter. Informasi yang diperoleh dari fitur baru ini dapat membantu ilmuwan data memperoleh wawasan tambahan dari data dan ke dalam hubungan antara fitur input dan fitur output.

menampilkan transformasi deret waktu datetime

  1. Pilih Add untuk menyimpan langkah ini.

Enkode kategoris

Fitur tanggal/waktu tidak terbatas pada nilai integer. Anda juga dapat memilih untuk mempertimbangkan fitur tanggal/waktu tertentu yang diekstraksi sebagai variabel kategori dan mewakilinya sebagai fitur yang disandikan satu kali, dengan setiap kolom berisi nilai biner. Yang baru dibuat date_quarter kolom berisi nilai antara 0-3, dan dapat dikodekan satu kali menggunakan empat kolom biner. Mari kita buat empat fitur biner baru, masing-masing mewakili kuartal yang sesuai tahun ini.

  1. Pilih + Tambahkan langkah.
  2. Pilih Enkode kategoris mengubah.
  3. Untuk Mengubah, pilih Enkode satu-panas.
  4. Untuk Kolom masukan, pilih tanggal_kuartal.
  5. Untuk Gaya keluaran, pilih Kolom.
  6. Pilih Preview.
  7. Pilih Add untuk menambahkan langkah.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

Fitur lag

Selanjutnya, mari kita buat fitur lag untuk kolom target Volume USD. Fitur lag dalam analisis deret waktu adalah nilai pada stempel waktu sebelumnya yang dianggap membantu dalam menyimpulkan nilai di masa mendatang. Mereka juga membantu mengidentifikasi autokorelasi (juga dikenal sebagai korelasi serial) pola dalam deret residual dengan mengkuantifikasi hubungan pengamatan dengan pengamatan pada langkah waktu sebelumnya. Autokorelasi mirip dengan korelasi reguler tetapi antara nilai dalam deret dan nilai masa lalunya. Ini membentuk dasar untuk model peramalan autoregressive dalam seri ARIMA.

Dengan Data Wrangler Fitur lag transformasi, Anda dapat dengan mudah membuat fitur jeda n periode terpisah. Selain itu, kami sering ingin membuat beberapa fitur lag pada lag yang berbeda dan membiarkan model memutuskan fitur yang paling berarti. Untuk skenario seperti itu, Fitur jeda transform membantu membuat beberapa kolom lag pada ukuran jendela yang ditentukan.

  1. Pilih Kembali ke aliran data.
  2. Pilih tanda plus di sebelah Tangga on Aliran data.
  3. Pilih + Tambahkan langkah.
  4. Pilih Seri waktu mengubah.
  5. Untuk Mengubah, pilih Fitur jeda.
  6. Untuk Hasilkan fitur lag untuk kolom ini, pilih Volume Rp.
  7. Untuk Kolom stempel waktu, pilih tanggal.
  8. Untuk Ketinggalan, Masuk 7.
  9. Karena kami tertarik untuk mengamati hingga tujuh nilai lag sebelumnya, mari kita pilih Sertakan seluruh jendela lag.
  10. Untuk membuat kolom baru untuk setiap nilai lag, pilih Ratakan outputnya.
  11. Pilih Preview.

Tujuh kolom baru ditambahkan, diakhiri dengan lag_number kata kunci untuk kolom target Volume USD.

Transformasi deret waktu fitur lag

  1. Pilih Add untuk menyimpan langkah.

Fitur jendela bergulir

Kami juga dapat menghitung ringkasan statistik yang bermakna di berbagai nilai dan memasukkannya sebagai fitur input. Mari mengekstrak fitur deret waktu statistik umum.

Data Wrangler mengimplementasikan kemampuan ekstraksi fitur deret waktu otomatis menggunakan sumber terbuka segar kemasan. Dengan transformasi ekstraksi fitur deret waktu, Anda dapat mengotomatiskan proses ekstraksi fitur. Ini menghilangkan waktu dan tenaga yang dihabiskan untuk mengimplementasikan perpustakaan pemrosesan sinyal secara manual. Untuk posting ini, kami mengekstrak fitur menggunakan Fitur jendela bergulir mengubah. Metode ini menghitung properti statistik di seluruh kumpulan pengamatan yang ditentukan oleh ukuran jendela.

  1. Pilih + Tambahkan langkah.
  2. Pilih Seri waktu mengubah.
  3. Untuk Mengubah, pilih Fitur jendela bergulir.
  4. Untuk Hasilkan fitur jendela bergulir untuk kolom ini, pilih Volume Rp.
  5. Untuk Kolom stempel waktu, pilih tanggal.
  6. Untuk Ukuran jendela, Masuk 7.

Menentukan ukuran jendela dari 7 menghitung fitur dengan menggabungkan nilai pada stempel waktu saat ini dan nilai untuk tujuh stempel waktu sebelumnya.

  1. Pilih Meratakan untuk membuat kolom baru untuk setiap fitur yang dihitung.
  2. Pilih strategi Anda sebagai Subset minimal.

Strategi ini mengekstrak delapan fitur yang berguna dalam analisis hilir. Strategi lainnya termasuk Subset yang Efisien, Subset khusus, dan Semua fitur. Untuk daftar lengkap fitur yang tersedia untuk ekstraksi, lihat Ikhtisar tentang fitur yang diekstraksi.

  1. Pilih Preview.

Kita dapat melihat delapan kolom baru dengan ukuran jendela yang ditentukan sebesar 7 atas nama mereka, ditambahkan ke dataset kami.

  1. Pilih Add untuk menyimpan langkah.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

Ekspor kumpulan data

Kami telah mengubah kumpulan data deret waktu dan siap menggunakan kumpulan data yang diubah sebagai masukan untuk algoritme peramalan. Langkah terakhir adalah mengekspor kumpulan data yang diubah ke Amazon S3. Di Data Wrangler, Anda dapat memilih Langkah ekspor untuk secara otomatis membuat notebook Jupyter dengan kode Pemrosesan Amazon SageMaker untuk memproses dan mengekspor kumpulan data yang diubah ke bucket S3. Namun, karena kumpulan data kami berisi lebih dari 300 catatan, mari manfaatkan Ekspor data pilihan dalam Tambahkan Transform view untuk mengekspor kumpulan data yang diubah langsung ke Amazon S3 dari Data Wrangler.

  1. Pilih Ekspor data.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

  1. Untuk Lokasi S3, pilih Browser dan pilih ember S3 Anda.
  2. Pilih Ekspor data.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.

Sekarang kita telah berhasil mengubah dataset bitcoin, kita dapat menggunakan Prakiraan Amazon untuk menghasilkan prediksi bitcoin.

Membersihkan

Jika Anda sudah selesai dengan kasus penggunaan ini, bersihkan sumber daya yang Anda buat untuk menghindari biaya tambahan. Untuk Data Wrangler, Anda dapat mematikan instance yang mendasarinya setelah selesai. Mengacu pada Matikan Data Wrangler dokumentasi untuk rincian. Atau, Anda dapat melanjutkan ke bagian 2 dari seri ini untuk menggunakan dataset ini untuk peramalan.

Kesimpulan

Posting ini menunjukkan cara memanfaatkan Data Wrangler untuk menyederhanakan dan mempercepat analisis deret waktu menggunakan kemampuan deret waktu bawaannya. Kami mengeksplorasi bagaimana ilmuwan data dapat dengan mudah dan interaktif membersihkan, memformat, memvalidasi, dan mengubah data deret waktu ke dalam format yang diinginkan, untuk analisis yang bermakna. Kami juga mengeksplorasi bagaimana Anda dapat memperkaya analisis deret waktu Anda dengan menambahkan serangkaian fitur statistik yang komprehensif menggunakan Data Wrangler. Untuk mempelajari lebih lanjut tentang transformasi deret waktu di Data Wrangler, lihat Transformasi Data.


tentang Penulis

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.Roop Bain adalah Arsitek Solusi di AWS yang berfokus pada AI/ML. Dia bersemangat membantu pelanggan berinovasi dan mencapai tujuan bisnis mereka menggunakan Kecerdasan Buatan dan Pembelajaran Mesin. Di waktu luangnya, Roop senang membaca dan mendaki.

Siapkan data deret waktu dengan Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence. Pencarian Vertikal. ai.Nikita Ivkin adalah Ilmuwan Terapan, Amazon SageMaker Data Wrangler.

Stempel Waktu:

Lebih dari Pembelajaran Mesin AWS