Amazon SageMaker memiliki mengumumkan dukungan tiga kriteria penyelesaian baru untuk Amazon SageMaker penyetelan model otomatis, memberi Anda satu set tuas tambahan untuk mengontrol kriteria penghentian pekerjaan penyetelan saat menemukan konfigurasi hyperparameter terbaik untuk model Anda.
Dalam posting ini, kami membahas kriteria penyelesaian baru ini, kapan menggunakannya, dan beberapa manfaat yang dibawanya.
Tuning model otomatis SageMaker
Penyetelan model otomatis, disebut juga penyetelan hyperparameter, menemukan versi terbaik dari model yang diukur dengan metrik yang kita pilih. Itu memutar banyak pekerjaan pelatihan pada dataset yang disediakan, menggunakan algoritme yang dipilih dan rentang hyperparameter yang ditentukan. Setiap pekerjaan pelatihan dapat diselesaikan lebih awal ketika metrik tujuan tidak meningkat secara signifikan, yang dikenal sebagai penghentian lebih awal.
Hingga saat ini, ada cara terbatas untuk mengontrol keseluruhan pekerjaan penyetelan, seperti menentukan jumlah maksimum pekerjaan pelatihan. Namun, pemilihan nilai parameter ini paling baik bersifat heuristik. Nilai yang lebih besar meningkatkan biaya penyetelan, dan nilai yang lebih kecil mungkin tidak selalu menghasilkan versi terbaik dari model tersebut.
Penyetelan model otomatis SageMaker memecahkan tantangan ini dengan memberi Anda beberapa kriteria penyelesaian untuk pekerjaan penyetelan. Ini diterapkan pada tingkat penyetelan daripada pada setiap tingkat pekerjaan pelatihan individu, yang berarti beroperasi pada lapisan abstraksi yang lebih tinggi.
Manfaat menyetel kriteria penyelesaian pekerjaan
Dengan kontrol yang lebih baik atas kapan pekerjaan penyetelan akan berhenti, Anda mendapatkan manfaat dari penghematan biaya dengan tidak menjalankan pekerjaan untuk waktu yang lama dan menjadi mahal secara komputasi. Ini juga berarti Anda dapat memastikan bahwa pekerjaan tidak berhenti terlalu dini dan Anda mendapatkan model kualitas yang cukup baik yang memenuhi tujuan Anda. Anda dapat memilih untuk menghentikan tugas penyetelan saat model tidak lagi membaik setelah serangkaian iterasi atau saat perkiraan peningkatan residual tidak sesuai dengan sumber daya dan waktu komputasi.
Selain jumlah maksimum kriteria penyelesaian pekerjaan pelatihan yang ada MaxNumberOfTrainingPekerjaan, penyetelan model otomatis memperkenalkan opsi untuk menghentikan penyetelan berdasarkan waktu penyetelan maksimum, Pemantauan peningkatan, dan deteksi konvergensi.
Mari jelajahi masing-masing kriteria ini.
Waktu penyetelan maksimum
Sebelumnya, Anda memiliki opsi untuk menentukan jumlah maksimum tugas pelatihan sebagai pengaturan batas sumber daya untuk mengontrol anggaran penyetelan dalam hal sumber daya komputasi. Namun, hal ini dapat menyebabkan waktu pelatihan yang lebih lama atau lebih pendek dari yang dibutuhkan atau diinginkan.
Dengan penambahan kriteria waktu penyetelan maksimum, kini Anda dapat mengalokasikan anggaran pelatihan Anda dalam hal jumlah waktu untuk menjalankan pekerjaan penyetelan dan menghentikan pekerjaan secara otomatis setelah jangka waktu tertentu yang ditentukan dalam detik.
Seperti yang terlihat di atas, kita menggunakan MaxRuntimeInSeconds
untuk menentukan waktu penyetelan dalam hitungan detik. Menetapkan batas waktu penyetelan membantu Anda membatasi durasi tugas penyetelan dan juga perkiraan biaya eksperimen.
Total biaya sebelum diskon kontrak dapat diperkirakan dengan rumus berikut:EstimatedComputeSeconds= MaxRuntimeInSeconds * MaxParallelTrainingJobs * InstanceCost
Waktu proses maksimum dalam hitungan detik dapat digunakan untuk mengikat biaya dan waktu proses. Dengan kata lain, ini adalah kriteria penyelesaian kontrol anggaran.
Fitur ini merupakan bagian dari kriteria kontrol sumber daya dan tidak memperhitungkan konvergensi model. Seperti yang kita lihat nanti di posting ini, kriteria ini dapat digunakan dalam kombinasi dengan kriteria penghentian lainnya untuk mencapai pengendalian biaya tanpa mengorbankan akurasi.
Metrik target yang diinginkan
Kriteria lain yang diperkenalkan sebelumnya adalah untuk menentukan target sasaran di muka. Kriteria memantau kinerja model terbaik berdasarkan metrik tujuan tertentu dan menghentikan penyetelan saat model mencapai ambang batas yang ditentukan terkait dengan metrik tujuan tertentu.
Dengan TargetObjectiveMetricValue
kriteria, kita dapat menginstruksikan SageMaker untuk menghentikan penyetelan model setelah metrik objektif dari model terbaik mencapai nilai yang ditentukan:
Dalam contoh ini, kami menginstruksikan SageMaker untuk menghentikan penyetelan model saat metrik objektif model terbaik telah mencapai 0.95.
Metode ini berguna ketika Anda memiliki target spesifik yang ingin dicapai oleh model Anda, seperti tingkat akurasi, presisi, daya ingat, skor F1, AUC, log-loss tertentu, dan sebagainya.
Kasus penggunaan tipikal untuk kriteria ini adalah untuk pengguna yang sudah terbiasa dengan performa model pada ambang batas yang diberikan. Pengguna dalam fase eksplorasi pertama-tama dapat menyetel model dengan subset kecil dari set data yang lebih besar untuk mengidentifikasi ambang metrik evaluasi yang memuaskan untuk ditargetkan saat pelatihan dengan set data lengkap.
Pemantauan perbaikan
Kriteria ini memantau konvergensi model setelah setiap iterasi dan menghentikan penyetelan jika model tidak membaik setelah sejumlah tugas pelatihan yang ditentukan. Lihat konfigurasi berikut:
Dalam hal ini kita mengatur MaxNumberOfTrainingJobsNotImproving
hingga 10, yang berarti jika metrik tujuan berhenti meningkat setelah 10 tugas pelatihan, penyetelan akan dihentikan dan model dan metrik terbaik akan dilaporkan.
Pemantauan peningkatan harus digunakan untuk menyesuaikan tradeoff antara kualitas model dan durasi alur kerja keseluruhan dengan cara yang kemungkinan dapat dialihkan antara masalah pengoptimalan yang berbeda.
Deteksi konvergensi
Deteksi konvergensi adalah kriteria penyelesaian yang memungkinkan penyetelan model otomatis memutuskan kapan harus menghentikan penyetelan. Umumnya, penyetelan model otomatis akan menghentikan penyetelan ketika diperkirakan tidak ada peningkatan signifikan yang dapat dicapai. Lihat konfigurasi berikut:
Kriteria ini paling sesuai ketika Anda awalnya tidak tahu pengaturan penghentian apa yang harus dipilih.
Ini juga berguna jika Anda tidak tahu metrik tujuan target apa yang masuk akal untuk prediksi yang baik mengingat masalah dan kumpulan data yang ada, dan lebih suka menyelesaikan pekerjaan penyetelan saat tidak lagi membaik.
Percobaan dengan perbandingan kriteria penyelesaian
Dalam percobaan ini, diberi tugas regresi, kami menjalankan 3 percobaan penyetelan untuk menemukan model optimal dalam ruang pencarian 2 hyperparameter yang memiliki total 200 konfigurasi hyperparameter menggunakan kumpulan data pemasaran langsung.
Dengan segala sesuatunya dianggap sama, model pertama disetel dengan BestObjectiveNotImproving
kriteria penyelesaian, model kedua disetel dengan CompleteOnConvergence
dan model ketiga disetel tanpa kriteria penyelesaian yang ditentukan.
Saat menjelaskan setiap pekerjaan, kita dapat mengamati pengaturan itu BestObjectiveNotImproving
kriteria telah menghasilkan sumber daya dan waktu yang paling optimal dibandingkan dengan metrik objektif dengan pekerjaan yang dijalankan secara signifikan lebih sedikit.
Grafik CompleteOnConvergence
kriteria juga dapat menghentikan penyetelan di tengah percobaan sehingga menghasilkan lebih sedikit tugas pelatihan dan waktu pelatihan lebih pendek dibandingkan dengan tidak menetapkan kriteria.
Meskipun tidak menetapkan kriteria penyelesaian menghasilkan eksperimen yang mahal, mendefinisikan MaxRuntimeInSeconds
sebagai bagian dari batas sumber daya akan menjadi salah satu cara untuk meminimalkan biaya.
Hasil di atas menunjukkan bahwa saat menentukan kriteria penyelesaian, Amazon SageMaker dapat menghentikan proses penyetelan secara cerdas saat mendeteksi bahwa model cenderung tidak meningkat melebihi hasil saat ini.
Perhatikan bahwa kriteria penyelesaian yang didukung dalam penyetelan model otomatis SageMaker tidak eksklusif satu sama lain dan dapat digunakan secara bersamaan saat menyetel model.
Ketika lebih dari satu kriteria penyelesaian ditentukan, pekerjaan penyetelan selesai ketika salah satu kriteria terpenuhi.
Misalnya, kombinasi kriteria batas sumber daya seperti waktu penyetelan maksimum dengan kriteria konvergensi, seperti pemantauan peningkatan atau deteksi konvergensi, dapat menghasilkan pengendalian biaya yang optimal dan metrik objektif yang optimal.
Kesimpulan
Dalam postingan ini, kita membahas bagaimana Anda sekarang dapat menghentikan pekerjaan penyetelan secara cerdas dengan memilih serangkaian kriteria penyelesaian yang baru diperkenalkan di SageMaker, seperti waktu penyetelan maksimum, pemantauan peningkatan, atau deteksi konvergensi.
Kami mendemonstrasikan dengan eksperimen bahwa penghentian cerdas berdasarkan pengamatan peningkatan di seluruh iterasi dapat menghasilkan anggaran yang dioptimalkan secara signifikan dan manajemen waktu dibandingkan dengan tidak menentukan kriteria penyelesaian.
Kami juga menunjukkan bahwa kriteria ini tidak eksklusif satu sama lain dan dapat digunakan bersamaan saat menyetel model, untuk memanfaatkan keduanya, kontrol anggaran dan konvergensi optimal.
Untuk detail selengkapnya tentang cara mengonfigurasi dan menjalankan penyetelan model otomatis, lihat Tentukan Pengaturan Pekerjaan Tuning Hyperparameter.
Tentang Penulis
Doug Mbaya adalah arsitek Solusi Mitra Senior dengan fokus pada data dan analitik. Doug bekerja sama dengan mitra AWS, membantu mereka mengintegrasikan solusi data dan analitik di cloud.
Chaitra Mathur adalah Arsitek Solusi Utama di AWS. Dia memandu pelanggan dan mitra dalam membangun solusi yang sangat skalabel, andal, aman, dan hemat biaya di AWS. Dia bersemangat tentang Pembelajaran Mesin dan membantu pelanggan menerjemahkan kebutuhan ML mereka menjadi solusi menggunakan layanan AWS AI/ML. Dia memegang 5 sertifikasi termasuk sertifikasi ML Specialty. Di waktu luangnya, ia senang membaca, yoga, dan menghabiskan waktu bersama putri-putrinya.
Iaroslav Shcherbatyi adalah Insinyur Pembelajaran Mesin di AWS. Dia bekerja terutama pada peningkatan platform Amazon SageMaker dan membantu pelanggan menggunakan fitur-fiturnya dengan sebaik-baiknya. Di waktu luangnya, dia suka pergi ke gym, melakukan olahraga luar ruangan seperti seluncur es atau hiking, dan mengejar penelitian AI baru.
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- Platoblockchain. Intelijen Metaverse Web3. Pengetahuan Diperkuat. Akses Di Sini.
- Sumber: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-automatic-model-tuning-now-supports-three-new-completion-criteria-for-hyperparameter-optimization/
- 10
- 100
- 11
- 7
- 9
- a
- Sanggup
- Tentang Kami
- atas
- Akun
- ketepatan
- Mencapai
- dicapai
- di seluruh
- tambahan
- Tambahan
- Keuntungan
- Setelah
- AI
- ai penelitian
- AI / ML
- algoritma
- Semua
- sudah
- Amazon
- Amazon SageMaker
- jumlah
- analisis
- dan
- terapan
- secara otomatis
- secara otomatis
- AWS
- berdasarkan
- sebelum
- makhluk
- manfaat
- Manfaat
- TERBAIK
- Lebih baik
- antara
- Luar
- Terikat
- membawa
- anggaran belanja
- Bangunan
- bernama
- kasus
- gulat
- tertentu
- Sertifikasi
- sertifikasi
- tantangan
- Pilih
- terpilih
- rapat
- awan
- kombinasi
- dibandingkan
- perbandingan
- lengkap
- Lengkap
- Selesaikan
- penyelesaian
- menghitung
- konfigurasi
- kontrol
- Konvergensi
- Biaya
- penghematan biaya
- hemat biaya
- Biaya
- bisa
- kriteria
- terbaru
- pelanggan
- data
- didefinisikan
- mendefinisikan
- menunjukkan
- diinginkan
- rincian
- Deteksi
- berbeda
- Diskon
- membahas
- dibahas
- Tidak
- Dont
- setiap
- Awal
- diaktifkan
- insinyur
- memastikan
- diperkirakan
- perkiraan
- evaluasi
- segala sesuatu
- contoh
- Eksklusif
- ada
- mahal
- eksperimen
- eksplorasi
- menyelidiki
- akrab
- Fitur
- Fitur
- Menemukan
- temuan
- menemukan
- Pertama
- Fokus
- berikut
- rumus
- penuh
- umumnya
- mendapatkan
- diberikan
- Pemberian
- Go
- tujuan
- baik
- Panduan
- ruang olahraga
- memiliki
- membantu
- membantu
- lebih tinggi
- sangat
- memegang
- Seterpercayaapakah Olymp Trade? Kesimpulan
- How To
- Namun
- HTML
- HTTPS
- Optimalisasi Hyperparameter
- Penyesuaian Hyperparameter
- ES
- mengenali
- memperbaiki
- perbaikan
- perbaikan
- meningkatkan
- in
- Di lain
- Termasuk
- Meningkatkan
- sendiri-sendiri
- mulanya
- mengintegrasikan
- Cerdas
- diperkenalkan
- Memperkenalkan
- IT
- perulangan
- iterasi
- Pekerjaan
- Jobs
- Tahu
- dikenal
- lebih besar
- lapisan
- memimpin
- pengetahuan
- Dipimpin
- Lets
- Tingkat
- Mungkin
- MEMBATASI
- Terbatas
- lagi
- mesin
- Mesin belajar
- pengelolaan
- banyak
- Marketing
- max
- Maksimalkan
- maksimum
- cara
- Memenuhi
- metode
- metrik
- Metrik
- meminimalkan
- ML
- model
- model
- pemantauan
- monitor
- lebih
- paling
- beberapa
- saling
- kebutuhan
- New
- jumlah
- tujuan
- target
- mengamati
- ONE
- beroperasi
- optimal
- optimasi
- dioptimalkan
- pilihan
- Lainnya
- secara keseluruhan
- parameter
- bagian
- pasangan
- rekan
- bergairah
- prestasi
- periode
- tahap
- Platform
- plato
- Kecerdasan Data Plato
- Data Plato
- Pos
- Ketelitian
- ramalan
- sebelumnya
- Utama
- Masalah
- masalah
- proses
- menghasilkan
- diproyeksikan
- disediakan
- menyediakan
- kualitas
- mencapai
- tercapai
- Bacaan
- masuk akal
- hubungan
- dapat diandalkan
- Dilaporkan
- penelitian
- sumber
- Sumber
- mengakibatkan
- dihasilkan
- Hasil
- Run
- berkorban
- pembuat bijak
- Penyetelan Model Otomatis SageMaker
- Tabungan
- terukur
- Pencarian
- Kedua
- detik
- aman
- memilih
- seleksi
- senior
- Layanan
- set
- pengaturan
- pengaturan
- harus
- Menunjukkan
- penting
- signifikan
- kecil
- lebih kecil
- So
- larutan
- Solusi
- Memecahkan
- beberapa
- Space
- Khusus
- tertentu
- ditentukan
- Pengeluaran
- berputar
- Olahraga
- berhenti
- terhenti
- henti
- Berhenti
- seperti itu
- mendukung
- Didukung
- Mendukung
- Mengambil
- target
- tugas
- istilah
- Grafik
- mereka
- Ketiga
- tiga
- ambang
- Melalui
- waktu
- kali
- untuk
- terlalu
- Total
- Pelatihan
- menterjemahkan
- khas
- menggunakan
- gunakan case
- Pengguna
- pengesahan
- nilai
- versi
- cara
- Apa
- yang
- SIAPA
- akan
- dalam
- tanpa
- kata
- bekerja
- akan
- Menghasilkan
- Yoga
- Kamu
- Anda
- zephyrnet.dll