Tingkatkan Produktivitas Pengembang ML Dengan Bobot & Bias: Contoh Computer Vision Di Amazon SageMaker

Diterbitkan Ulang Oleh Plato

Followers: 0

Konten dan opini dalam posting ini adalah milik penulis pihak ketiga dan AWS tidak bertanggung jawab atas konten atau keakuratan posting ini.

Karena semakin banyak organisasi menggunakan teknik pembelajaran mendalam seperti visi komputer dan pemrosesan bahasa alami, persona pengembang pembelajaran mesin (ML) membutuhkan alat yang dapat diskalakan seputar pelacakan eksperimen, garis keturunan, dan kolaborasi. Pelacakan eksperimen mencakup metadata seperti sistem operasi, infrastruktur yang digunakan, pustaka, dan set data masukan dan keluaran—seringkali dilacak pada spreadsheet secara manual. Lineage melibatkan pelacakan kumpulan data, transformasi, dan algoritme yang digunakan untuk membuat model ML. Kolaborasi mencakup pengembang ML yang mengerjakan satu proyek dan juga pengembang ML yang membagikan hasil mereka ke seluruh tim dan pemangku kepentingan bisnis—proses yang biasa dilakukan melalui email, tangkapan layar, dan presentasi PowerPoint.

Dalam posting ini, kami melatih model untuk mengidentifikasi objek untuk kasus penggunaan kendaraan otonom menggunakan Bobot & Bias (W&B) dan Amazon SageMaker. Kami menunjukkan bagaimana solusi bersama mengurangi pekerjaan manual untuk pengembang ML, menciptakan lebih banyak transparansi dalam proses pengembangan model, dan memungkinkan tim untuk berkolaborasi dalam proyek.

Kami menjalankan contoh ini di Studio Amazon SageMaker untuk Anda coba sendiri.

Ikhtisar Bobot & Bias

Bobot & Bias membantu tim ML membuat model yang lebih baik dengan lebih cepat. Hanya dengan beberapa baris kode di notebook SageMaker, Anda dapat langsung men-debug, membandingkan, dan mereproduksi model—arsitektur, hyperparameter, git commit, bobot model, penggunaan GPU, set data, dan prediksi—semuanya sambil berkolaborasi dengan rekan tim Anda.

W&B dipercaya oleh lebih dari 200,000 praktisi ML dari beberapa perusahaan dan organisasi penelitian paling inovatif di dunia. Untuk mencobanya secara gratis, daftar di Bobot & Bias, Atau kunjungi Daftar W&B AWS Marketplace.

Memulai SageMaker Studio

SageMaker Studio adalah lingkungan pengembangan terintegrasi penuh (IDE) pertama untuk ML. Studio menyediakan antarmuka berbasis web tunggal tempat praktisi ML dan ilmuwan data dapat membangun, melatih, dan menerapkan model dengan beberapa klik, semuanya di satu tempat.

Untuk memulai dengan Studio, Anda memerlukan akun AWS dan Identitas AWS dan Manajemen Akses (IAM) pengguna atau peran dengan izin untuk membuat domain Studio. Mengacu pada Masuk ke Domain Amazon SageMaker untuk membuat domain, dan dokumentasi studio untuk ikhtisar tentang penggunaan antarmuka visual Studio dan notebook.

Mengatur lingkungan

Untuk posting ini, kami tertarik untuk menjalankan kode kami sendiri, jadi mari impor beberapa notebook dari GitHub. Kami menggunakan yang berikut ini: GitHub repo sebagai contoh, jadi mari kita memuat notebook ini.

Anda dapat mengkloning repositori baik melalui terminal atau UI Studio. Untuk mengkloning repositori melalui terminal, buka terminal sistem (pada File menu, pilih New dan terminal) dan masukkan perintah berikut:

git clone https://github.com/wandb/SageMakerStudio

Untuk mengkloning repositori dari UI Studio, lihat Mengkloning Repositori Git di SageMaker Studio.

Untuk memulai, pilih 01_data_pemrosesan.ipynb buku catatan. Anda diminta dengan prompt pengalih kernel. Contoh ini menggunakan PyTorch, jadi kita bisa memilih yang sudah dibuat sebelumnya PyTorch 1.10 Python 3.8 GPU dioptimalkan gambar untuk memulai notebook kita. Anda dapat melihat aplikasi dimulai, dan ketika kernel sudah siap, itu menunjukkan jenis instans dan kernel di kanan atas notebook Anda.

Notebook kami membutuhkan beberapa dependensi tambahan. Repositori ini menyediakan requirements.txt dengan dependensi tambahan. Jalankan sel pertama untuk menginstal dependensi yang diperlukan:

%pip install -r requirements.txt

Anda juga dapat membuat konfigurasi siklus hidup untuk menginstal paket secara otomatis setiap kali Anda memulai aplikasi PyTorch. Melihat Kustomisasi Amazon SageMaker Studio menggunakan Konfigurasi Siklus Hidup untuk instruksi dan contoh implementasi.

Gunakan Bobot & Bias di SageMaker Studio

Bobot & Bias (wandb) adalah pustaka Python standar. Setelah diinstal, semudah menambahkan beberapa baris kode ke skrip pelatihan Anda dan Anda siap untuk mencatat eksperimen. Kami telah menginstalnya melalui file requirements.txt kami. Anda juga dapat menginstalnya secara manual dengan kode berikut:

! pip install wandb

Studi kasus: Segmentasi semantik kendaraan otonom

Dataset

Kami menggunakan Database Video Berlabel yang Mengemudi Cambridge (CamVid) untuk contoh ini. Ini berisi kumpulan video dengan label semantik kelas objek, lengkap dengan metadata. Basis data menyediakan label kebenaran dasar yang mengaitkan setiap piksel dengan salah satu dari 32 kelas semantik. Kami dapat membuat versi dataset kami sebagai tongkat.Artefak, dengan begitu kita bisa mereferensikannya nanti. Lihat kode berikut:

with wandb.init(project="sagemaker_camvid_demo", job_type="upload"): artifact = wandb.Artifact( name='camvid-dataset', type='dataset', metadata={ "url": 'https://s3.amazonaws.com/fast-ai-imagelocal/camvid.tgz', "class_labels": class_labels }, description="The Cambridge-driving Labeled Video Database (CamVid) is the first collection of videos with object class semantic labels, complete with metadata. The database provides ground truth labels that associate each pixel with one of 32 semantic classes." ) artifact.add_dir(path) wandb.log_artifact(artifact)

Anda dapat mengikuti di 01_data_pemrosesan.ipynb buku catatan.

Kami juga mencatat tabel dari kumpulan data. Tabel adalah entitas seperti DataFrame yang kaya dan kuat yang memungkinkan Anda untuk membuat kueri dan menganalisis data tabular. Anda dapat memahami set data Anda, memvisualisasikan prediksi model, dan berbagi wawasan di dasbor pusat.

Tabel Bobot & Bias mendukung banyak format media kaya, seperti gambar, audio, dan bentuk gelombang. Untuk daftar lengkap format media, lihat Jenis Data.

Tangkapan layar berikut menunjukkan tabel dengan gambar mentah dengan segmentasi kebenaran dasar. Anda juga dapat melihat versi interaktif dari tabel ini.

Tingkatkan produktivitas pengembang ML dengan Bobot & Bias: Contoh visi komputer di Amazon SageMaker PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Latih model

Sekarang kita dapat membuat model dan melatihnya pada dataset kita. Kita gunakan PyTorch dan cepat untuk membuat prototipe garis dasar dengan cepat dan kemudian menggunakan wandb.Sweeps untuk mengoptimalkan hyperparameter kami. Ikuti bersama di 02_semantic_segmentation.ipynb buku catatan. Saat diminta untuk kernel saat membuka notebook, pilih kernel yang sama dari notebook pertama kami, PyTorch 1.10 Python 3.8 GPU dioptimalkan. Paket Anda sudah terinstal karena Anda menggunakan aplikasi yang sama.

Model seharusnya mempelajari anotasi per-piksel dari adegan yang diambil dari sudut pandang agen otonom. Model perlu mengkategorikan atau mengelompokkan setiap piksel dari pemandangan tertentu ke dalam 32 kategori yang relevan, seperti jalan, pejalan kaki, trotoar, atau mobil. Anda dapat memilih salah satu gambar tersegmentasi pada tabel dan mengakses antarmuka interaktif ini untuk mengakses hasil dan kategori segmentasi.

Karena cepat perpustakaan memiliki integrasi dengan wandb, Anda cukup melewati WandbCallback kepada Pembelajar:

from fastai.callback.wandb import WandbCallback loss_func=FocalLossFlat(axis=1)
model = SegmentationModel(backbone, hidden_dim, num_classes=num_classes)
wandb_callback = WandbCallback(log_preds=True) learner = Learner( data_loader, model, loss_func=loss_func, metrics=metrics, cbs=[wandb_callback], ) learn.fit_one_cycle(TRAIN_EPOCHS, LEARNING_RATE)

Untuk eksperimen dasar, kami memutuskan untuk menggunakan arsitektur sederhana yang terinspirasi oleh UNet kertas dengan tulang punggung yang berbeda dari timm. Kami melatih model kami dengan Kehilangan Fokus sebagai kriteria. Dengan Bobot & Bias, Anda dapat dengan mudah membuat dasbor dengan ringkasan eksperimen Anda untuk menganalisis hasil pelatihan dengan cepat, seperti yang ditunjukkan pada tangkapan layar berikut. Anda juga bisa lihat dasbor ini secara interaktif.

Pencarian hyperparameter dengan sapuan

Untuk meningkatkan kinerja model baseline, kita perlu memilih model terbaik dan set hyperparameter terbaik untuk dilatih. W&B memudahkan kami menggunakannya menyapu.

Kami melakukan Pencarian hyperparameter Bayesian dengan tujuan memaksimalkan akurasi latar depan model pada dataset validasi. Untuk melakukan sweep, kita mendefinisikan file konfigurasi sweep.yaml. Di dalam file ini, kami meneruskan metode yang diinginkan untuk digunakan: bayes dan parameter serta nilai terkaitnya untuk dicari. Dalam kasus kami, kami mencoba berbagai tulang punggung, ukuran batch, dan fungsi kerugian. Kami juga mengeksplorasi parameter pengoptimalan yang berbeda seperti kecepatan pembelajaran dan penurunan berat badan. Karena ini adalah nilai kontinu, kami mengambil sampel dari distribusi. Ada banyak opsi konfigurasi tersedia untuk sapuan.

program: train.py
project: sagemaker_camvid_demo
method: bayes
metric: name: foreground_acc goal: maximize
early_terminate: type: hyperband min_iter: 5
parameters: backbone: values: ["mobilenetv2_100","mobilenetv3_small_050","mobilenetv3_large_100","resnet18","resnet34","resnet50","vgg19"] batch_size: values: [8, 16] image_resize_factor: value: 4 loss_function: values: ["categorical_cross_entropy", "focal", "dice"] learning_rate: distribution: uniform min: 1e-5 max: 1e-2 weight_decay: distribution: uniform min: 0.0 max: 0.05

Setelah itu, di terminal, Anda meluncurkan sapuan menggunakan baris perintah wandb:

$ wandb sweep sweep.yaml —-project="sagemaker_camvid_demo"

Dan kemudian luncurkan agen penyapu pada mesin ini dengan kode berikut:

$ wandb agent <sweep_id>

Ketika penyapuan selesai, kita dapat menggunakan plot koordinat paralel untuk mengeksplorasi kinerja model dengan berbagai tulang punggung dan set hyperparameter yang berbeda. Berdasarkan itu, kita dapat melihat model mana yang berkinerja terbaik.

Tangkapan layar berikut menunjukkan hasil sapuan, termasuk grafik koordinat paralel dan grafik korelasi parameter. Anda juga bisa lihat dasbor sapuan ini secara interaktif.

Kami dapat memperoleh wawasan kunci berikut dari sapuan:

Tingkat pembelajaran yang lebih rendah dan peluruhan bobot yang lebih rendah menghasilkan akurasi latar depan dan skor Dadu yang lebih baik.
Ukuran batch memiliki korelasi positif yang kuat dengan metrik.
Grafik Tulang punggung berbasis VGG mungkin bukan pilihan yang baik untuk melatih model akhir kami karena mereka cenderung menghasilkan a gradien hilang. (Mereka disaring saat kerugiannya menyimpang.)
Grafik ResNet tulang punggung menghasilkan kinerja keseluruhan terbaik sehubungan dengan metrik.
Tulang punggung ResNet34 atau ResNet50 harus dipilih untuk model akhir karena kinerjanya yang kuat dalam hal metrik.

Data dan silsilah model

Artefak W&B dirancang untuk memudahkan versi set data dan model Anda, terlepas dari apakah Anda ingin menyimpan file Anda dengan W&B atau apakah Anda sudah memiliki bucket yang ingin dilacak oleh W&B. Setelah Anda melacak set data atau file model, W&B secara otomatis mencatat setiap modifikasi, memberi Anda riwayat perubahan yang lengkap dan dapat diaudit pada file Anda.

Dalam kasus kami, kumpulan data, model, dan tabel berbeda yang dihasilkan selama pelatihan dicatat ke ruang kerja. Anda dapat dengan cepat melihat dan memvisualisasikan silsilah ini dengan membuka Artefak .

Tingkatkan produktivitas pengembang ML dengan Bobot & Bias: Contoh visi komputer di Amazon SageMaker PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Menafsirkan prediksi model

Bobot & Bias sangat berguna saat menilai kinerja model dengan menggunakan kekuatan wandb.Tabel untuk memvisualisasikan di mana model kami berkinerja buruk. Dalam hal ini, kami sangat tertarik untuk mendeteksi pengguna yang rentan seperti sepeda dan pejalan kaki.

Kami mencatat topeng yang diprediksi bersama dengan koefisien skor Dadu per kelas ke dalam tabel. Kami kemudian memfilter berdasarkan baris yang berisi kelas yang diinginkan dan diurutkan berdasarkan urutan menaik pada skor Dadu.

Pada tabel berikut, pertama-tama kita filter dengan memilih di mana skor Dadu positif (pejalan kaki ada di gambar). Kemudian kami mengurutkan dalam urutan menaik untuk mengidentifikasi pejalan kaki kami yang terdeteksi paling buruk. Ingatlah bahwa skor Dadu yang sama dengan 1 berarti mengelompokkan kelas pejalan kaki dengan benar. Anda juga bisa lihat tabel ini secara interaktif.

Tingkatkan produktivitas pengembang ML dengan Bobot & Bias: Contoh visi komputer di Amazon SageMaker PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Kita dapat mengulangi analisis ini dengan kelas rentan lainnya, seperti sepeda atau lampu lalu lintas.

Fitur ini adalah cara yang sangat baik untuk mengidentifikasi gambar yang tidak diberi label dengan benar dan menandainya untuk dianotasi ulang.

Kesimpulan

Posting ini memamerkan platform Weights & Biases MLOps, cara mengatur W&B di SageMaker Studio, dan cara menjalankan notebook pengantar pada solusi bersama. Kami kemudian menjalankan kasus penggunaan segmentasi semantik kendaraan otonom dan mendemonstrasikan pelatihan pelacakan berjalan dengan eksperimen W&B, optimasi hyperparameter menggunakan sapuan W&B, dan menafsirkan hasil dengan tabel W&B.

Jika Anda tertarik untuk mempelajari lebih lanjut, Anda dapat mengakses siaran langsung Laporan W&B. Untuk mencoba Bobot & Bias secara gratis, daftar di Bobot & Bias, Atau kunjungi Daftar W&B AWS Marketplace.

Tentang Penulis

Thomas Capelle adalah Insinyur Pembelajaran Mesin di Bobot dan Bias. Dia bertanggung jawab untuk menjaga repositori www.github.com/wandb/examples tetap hidup dan mutakhir. Dia juga membangun konten di MLOPS, aplikasi W&B untuk industri, dan pembelajaran mendalam yang menyenangkan secara umum. Sebelumnya dia menggunakan pembelajaran mendalam untuk memecahkan peramalan jangka pendek untuk energi matahari. Dia memiliki latar belakang Perencanaan Kota, Optimalisasi Kombinatorial, Ekonomi Transportasi, dan Matematika Terapan.

Durga Surya adalah Arsitek Solusi ML di tim SA Amazon SageMaker Service. Dia bersemangat membuat pembelajaran mesin dapat diakses oleh semua orang. Selama 3 tahun di AWS, dia telah membantu menyiapkan platform AI/ML untuk pelanggan perusahaan. Ketika dia tidak bekerja, dia suka naik sepeda motor, novel misteri, dan jalan-jalan dengan huskynya yang berusia empat tahun.

Karthik Bharathy adalah pemimpin produk untuk Amazon SageMaker dengan lebih dari satu dekade manajemen produk, strategi produk, eksekusi, dan pengalaman peluncuran.

Stempel Waktu: Juni 24, 2022

Stempel Waktu: Oktober 27, 2022

Diterbitkan Ulang Oleh Plato

Bangun sistem peringatan real-time berbasis berita dengan Twitter, Amazon SageMaker, dan Hugging Face

Meningkatkan stabilitas dan fleksibilitas pipeline ML di Amazon Packaging Innovation dengan Amazon SageMaker Pipelines

AWS Panorama sekarang mendukung NVIDIA JetPack SDK 4.6.2

Tingkatkan kinerja harga pelatihan model Anda menggunakan klaster heterogen Amazon SageMaker

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun