Bangun Model Klasifikasi Gambar Berkinerja Tinggi Menggunakan Amazon SageMaker JumpStart

Diterbitkan Ulang Oleh Plato

Followers: 0

Klasifikasi gambar adalah teknik pembelajaran mesin (ML) berbasis visi komputer yang memungkinkan Anda mengklasifikasikan gambar. Beberapa contoh klasifikasi gambar yang terkenal termasuk mengklasifikasikan angka tulisan tangan, klasifikasi citra medis, dan pengenalan wajah. Klasifikasi citra adalah teknik yang berguna dengan beberapa aplikasi bisnis, tetapi membangun model klasifikasi citra yang baik tidaklah mudah.

Beberapa pertimbangan dapat berperan saat mengevaluasi model ML. Di luar akurasi model, metrik potensial penting lainnya adalah waktu pelatihan model dan waktu inferensi. Mengingat sifat iteratif pengembangan model ML, waktu pelatihan yang lebih cepat memungkinkan data scientist untuk menguji berbagai hipotesis dengan cepat. Inferensi yang lebih cepat dapat menjadi sangat penting dalam aplikasi waktu nyata.

Mulai Lompatan Amazon SageMaker menyediakan penyetelan halus sekali klik dan penerapan berbagai model terlatih di seluruh tugas ML populer, serta pilihan solusi end-to-end yang memecahkan masalah bisnis umum. Fitur-fitur ini menghilangkan beban berat dari setiap langkah proses ML, membuatnya lebih mudah untuk mengembangkan model berkualitas tinggi dan mengurangi waktu penerapan. API JumpStart memungkinkan Anda menerapkan dan menyempurnakan secara terprogram banyak pilihan model pra-terlatih yang didukung JumpStart pada kumpulan data Anda sendiri.

Anda dapat melatih dan menyempurnakan model ML yang ditawarkan di JumpStart secara bertahap sebelum penerapan. Pada saat penulisan, 87 model klasifikasi gambar berbasis pembelajaran mendalam tersedia di JumpStart.

Tapi model mana yang akan memberi Anda hasil terbaik? Dalam posting ini, kami menyajikan metodologi untuk menjalankan beberapa model dengan mudah dan membandingkan hasilnya pada tiga dimensi minat: akurasi model, waktu pelatihan, dan waktu inferensi.

Ikhtisar solusi

JumpStart memungkinkan Anda melatih, menyetel, dan menerapkan model baik dari konsol JumpStart menggunakan UI-nya atau dengan API-nya. Dalam posting ini, kami menggunakan rute API, dan menyajikan notebook dengan berbagai skrip pembantu. Anda dapat menjalankan notebook ini dan mendapatkan hasil untuk perbandingan model ini dengan mudah satu sama lain, lalu memilih model yang paling sesuai dengan kebutuhan bisnis Anda dalam hal akurasi model, waktu pelatihan, dan waktu inferensi.

Grafik kumpulan data publik digunakan dalam posting ini terdiri dari hampir 55,000 gambar daun tanaman sakit dan sehat yang dikumpulkan dalam kondisi terkontrol, dengan label kelas mulai dari 0–38. Dataset ini dibagi menjadi dataset pelatihan dan validasi, dengan sekitar 44,000 dalam pelatihan dan 11,000 gambar dalam validasi. Berikut ini adalah beberapa contoh gambar.

Untuk latihan ini, kami memilih model dari dua framework—PyTorch dan TensorFlow—seperti yang ditawarkan oleh JumpStart. 15 algoritme model berikut mencakup berbagai arsitektur jaringan saraf populer dari kerangka kerja ini:

pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

Kami menggunakan modelnya tensorflow-ic-imagenet-inception-v3-classification-4-FT sebagai dasar untuk membandingkan hasil dari model lain. Model dasar ini dipilih secara sewenang-wenang.

Kode yang digunakan untuk menjalankan perbandingan ini tersedia di AWS Contoh Repo GitHub.

Hasil

Di bagian ini, kami menyajikan hasil dari 15 putaran ini. Untuk semua proses ini, hyperparameter yang digunakan adalah zaman = 5, tingkat pembelajaran = 0.001, ukuran batch = 16.

Akurasi model, waktu pelatihan, dan waktu inferensi dari model tensorflow-ic-imagenet-inception-v3-classification-4-FT diambil sebagai dasar, dan hasil dari semua model lainnya disajikan relatif terhadap model dasar ini. Tujuan kami di sini bukan untuk menunjukkan model mana yang terbaik, melainkan untuk menunjukkan bagaimana, melalui JumpStart API, Anda dapat membandingkan hasil dari berbagai model, lalu memilih model yang paling sesuai dengan kasus penggunaan Anda.

Tangkapan layar berikut menyoroti model dasar yang dibandingkan dengan semua model lainnya.

Plot berikut menunjukkan tampilan detail akurasi relatif vs. waktu pelatihan relatif. Model PyTorch diberi kode warna merah dan model TensorFlow berwarna biru.

Model yang disorot dengan elips hijau di plot sebelumnya tampaknya memiliki kombinasi akurasi relatif yang baik dan waktu pelatihan relatif rendah. Tabel berikut memberikan detail lebih lanjut tentang ketiga model ini.

Model Nama	Akurasi Relatif	Waktu Pelatihan Relatif
tensorflow-ic-imagenet-mobilenet-v2-050-224-klasifikasi-4-FT	1.01	0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-klasifikasi-4-FT	1.02	0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-klasifikasi-1-FT	1.04	1.16

Plot berikut membandingkan akurasi relatif vs. waktu inferensi relatif. Model PyTorch diberi kode warna merah dan model TensorFlow berwarna biru.

Tabel berikut memberikan rincian tentang tiga model elips hijau.

Model Nama	Akurasi Relatif	Waktu Inferensi Relatif
tensorflow-ic-imagenet-mobilenet-v2-050-224-klasifikasi-4-FT	1.01	0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-klasifikasi-4-FT	1.02	0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-klasifikasi-1-FT	1.04	1.43

Kedua plot dengan jelas menunjukkan bahwa algoritma model tertentu bekerja lebih baik daripada yang lain pada tiga dimensi yang dipilih. Fleksibilitas yang ditawarkan melalui latihan ini dapat membantu Anda memilih algoritme yang tepat, dan dengan menggunakan notebook yang disediakan, Anda dapat dengan mudah menjalankan jenis eksperimen ini di salah satu dari 87 model yang tersedia.

Kesimpulan

Dalam postingan ini, kami menunjukkan cara menggunakan JumpStart untuk membuat model klasifikasi gambar berperforma tinggi pada beberapa dimensi yang diminati, seperti akurasi model, waktu pelatihan, dan latensi inferensi. Kami juga menyediakan kode untuk menjalankan latihan ini pada kumpulan data Anda sendiri; Anda dapat memilih model yang menarik dari 87 model yang saat ini tersedia untuk klasifikasi gambar di pusat model JumpStart. Kami mendorong Anda untuk mencobanya hari ini.

Untuk detail lebih lanjut tentang JumpStart, lihat SageMaker JumpStart.

Tentang Penulis

Dr. Raju Penmatcha adalah Arsitek Solusi Spesialis AI/ML di Platform AI di AWS. Ia menerima gelar PhD dari Stanford University. Dia bekerja sama dengan rangkaian layanan rendah/tanpa kode di SageMaker, yang membantu pelanggan dengan mudah membangun dan menerapkan model dan solusi pembelajaran mesin. Saat tidak membantu pelanggan, dia suka bepergian ke tempat baru.

Dr Ashish Khetan adalah Ilmuwan Terapan Senior dengan algoritme bawaan Amazon SageMaker dan membantu mengembangkan algoritme pembelajaran mesin. Ia mendapatkan gelar PhD dari University of Illinois Urbana-Champaign. Dia adalah peneliti aktif dalam pembelajaran mesin dan inferensi statistik, dan telah menerbitkan banyak makalah di konferensi NeurIPS, ICML, ICLR, JMLR, ACL, dan EMNLP.