Görüntü sınıflandırması, görüntüleri sınıflandırmanıza izin veren bilgisayarla görme tabanlı bir makine öğrenimi (ML) tekniğidir. Bazı iyi bilinen görüntü sınıflandırma örnekleri, el yazısı rakamların sınıflandırılmasını, tıbbi görüntü sınıflandırmasını ve yüz tanımayı içerir. Görüntü sınıflandırma, birçok iş uygulamasında faydalı bir tekniktir, ancak iyi bir görüntü sınıflandırma modeli oluşturmak önemsiz değildir.
Bir makine öğrenimi modelini değerlendirirken birkaç husus rol oynayabilir. Model doğruluğunun ötesinde, önemli olan diğer potansiyel ölçütler, model eğitim süresi ve çıkarım süresidir. Makine öğrenimi modeli geliştirmenin yinelemeli doğası göz önüne alındığında, daha hızlı eğitim süreleri, veri bilimcilerin çeşitli hipotezleri hızlı bir şekilde test etmesine olanak tanır. Daha hızlı çıkarım, gerçek zamanlı uygulamalarda kritik olabilir.
Amazon SageMaker Hızlı Başlangıç popüler makine öğrenimi görevlerinde çok çeşitli önceden eğitilmiş modellerin tek tıklamayla ince ayarını ve dağıtımını sağlar, bunun yanı sıra yaygın iş sorunlarını çözen bir dizi uçtan uca çözüm sunar. Bu özellikler, makine öğrenimi sürecinin her adımındaki yükü ortadan kaldırarak yüksek kaliteli modeller geliştirmeyi kolaylaştırır ve devreye alma süresini kısaltır. Hızlı Başlangıç API'leri kendi veri kümelerinizde çok çeşitli JumpStart destekli önceden eğitilmiş modelleri programatik olarak dağıtmanıza ve ince ayar yapmanıza olanak tanır.
JumpStart'ta sunulan makine öğrenimi modellerini dağıtımdan önce artımlı olarak eğitebilir ve ayarlayabilirsiniz. Yazma sırasında, JumpStart'ta 87 derin öğrenme tabanlı görüntü sınıflandırma modeli mevcuttur.
Ama hangi model size en iyi sonuçları verecek? Bu yazıda, birden fazla modeli kolayca çalıştırmak ve çıktılarını ilginin üç boyutunda karşılaştırmak için bir metodoloji sunuyoruz: model doğruluğu, eğitim süresi ve çıkarım süresi.
Çözüme genel bakış
JumpStart, kullanıcı arayüzünü veya API'sini kullanarak JumpStart konsolundan modelleri eğitmenize, ayarlamanıza ve dağıtmanıza olanak tanır. Bu gönderide, API yolunu kullanıyoruz ve çeşitli yardımcı komut dosyaları içeren bir not defteri sunuyoruz. Bu not defterini çalıştırabilir ve bu modellerin birbirleriyle kolay karşılaştırması için sonuçlar alabilir ve ardından model doğruluğu, eğitim süresi ve çıkarım süresi açısından işletmenizin ihtiyacına en uygun modeli seçebilirsiniz.
The genel veri kümesi Bu gönderide kullanılan, 55,000-0 arasında değişen sınıf etiketleri ile kontrollü koşullar altında toplanan yaklaşık 38 hastalıklı ve sağlıklı bitki yaprağı görüntüsünden oluşur. Bu veri kümesi, yaklaşık 44,000 eğitim altında ve 11,000 görüntü doğrulama altında olmak üzere tren ve doğrulama veri kümelerine bölünmüştür. Aşağıdakiler birkaç örnek resimdir.
Bu alıştırma için, JumpStart tarafından sunulan iki çerçeveden (PyTorch ve TensorFlow) modeller seçtik. Aşağıdaki 15 model algoritma, bu çerçevelerden çok çeşitli popüler sinir ağı mimarilerini kapsar:
pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT
biz modeli kullanıyoruz tensorflow-ic-imagenet-inception-v3-classification-4-FT
diğer modellerden elde edilen sonuçların karşılaştırıldığı bir temel olarak. Bu temel model keyfi olarak seçilmiştir.
Bu karşılaştırmayı çalıştırmak için kullanılan kod şu adreste mevcuttur: AWS Örnekleri GitHub deposu.
Sonuçlar
Bu bölümde, bu 15 çalışmanın sonuçlarını sunuyoruz. Tüm bu çalıştırmalar için kullanılan hiperparametreler dönemler = 5, öğrenme oranı = 0.001, toplu iş boyutu = 16 idi.
Model doğruluğu, eğitim süresi ve modelden çıkarım süresi tensorflow-ic-imagenet-inception-v3-classification-4-FT
temel olarak alınmıştır ve diğer tüm modellerin sonuçları bu temel modele göre sunulmuştur. Buradaki amacımız hangi modelin en iyi olduğunu göstermek değil, JumpStart API aracılığıyla çeşitli modellerin sonuçlarını nasıl karşılaştırabileceğinizi ve ardından kullanım durumunuza en uygun modeli nasıl seçebileceğinizi göstermektir.
Aşağıdaki ekran görüntüsü, diğer tüm modellerin karşılaştırıldığı temel modeli vurgulamaktadır.
Aşağıdaki çizim, göreli eğitim süresine karşı göreli doğruluğun ayrıntılı bir görünümünü gösterir. PyTorch modelleri kırmızı renk kodludur ve TensorFlow modelleri mavi renkle kodlanmıştır.
Önceki grafikte yeşil bir elips ile vurgulanan modeller, göreceli doğruluk ve düşük göreceli eğitim süresinin iyi bir kombinasyonuna sahip gibi görünmektedir. Aşağıdaki tabloda bu üç model hakkında daha fazla ayrıntı verilmektedir.
Model adı | Bağıl Doğruluk | Bağıl Eğitim Süresi |
tensorflow-ic-imagenet-mobilenet-v2-050-224-sınıflandırma-4-FT | 1.01 | 0.74 |
tensorflow-ic-imagenet-mobilenet-v2-140-224-sınıflandırma-4-FT | 1.02 | 0.74 |
tensorflow-ic-bit-s-r101x1-ilsvrc2012-sınıflandırması-1-FT | 1.04 | 1.16 |
Aşağıdaki grafik, göreli doğruluk ile göreli çıkarım süresini karşılaştırır. PyTorch modelleri kırmızı renk kodludur ve TensorFlow modelleri mavi renkle kodlanmıştır.
Aşağıdaki tabloda, yeşil elipsin içindeki üç model hakkında ayrıntılar verilmektedir.
Model adı | Bağıl Doğruluk | Bağıl Çıkarım Süresi |
tensorflow-ic-imagenet-mobilenet-v2-050-224-sınıflandırma-4-FT | 1.01 | 0.94 |
tensorflow-ic-imagenet-mobilenet-v2-140-224-sınıflandırma-4-FT | 1.02 | 0.90 |
tensorflow-ic-bit-s-r101x1-ilsvrc2012-sınıflandırması-1-FT | 1.04 | 1.43 |
İki grafik, belirli model algoritmalarının seçilen üç boyutta diğerlerinden daha iyi performans gösterdiğini açıkça göstermektedir. Bu alıştırma yoluyla sunulan esneklik, doğru algoritmayı seçmenize yardımcı olabilir ve sağlanan not defterini kullanarak, bu tür deneyleri mevcut 87 modelden herhangi biri üzerinde kolayca çalıştırabilirsiniz.
Sonuç
Bu yazıda, model doğruluğu, eğitim süresi ve çıkarım gecikmesi gibi birden çok ilgi boyutunda yüksek performanslı görüntü sınıflandırma modelleri oluşturmak için JumpStart'ın nasıl kullanılacağını gösterdik. Ayrıca, bu alıştırmayı kendi veri kümenizde çalıştırmanız için gereken kodu da sağladık; JumpStart model merkezinde görüntü sınıflandırması için şu anda mevcut olan 87 modelden ilginizi çeken herhangi bir modeli seçebilirsiniz. Bugün denemenizi öneririz.
JumpStart hakkında daha fazla ayrıntı için bkz. Adaçayı Yapıcı Hızlı Başlangıç.
Yazarlar Hakkında
Raju Penmatcha AWS'de Yapay Zeka Platformlarında Yapay Zeka/ML Uzman Çözüm Mimarıdır. Doktora derecesini Stanford Üniversitesi'nden almıştır. SageMaker'da, müşterilerin makine öğrenimi modellerini ve çözümlerini kolayca oluşturmasına ve devreye almasına yardımcı olan az kodlu/kodsuz hizmet paketi üzerinde yakından çalışıyor. Müşterilere yardım etmediği zamanlarda yeni yerlere seyahat etmeyi sever.
Ashish Khetan Amazon SageMaker yerleşik algoritmalarına sahip Kıdemli Uygulamalı Bilim Adamıdır ve makine öğrenimi algoritmalarının geliştirilmesine yardımcı olur. Doktora derecesini University of Illinois Urbana-Champaign'den almıştır. Makine öğrenimi ve istatistiksel çıkarım alanlarında aktif bir araştırmacıdır ve NeurIPS, ICML, ICLR, JMLR, ACL ve EMNLP konferanslarında birçok makale yayınlamıştır.
- AI
- yapay zeka
- AI sanat üreteci
- yapay zeka robotu
- Amazon Adaçayı Yapıcı
- Amazon SageMaker Hızlı Başlangıç
- yapay zeka
- yapay zeka sertifikası
- bankacılıkta yapay zeka
- yapay zeka robotu
- yapay zeka robotları
- yapay zeka yazılımı
- AWS Makine Öğrenimi
- blockchain
- blockchain konferans ai
- zeka
- konuşma yapay zekası
- kripto konferans ai
- dal-e
- derin öğrenme
- google ai
- Orta (200)
- makine öğrenme
- Platon
- plato yapay zekası
- Plato Veri Zekası
- Plato Oyunu
- PlatoVeri
- plato oyunu
- ölçek ai
- sözdizimi
- zefirnet