أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart

تصنيف الصور هو أسلوب التعلم الآلي (ML) القائم على رؤية الكمبيوتر الذي يسمح لك بتصنيف الصور. تتضمن بعض الأمثلة المعروفة لتصنيف الصور تصنيف الأرقام المكتوبة بخط اليد ، وتصنيف الصور الطبية ، والتعرف على الوجه. يعد تصنيف الصور تقنية مفيدة مع العديد من تطبيقات الأعمال ، ولكن بناء نموذج تصنيف جيد للصور ليس بالأمر السهل.

يمكن أن تلعب العديد من الاعتبارات دورًا عند تقييم نموذج ML. بالإضافة إلى دقة النموذج ، فإن المقاييس المحتملة الأخرى ذات الأهمية هي وقت التدريب النموذجي ووقت الاستدلال. نظرًا للطبيعة التكرارية لتطوير نموذج ML ، تسمح أوقات التدريب الأسرع لعلماء البيانات باختبار الفرضيات المختلفة بسرعة. يمكن أن يكون الاستنتاج الأسرع أمرًا بالغ الأهمية في تطبيقات الوقت الفعلي.

أمازون سيج ميكر جومب ستارت يوفر نقرة واحدة ضبطًا دقيقًا ونشر مجموعة متنوعة من النماذج المدربة مسبقًا عبر مهام ML الشائعة ، بالإضافة إلى مجموعة مختارة من الحلول الشاملة التي تحل مشاكل العمل الشائعة. تعمل هذه الميزات على إزالة الأحمال الثقيلة من كل خطوة من خطوات عملية ML ، مما يسهل تطوير نماذج عالية الجودة ويقلل من وقت النشر. واجهات برمجة تطبيقات JumpStart تسمح لك بنشر مجموعة كبيرة من النماذج المدربة مسبقًا والمدعومة من JumpStart على مجموعات البيانات الخاصة بك وضبطها برمجيًا.

يمكنك تدريب نماذج ML المعروضة في JumpStart بشكل متزايد وضبطها قبل النشر. في وقت كتابة هذا التقرير ، يتوفر 87 نموذجًا لتصنيف الصور يعتمد على التعلم العميق في JumpStart.

ولكن ما النموذج الذي سيعطيك أفضل النتائج؟ في هذا المنشور ، نقدم منهجية لتشغيل نماذج متعددة بسهولة ومقارنة نتائجها على ثلاثة أبعاد للاهتمام: دقة النموذج ، ووقت التدريب ، ووقت الاستدلال.

حل نظرة عامة

يسمح لك JumpStart بتدريب النماذج وضبطها ونشرها إما من وحدة تحكم JumpStart باستخدام واجهة المستخدم الخاصة بها أو بواجهة برمجة التطبيقات الخاصة بها. في هذا المنشور ، نستخدم مسار واجهة برمجة التطبيقات ، ونقدم دفتر ملاحظات به نصوص مساعدة مختلفة. يمكنك تشغيل هذا الكمبيوتر الدفتري والحصول على نتائج للمقارنة السهلة بين هذه النماذج مع بعضها البعض ، ثم اختيار نموذج يناسب احتياجات عملك على أفضل وجه من حيث دقة النموذج ووقت التدريب ووقت الاستدلال.

مجموعة البيانات العامة المستخدمة في هذا المنشور تتكون من ما يقرب من 55,000 صورة لأوراق نباتية مريضة وصحية تم جمعها في ظل ظروف خاضعة للرقابة ، مع تصنيفات للفئة تتراوح من 0-38. تنقسم مجموعة البيانات هذه إلى مجموعات بيانات التدريب والتحقق ، مع ما يقرب من 44,000 تحت التدريب و 11,000 صورة قيد التحقق. فيما يلي بعض الصور النموذجية.

في هذا التمرين ، اخترنا نماذج من إطاري عمل - PyTorch و TensorFlow - كما عرضتهما JumpStart. تغطي الخوارزميات النموذجية الـ 15 التالية مجموعة واسعة من بنى الشبكات العصبية الشائعة من هذه الأطر:

  • pytorch-ic-alexnet-FT
  • pytorch-ic-densenet121-FT
  • pytorch-ic-densenet201-FT
  • pytorch-ic-googlenet-FT
  • pytorch-ic-mobilenet-v2-FT
  • pytorch-ic-resnet152-FT
  • pytorch-ic-resnet34-FT
  • tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
  • tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
  • tensorflow-ic-imagenet-inception-v3-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
  • tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
  • tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

نحن نستخدم النموذج tensorflow-ic-imagenet-inception-v3-classification-4-FT كقاعدة يتم مقارنة النتائج من النماذج الأخرى. تم اختيار هذا النموذج الأساسي بشكل تعسفي.

الكود المستخدم لإجراء هذه المقارنة متاح على نماذج AWS GitHub repo.

النتائج

في هذا القسم ، نقدم نتائج هذه ال 15 جولة. لجميع هذه العمليات ، كانت المعلمات الفائقة المستخدمة عبارة عن فترات = 5 ، ومعدل التعلم = 0.001 ، وحجم الدُفعة = 16.

دقة النموذج ووقت التدريب ووقت الاستدلال من النموذج tensorflow-ic-imagenet-inception-v3-classification-4-FT تم أخذها كقاعدة ، وتم عرض النتائج من جميع النماذج الأخرى بالنسبة إلى هذا النموذج الأساسي. لا نهدف هنا إلى إظهار النموذج الأفضل بل إظهار كيف يمكنك ، من خلال JumpStart API ، مقارنة النتائج من النماذج المختلفة ثم اختيار النموذج الذي يناسب حالة الاستخدام الخاصة بك.

توضح لقطة الشاشة التالية النموذج الأساسي الذي تمت مقارنة جميع الطرز الأخرى به.

أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

يعرض المخطط التالي عرضًا تفصيليًا للدقة النسبية مقابل وقت التدريب النسبي. تم ترميز نماذج PyTorch باللون الأحمر ونماذج TensorFlow باللون الأزرق.

أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

يبدو أن النماذج التي تم تمييزها بقطع بيضاوي أخضر في الرسم السابق تتمتع بمزيج جيد من الدقة النسبية ووقت التدريب النسبي المنخفض. يوفر الجدول التالي مزيدًا من التفاصيل حول هذه النماذج الثلاثة.

نموذج الاسم الدقة النسبية وقت التدريب النسبي
tensorflow-ic-imagenet-mobilenet-v2-050-224-class-4-FT 1.01 0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-class-4-FT 1.02 0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-class-1-FT 1.04 1.16

المخطط التالي يقارن الدقة النسبية مقابل وقت الاستدلال النسبي. تم ترميز نماذج PyTorch باللون الأحمر ونماذج TensorFlow باللون الأزرق.

أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

يقدم الجدول التالي تفاصيل حول النماذج الثلاثة في الشكل البيضاوي الأخضر.

نموذج الاسم الدقة النسبية وقت الاستدلال النسبي
tensorflow-ic-imagenet-mobilenet-v2-050-224-class-4-FT 1.01 0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-class-4-FT 1.02 0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-class-1-FT 1.04 1.43

يوضح المخططان بوضوح أن خوارزميات نموذجية معينة كان أداءها أفضل من غيرها في الأبعاد الثلاثة التي تم اختيارها. يمكن أن تساعدك المرونة المقدمة من خلال هذا التمرين في اختيار الخوارزمية الصحيحة ، وباستخدام الكمبيوتر الدفتري المقدم ، يمكنك بسهولة تشغيل هذا النوع من التجارب على أي من النماذج 87 المتاحة.

وفي الختام

في هذا المنشور ، أوضحنا كيفية استخدام JumpStart لإنشاء نماذج تصنيف صور عالية الأداء على أبعاد متعددة للاهتمام ، مثل دقة النموذج ووقت التدريب وزمن انتقال الاستدلال. قدمنا ​​أيضًا الكود لتشغيل هذا التمرين على مجموعة البيانات الخاصة بك ؛ يمكنك اختيار أي نماذج مثيرة للاهتمام من 87 طرازًا المتوفرة حاليًا لتصنيف الصور في مركز نموذج JumpStart. نحن نشجعك على تجربتها اليوم.

لمزيد من التفاصيل حول JumpStart ، راجع سيج ميكر جومب ستارت.


حول المؤلف

أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.الدكتور راجو بنماتشا هو مهندس حلول متخصص في الذكاء الاصطناعي / التعلم الآلي في منصات الذكاء الاصطناعي في AWS. حصل على الدكتوراه من جامعة ستانفورد. إنه يعمل عن كثب على مجموعة الخدمات المنخفضة / غير المشفرة في SageMaker ، والتي تساعد العملاء على بناء ونشر نماذج وحلول التعلم الآلي بسهولة. عندما لا يساعد العملاء ، يحب السفر إلى أماكن جديدة.

أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.د. أشيش خيتان هو عالم تطبيقي أقدم مع خوارزميات Amazon SageMaker المضمنة ويساعد في تطوير خوارزميات التعلم الآلي. حصل على الدكتوراه من جامعة إلينوي في أوربانا شامبين. وهو باحث نشط في التعلم الآلي والاستدلال الإحصائي ، وقد نشر العديد من الأوراق البحثية في مؤتمرات NeurIPS و ICML و ICLR و JMLR و ACL و EMNLP.

الطابع الزمني:

اكثر من التعلم الآلي من AWS