أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart

أعاد نشره أفلاطون

المتابعون: 0

تصنيف الصور هو أسلوب التعلم الآلي (ML) القائم على رؤية الكمبيوتر الذي يسمح لك بتصنيف الصور. تتضمن بعض الأمثلة المعروفة لتصنيف الصور تصنيف الأرقام المكتوبة بخط اليد ، وتصنيف الصور الطبية ، والتعرف على الوجه. يعد تصنيف الصور تقنية مفيدة مع العديد من تطبيقات الأعمال ، ولكن بناء نموذج تصنيف جيد للصور ليس بالأمر السهل.

يمكن أن تلعب العديد من الاعتبارات دورًا عند تقييم نموذج ML. بالإضافة إلى دقة النموذج ، فإن المقاييس المحتملة الأخرى ذات الأهمية هي وقت التدريب النموذجي ووقت الاستدلال. نظرًا للطبيعة التكرارية لتطوير نموذج ML ، تسمح أوقات التدريب الأسرع لعلماء البيانات باختبار الفرضيات المختلفة بسرعة. يمكن أن يكون الاستنتاج الأسرع أمرًا بالغ الأهمية في تطبيقات الوقت الفعلي.

أمازون سيج ميكر جومب ستارت يوفر نقرة واحدة ضبطًا دقيقًا ونشر مجموعة متنوعة من النماذج المدربة مسبقًا عبر مهام ML الشائعة ، بالإضافة إلى مجموعة مختارة من الحلول الشاملة التي تحل مشاكل العمل الشائعة. تعمل هذه الميزات على إزالة الأحمال الثقيلة من كل خطوة من خطوات عملية ML ، مما يسهل تطوير نماذج عالية الجودة ويقلل من وقت النشر. واجهات برمجة تطبيقات JumpStart تسمح لك بنشر مجموعة كبيرة من النماذج المدربة مسبقًا والمدعومة من JumpStart على مجموعات البيانات الخاصة بك وضبطها برمجيًا.

يمكنك تدريب نماذج ML المعروضة في JumpStart بشكل متزايد وضبطها قبل النشر. في وقت كتابة هذا التقرير ، يتوفر 87 نموذجًا لتصنيف الصور يعتمد على التعلم العميق في JumpStart.

ولكن ما النموذج الذي سيعطيك أفضل النتائج؟ في هذا المنشور ، نقدم منهجية لتشغيل نماذج متعددة بسهولة ومقارنة نتائجها على ثلاثة أبعاد للاهتمام: دقة النموذج ، ووقت التدريب ، ووقت الاستدلال.

حل نظرة عامة

يسمح لك JumpStart بتدريب النماذج وضبطها ونشرها إما من وحدة تحكم JumpStart باستخدام واجهة المستخدم الخاصة بها أو بواجهة برمجة التطبيقات الخاصة بها. في هذا المنشور ، نستخدم مسار واجهة برمجة التطبيقات ، ونقدم دفتر ملاحظات به نصوص مساعدة مختلفة. يمكنك تشغيل هذا الكمبيوتر الدفتري والحصول على نتائج للمقارنة السهلة بين هذه النماذج مع بعضها البعض ، ثم اختيار نموذج يناسب احتياجات عملك على أفضل وجه من حيث دقة النموذج ووقت التدريب ووقت الاستدلال.

• مجموعة البيانات العامة المستخدمة في هذا المنشور تتكون من ما يقرب من 55,000 صورة لأوراق نباتية مريضة وصحية تم جمعها في ظل ظروف خاضعة للرقابة ، مع تصنيفات للفئة تتراوح من 0-38. تنقسم مجموعة البيانات هذه إلى مجموعات بيانات التدريب والتحقق ، مع ما يقرب من 44,000 تحت التدريب و 11,000 صورة قيد التحقق. فيما يلي بعض الصور النموذجية.

في هذا التمرين ، اخترنا نماذج من إطاري عمل - PyTorch و TensorFlow - كما عرضتهما JumpStart. تغطي الخوارزميات النموذجية الـ 15 التالية مجموعة واسعة من بنى الشبكات العصبية الشائعة من هذه الأطر:

pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

نحن نستخدم النموذج tensorflow-ic-imagenet-inception-v3-classification-4-FT كقاعدة يتم مقارنة النتائج من النماذج الأخرى. تم اختيار هذا النموذج الأساسي بشكل تعسفي.

الكود المستخدم لإجراء هذه المقارنة متاح على نماذج AWS GitHub repo.

النتائج

في هذا القسم ، نقدم نتائج هذه ال 15 جولة. لجميع هذه العمليات ، كانت المعلمات الفائقة المستخدمة عبارة عن فترات = 5 ، ومعدل التعلم = 0.001 ، وحجم الدُفعة = 16.

دقة النموذج ووقت التدريب ووقت الاستدلال من النموذج tensorflow-ic-imagenet-inception-v3-classification-4-FT تم أخذها كقاعدة ، وتم عرض النتائج من جميع النماذج الأخرى بالنسبة إلى هذا النموذج الأساسي. لا نهدف هنا إلى إظهار النموذج الأفضل بل إظهار كيف يمكنك ، من خلال JumpStart API ، مقارنة النتائج من النماذج المختلفة ثم اختيار النموذج الذي يناسب حالة الاستخدام الخاصة بك.

توضح لقطة الشاشة التالية النموذج الأساسي الذي تمت مقارنة جميع الطرز الأخرى به.

يعرض المخطط التالي عرضًا تفصيليًا للدقة النسبية مقابل وقت التدريب النسبي. تم ترميز نماذج PyTorch باللون الأحمر ونماذج TensorFlow باللون الأزرق.

يبدو أن النماذج التي تم تمييزها بقطع بيضاوي أخضر في الرسم السابق تتمتع بمزيج جيد من الدقة النسبية ووقت التدريب النسبي المنخفض. يوفر الجدول التالي مزيدًا من التفاصيل حول هذه النماذج الثلاثة.

نموذج الاسم	الدقة النسبية	وقت التدريب النسبي
tensorflow-ic-imagenet-mobilenet-v2-050-224-class-4-FT	1.01	0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-class-4-FT	1.02	0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-class-1-FT	1.04	1.16

المخطط التالي يقارن الدقة النسبية مقابل وقت الاستدلال النسبي. تم ترميز نماذج PyTorch باللون الأحمر ونماذج TensorFlow باللون الأزرق.

يقدم الجدول التالي تفاصيل حول النماذج الثلاثة في الشكل البيضاوي الأخضر.

نموذج الاسم	الدقة النسبية	وقت الاستدلال النسبي
tensorflow-ic-imagenet-mobilenet-v2-050-224-class-4-FT	1.01	0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-class-4-FT	1.02	0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-class-1-FT	1.04	1.43

يوضح المخططان بوضوح أن خوارزميات نموذجية معينة كان أداءها أفضل من غيرها في الأبعاد الثلاثة التي تم اختيارها. يمكن أن تساعدك المرونة المقدمة من خلال هذا التمرين في اختيار الخوارزمية الصحيحة ، وباستخدام الكمبيوتر الدفتري المقدم ، يمكنك بسهولة تشغيل هذا النوع من التجارب على أي من النماذج 87 المتاحة.

وفي الختام

في هذا المنشور ، أوضحنا كيفية استخدام JumpStart لإنشاء نماذج تصنيف صور عالية الأداء على أبعاد متعددة للاهتمام ، مثل دقة النموذج ووقت التدريب وزمن انتقال الاستدلال. قدمنا أيضًا الكود لتشغيل هذا التمرين على مجموعة البيانات الخاصة بك ؛ يمكنك اختيار أي نماذج مثيرة للاهتمام من 87 طرازًا المتوفرة حاليًا لتصنيف الصور في مركز نموذج JumpStart. نحن نشجعك على تجربتها اليوم.

لمزيد من التفاصيل حول JumpStart ، راجع سيج ميكر جومب ستارت.

حول المؤلف

الدكتور راجو بنماتشا هو مهندس حلول متخصص في الذكاء الاصطناعي / التعلم الآلي في منصات الذكاء الاصطناعي في AWS. حصل على الدكتوراه من جامعة ستانفورد. إنه يعمل عن كثب على مجموعة الخدمات المنخفضة / غير المشفرة في SageMaker ، والتي تساعد العملاء على بناء ونشر نماذج وحلول التعلم الآلي بسهولة. عندما لا يساعد العملاء ، يحب السفر إلى أماكن جديدة.

د. أشيش خيتان هو عالم تطبيقي أقدم مع خوارزميات Amazon SageMaker المضمنة ويساعد في تطوير خوارزميات التعلم الآلي. حصل على الدكتوراه من جامعة إلينوي في أوربانا شامبين. وهو باحث نشط في التعلم الآلي والاستدلال الإحصائي ، وقد نشر العديد من الأوراق البحثية في مؤتمرات NeurIPS و ICML و ICLR و JMLR و ACL و EMNLP.

الطابع الزمني: 17 نوفمبر، 202221 نوفمبر، 2022

اكثر من التعلم الآلي من AWS

كيف يقدم VistaPrint توصيات المنتجات المخصصة باستخدام Amazon Personalize | خدمات ويب أمازون

الكتلة المصدر:

التعلم الآلي من AWS

عقدة المصدر: 1955612

الطابع الزمني: مارس 11 ،2024

الإعلان عن موصل ServiceNow المحدث (V2) لـ Amazon Kendra

التعلم الآلي من AWS

عقدة المصدر: 1624892

الطابع الزمني: أغسطس 15، 2022

أنشئ نماذج تصنيف صور عالية الأداء باستخدام Amazon SageMaker JumpStart

أعاد نشره أفلاطون

حل نظرة عامة

النتائج

وفي الختام

حول المؤلف

اكثر من التعلم الآلي من AWS

كيف يقدم VistaPrint توصيات المنتجات المخصصة باستخدام Amazon Personalize | خدمات ويب أمازون

الإعلان عن موصل ServiceNow المحدث (V2) لـ Amazon Kendra

تحسينات جديدة في الأداء في مكتبة Amazon SageMaker المتوازية

تحليل غزو القوارض باستخدام إمكانيات Amazon SageMaker الجغرافية المكانية | خدمات أمازون ويب

كيف أنشأت VMware خط أنابيب MLOps من البداية باستخدام GitLab و Amazon MWAA و Amazon SageMaker

كيف يستخدم Kustomer صور Docker المخصصة و Amazon SageMaker لبناء خط أنابيب تصنيف النص

قم بتحسين البحث عالي القيمة باستخدام Hugging Face و Amazon SageMaker لنقاط نهاية الاستدلال غير المتزامن

امنع الاستيلاء على الحساب عند تسجيل الدخول باستخدام نموذج Account Takeover Insights الجديد في Amazon Fraud Detector

أضف AI للمحادثة إلى أي مركز اتصال مع Amazon Lex و Amazon Chime SDK

قم بتخصيص توصياتك من خلال الترويج لعناصر محددة باستخدام قواعد العمل باستخدام Amazon Personalize

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي