نصائح لتحسين نموذج الملصقات المخصصة Amazon Rekognition

أعاد نشره أفلاطون

المتابعون: 0

في هذا المنشور ، نناقش أفضل الممارسات لتحسين أداء نماذج الرؤية الحاسوبية باستخدام تسميات Amazon Rekognition المخصصة. Rekognition Custom Labels هي خدمة مُدارة بالكامل لإنشاء نماذج رؤية كمبيوتر مخصصة لتصنيف الصور وحالات استخدام اكتشاف الكائنات. تعتمد Rekognition Custom Labels على النماذج المدربة مسبقًا في الأمازون إعادة الاعتراف، والتي تم تدريبها بالفعل على عشرات الملايين من الصور عبر العديد من الفئات. بدلاً من آلاف الصور ، يمكنك البدء بمجموعة صغيرة من صور التدريب (بضع مئات أو أقل) الخاصة بحالة الاستخدام الخاصة بك. تلخص Rekognition Custom Labels التعقيد الذي ينطوي عليه بناء نموذج مخصص. يقوم تلقائيًا بفحص بيانات التدريب ، ويختار خوارزميات ML الصحيحة ، ويختار نوع المثيل ، ويدرب العديد من النماذج المرشحة بإعدادات مختلفة للمعلمات التشعبية ، ويخرج النموذج الأفضل تدريبًا. توفر Rekognition Custom Labels أيضًا واجهة سهلة الاستخدام من وحدة تحكم إدارة AWS لإدارة سير عمل ML بالكامل ، بما في ذلك وضع العلامات على الصور ، وتدريب النموذج ، ونشر النموذج ، وتصور نتائج الاختبار.

هناك أوقات لا تكون فيها دقة النموذج هي الأفضل ، وليس لديك العديد من الخيارات لضبط معلمات التكوين الخاصة بالنموذج. يوجد خلف الكواليس عوامل متعددة تلعب دورًا رئيسيًا في بناء نموذج عالي الأداء ، مثل ما يلي:

زاوية الصورة
صورة قرار
نسبة أبعاد الصورة
التعرض للضوء
وضوح وحيوية الخلفية
تباين الألوان
حجم بيانات العينة

فيما يلي الخطوات العامة التي يجب اتباعها لتدريب نموذج Rekognition Custom Labels بدرجة الإنتاج:

مراجعة التصنيف - يحدد هذا قائمة السمات / العناصر التي تريد تحديدها في صورة ما.
اجمع البيانات ذات الصلة - هذه هي الخطوة الأكثر أهمية ، حيث تحتاج إلى جمع الصور ذات الصلة التي يجب أن تشبه ما قد تراه في بيئة الإنتاج. قد يتضمن ذلك صورًا لأشياء ذات خلفيات أو إضاءة أو زوايا كاميرا مختلفة. تقوم بعد ذلك بإنشاء مجموعات بيانات للتدريب والاختبار عن طريق تقسيم الصور المجمعة. يجب عليك فقط تضمين صور العالم الحقيقي كجزء من مجموعة بيانات الاختبار ، ويجب ألا تتضمن أي صور تم إنشاؤها صناعياً. تعد التعليقات التوضيحية للبيانات التي جمعتها ضرورية لأداء النموذج. تأكد من أن المربعات المحيطة محكمة حول الكائنات وأن الملصقات دقيقة. نناقش بعض النصائح التي يمكنك وضعها في الاعتبار عند إنشاء مجموعة بيانات مناسبة لاحقًا في هذا المنشور.
مراجعة مقاييس التدريب - استخدم مجموعات البيانات السابقة لتدريب نموذج ومراجعة مقاييس التدريب للحصول على درجة F1 والدقة والاستدعاء. سنناقش بالتفصيل كيفية تحليل مقاييس التدريب لاحقًا في هذا المنشور.
تقييم النموذج المدرب - استخدم مجموعة من الصور غير المرئية (غير مستخدمة لتدريب النموذج) مع تسميات معروفة لتقييم التنبؤات. يجب دائمًا تنفيذ هذه الخطوة للتأكد من أن النموذج يعمل كما هو متوقع في بيئة الإنتاج.
إعادة التدريب (اختياري) - بشكل عام ، يعد تدريب أي نموذج للتعلم الآلي عملية تكرارية لتحقيق النتائج المرجوة ، ولا يختلف نموذج رؤية الكمبيوتر. راجع النتائج في الخطوة 4 ، لمعرفة ما إذا كان يلزم إضافة المزيد من الصور إلى بيانات التدريب وكرر الخطوات المذكورة أعلاه من 3 إلى 5.

في هذا المنشور ، نركز على أفضل الممارسات حول جمع البيانات ذات الصلة (الخطوة 2) وتقييم المقاييس المدربة (الخطوة 3) لتحسين أداء النموذج الخاص بك.

اجمع البيانات ذات الصلة

هذه هي المرحلة الأكثر أهمية في تدريب نموذج Rekognition Custom Labels بدرجة الإنتاج. على وجه التحديد ، هناك مجموعتان من البيانات: التدريب والاختبار. تُستخدم بيانات التدريب لتدريب النموذج ، وتحتاج إلى بذل الجهد في بناء مجموعة تدريب مناسبة. تم تحسين نماذج Rekognition Custom Labels لـ نتيجة F1 في مجموعة بيانات الاختبار لتحديد النموذج الأكثر دقة لمشروعك. لذلك ، من الضروري تنظيم مجموعة بيانات اختبار تشبه العالم الحقيقي.

عدد الصور

نوصي بالحصول على 15-20 صورة كحد أدنى لكل ملصق. سيؤدي وجود المزيد من الصور مع المزيد من الاختلافات التي تعكس حالة الاستخدام الخاصة بك إلى تحسين أداء النموذج.

مجموعة بيانات متوازنة

من الناحية المثالية ، يجب أن تحتوي كل تسمية في مجموعة البيانات على عدد مماثل من العينات. لا ينبغي أن يكون هناك تفاوت كبير في عدد الصور لكل ملصق. على سبيل المثال ، مجموعة البيانات التي يكون فيها أكبر عدد من الصور للتسمية 1,000 مقابل 50 صورة لتصنيف آخر يشبه مجموعة البيانات غير المتوازنة. نوصي بتجنب السيناريوهات ذات النسبة غير المتوازنة من 1:50 بين الملصق الذي يحتوي على أقل عدد من الصور مقابل الملصق الذي يحتوي على أكبر عدد من الصور.

أنواع مختلفة من الصور

قم بتضمين الصور في مجموعة بيانات التدريب والاختبار التي تشبه ما ستستخدمه في العالم الحقيقي. على سبيل المثال ، إذا كنت تريد تصنيف صور غرف المعيشة مقابل غرف النوم ، فيجب عليك تضمين الصور الفارغة والمفروشة لكلا الغرفتين.

فيما يلي مثال على صورة لغرفة المعيشة المفروشة.

في المقابل ، ما يلي هو مثال على غرفة معيشة غير مفروشة.

فيما يلي مثال على صورة غرفة نوم مفروشة.

فيما يلي مثال على صورة غرفة نوم غير مفروشة.

خلفيات متنوعة

قم بتضمين الصور بخلفيات مختلفة. يمكن أن توفر الصور ذات السياق الطبيعي نتائج أفضل من الخلفية العادية.

فيما يلي مثال لصورة الفناء الأمامي لمنزل.

فيما يلي مثال لصورة الفناء الأمامي لمنزل مختلف بخلفية مختلفة.

اختلاف ظروف الإضاءة

قم بتضمين الصور ذات الإضاءة المتغيرة بحيث تغطي ظروف الإضاءة المختلفة التي تحدث أثناء الاستدلال (على سبيل المثال ، مع الفلاش وبدونه). يمكنك أيضًا تضمين صور ذات تشبع ودرجة سطوع متفاوتة.

فيما يلي مثال لصورة زهرة تحت الضوء العادي.

في المقابل ، فإن الصورة التالية هي من نفس الزهرة تحت الضوء الساطع.

زوايا متفاوتة

قم بتضمين الصور المأخوذة من زوايا مختلفة للكائن. هذا يساعد النموذج على تعلم الخصائص المختلفة للأشياء.

الصور التالية من نفس غرفة النوم من زوايا مختلفة.

نصائح لتحسين Amazon Rekognition Custom Labels نموذج PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

قد تكون هناك مناسبات لا يمكن فيها الحصول على صور من أنواع مختلفة. في هذه السيناريوهات ، يمكن إنشاء صور تركيبية كجزء من مجموعة بيانات التدريب. لمزيد من المعلومات حول تقنيات تكبير الصورة الشائعة ، يرجى الرجوع إلى زيادة البيانات.

أضف تسميات سلبية

بالنسبة لتصنيف الصور ، يمكن أن تساعد إضافة ملصقات سلبية في زيادة دقة النموذج. على سبيل المثال ، يمكنك إضافة تصنيف سلبي لا يتطابق مع أي من التسميات المطلوبة. تمثل الصورة التالية التسميات المختلفة المستخدمة لتحديد الأزهار كاملة النمو.

إضافة التسمية السلبية not_fully_grown يساعد النموذج على تعلم الخصائص التي ليست جزءًا من fully_grown ضع الكلمة المناسبة.

التعامل مع ارتباك التسمية

قم بتحليل النتائج في مجموعة بيانات الاختبار للتعرف على أي أنماط مفقودة في مجموعة بيانات التدريب أو الاختبار. في بعض الأحيان يكون من السهل اكتشاف مثل هذه الأنماط من خلال فحص الصور بصريًا. في الصورة التالية ، يكافح النموذج للحل بين الفناء الخلفي مقابل ملصق الفناء.

في هذا السيناريو ، يمكن أن تساعد إضافة المزيد من الصور إلى هذه الملصقات في مجموعة البيانات وكذلك إعادة تعريف الملصقات بحيث يكون كل تصنيف مميزًا في زيادة دقة النموذج.

زيادة البيانات

داخل Rekognition Custom Labels ، نقوم بإجراء العديد من التعزيزات للبيانات لتدريب النموذج ، بما في ذلك الاقتصاص العشوائي للصورة ، وارتعاش اللون ، وضوضاء Gaussian العشوائية ، والمزيد. استنادًا إلى حالات الاستخدام المحددة الخاصة بك ، قد يكون من المفيد أيضًا إضافة المزيد من البيانات المعززة الواضحة إلى بيانات التدريب الخاصة بك. على سبيل المثال ، إذا كنت مهتمًا باكتشاف الحيوانات في كل من الصور الملونة والأبيض والأسود ، فمن المحتمل أن تحصل على دقة أفضل عن طريق إضافة إصدارات بالأبيض والأسود وملونة من نفس الصور إلى بيانات التدريب.

لا نوصي بعمليات التعزيز في اختبار البيانات ما لم تعكس الزيادات حالات استخدام الإنتاج الخاصة بك.

مراجعة مقاييس التدريب

درجة F1 والدقة والاستدعاء والعتبة المفترضة هي المقاييس التي تم إنشاؤها كناتج لتدريب نموذج باستخدام Rekognition Custom Labels. تم تحسين النماذج للحصول على أفضل درجة F1 بناءً على مجموعة بيانات الاختبار المتوفرة. يتم أيضًا إنشاء العتبة المفترضة بناءً على مجموعة بيانات الاختبار. يمكنك ضبط العتبة بناءً على متطلبات عملك من حيث الدقة أو الاسترجاع.

نظرًا لأنه تم تعيين العتبات المفترضة في مجموعة بيانات الاختبار ، يجب أن تعكس مجموعة الاختبار المناسبة حالة استخدام الإنتاج في العالم الحقيقي. إذا كانت مجموعة بيانات الاختبار لا تمثل حالة الاستخدام ، فقد ترى درجات F1 عالية بشكل مصطنع وأداء نموذج ضعيف على صورك الواقعية.

هذه المقاييس مفيدة عند إجراء تقييم أولي للنموذج. بالنسبة لنظام درجة الإنتاج ، نوصي بتقييم النموذج مقابل مجموعة بيانات خارجية (500-1,000 صورة غير مرئية) تمثل العالم الحقيقي. يساعد هذا في تقييم كيفية أداء النموذج في نظام الإنتاج وكذلك تحديد أي أنماط مفقودة وتصحيحها من خلال إعادة تدريب النموذج. إذا لاحظت عدم تطابق بين درجات F1 والتقييم الخارجي ، فإننا نقترح عليك فحص ما إذا كانت بيانات الاختبار الخاصة بك تعكس حالة الاستخدام في العالم الحقيقي.

وفي الختام

في هذا المنشور ، قدمنا لك أفضل الممارسات لتحسين نماذج Rekognition Custom Labels. نحن نشجعك على معرفة المزيد عن التعرف على التسميات المخصصة وجربه لمجموعات البيانات الخاصة بنشاطك التجاري.

عن المؤلفين

اميت غوبتا هو كبير مهندسي حلول خدمات الذكاء الاصطناعي في AWS. إنه متحمس لتمكين العملاء من خلال حلول التعلم الآلي المصممة جيدًا على نطاق واسع.

يوغيش شاتورفيدي هو مهندس حلول في AWS مع التركيز على رؤية الكمبيوتر. إنه يعمل مع العملاء لمواجهة تحديات أعمالهم باستخدام تقنيات السحابة. خارج العمل ، يستمتع بالمشي لمسافات طويلة والسفر ومشاهدة الألعاب الرياضية.

هاو يانغ هو عالم تطبيقي أقدم في فريق Amazon Rekognition Custom Labels. اهتماماته البحثية الرئيسية هي اكتشاف الأشياء والتعلم مع التعليقات التوضيحية المحدودة. تستمتع Hao بمشاهدة الأفلام والتصوير والأنشطة الخارجية.

الباشمين ميستري هو كبير مديري المنتجات في Amazon Rekognition Custom Labels. خارج العمل ، يستمتع الباشمين برحلات المشي لمسافات طويلة والتصوير وقضاء الوقت مع أسرته.

الطابع الزمني: 9 سبتمبر 202210 سبتمبر 2022

الطابع الزمني: يونيو 15، 2022

نصائح لتحسين نموذج Amazon Rekognition Custom Labels

أعاد نشره أفلاطون

اجمع البيانات ذات الصلة

عدد الصور

مجموعة بيانات متوازنة

أنواع مختلفة من الصور

خلفيات متنوعة

اختلاف ظروف الإضاءة

زوايا متفاوتة

أضف تسميات سلبية

التعامل مع ارتباك التسمية

زيادة البيانات

مراجعة مقاييس التدريب

وفي الختام

عن المؤلفين

اكثر من التعلم الآلي من AWS

مقاييس تقييم الإشراف على المحتوى في Amazon Rekognition وخدمات الإشراف على المحتوى الأخرى

الإعلان عن منشئ المحادثة المرئية لـ Amazon Lex

اكتشاف الشذوذ باستخدام Amazon SageMaker Edge Manager باستخدام AWS IoT Greengrass V2

قم بتشغيل الضبط التلقائي للنموذج باستخدام Amazon SageMaker JumpStart

كيف تعمل SIGNAL IDUNA على تشغيل مشاريع التعلم الآلي على AWS

تنشئ شركة Accenture حلاً تنظيميًا لتأليف المستندات باستخدام خدمات الذكاء الاصطناعي المولدة من AWS | خدمات الويب الأمازون

قم بترميز خصائص النص متعدد اللغات في Amazon Neptune لتدريب النماذج التنبؤية

قلل من تأثير الإنتاج لتحديثات نموذج ML باستخدام اختبار الظل من Amazon SageMaker

تخصيص طرق النطق باستخدام Amazon Polly

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي