افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريب عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus

تم إطلاقه في AWS re: Invent 2021 ، أمازون سيج ميكر جراوند تروث بلس يساعدك على إنشاء مجموعات بيانات تدريبية عالية الجودة عن طريق إزالة الرفع الثقيل غير المتمايز المرتبط بإنشاء تطبيقات وسم البيانات وإدارة القوى العاملة الملصقة. كل ما تفعله هو مشاركة البيانات جنبًا إلى جنب مع متطلبات وضع العلامات ، وتقوم Ground Truth Plus بإعداد وإدارة سير عمل وضع العلامات على البيانات بناءً على هذه المتطلبات. من هناك ، تقوم قوة عاملة خبيرة تم تدريبها على مجموعة متنوعة من مهام التعلم الآلي (ML) بتنفيذ وضع العلامات على البيانات. لا تحتاج حتى إلى خبرة عميقة في تعلم الآلة أو معرفة بتصميم سير العمل وإدارة الجودة لاستخدام Ground Truth Plus.

يعد بناء مجموعة بيانات تدريبية عالية الجودة لخوارزمية تعلم الآلة عملية تكرارية. غالبًا ما ينشئ ممارسو تعلم الآلة أنظمة مخصصة لفحص ملصقات البيانات لأن البيانات ذات العلامات الدقيقة أمر بالغ الأهمية لجودة نموذج التعلم الآلي. لضمان حصولك على بيانات تدريب عالية الجودة ، توفر لك Ground Truth Plus واجهة مستخدم مدمجة (مراجعة واجهة المستخدم) لفحص جودة تسميات البيانات وتقديم ملاحظات حول تسميات البيانات حتى تشعر بالرضا عن أن الملصقات تمثل بدقة الحقيقة الأساسية ، أو ما يمكن ملاحظته مباشرة في العالم الحقيقي.

يرشدك هذا المنشور عبر خطوات إنشاء فريق مشروع واستخدام العديد من الميزات المضمنة الجديدة لأداة مراجعة واجهة المستخدم لإكمال فحص مجموعة البيانات المصنفة بكفاءة. تفترض الإرشادات التفصيلية أن لديك مشروع وضع العلامات على Ground Truth Plus. لمزيد من المعلومات، راجع Amazon SageMaker Ground Truth Plus - إنشاء مجموعات بيانات تدريبية بدون رمز أو موارد داخلية.

قم بإعداد فريق المشروع

يوفر فريق المشروع الوصول إلى الأعضاء من مؤسستك لفحص تسميات البيانات باستخدام أداة مراجعة واجهة المستخدم. لإعداد فريق المشروع ، أكمل الخطوات التالية:

  1. على الأرض الحقيقة زائد يرجى العلم بأن يوجد سن محدد للمشاركة بهذه البطولات. الرجاء قراءة القواعد أدناه.، اختر إنشاء فريق المشروع.
  2. أختار أنشئ مجموعة مستخدمين Amazon Cognito جديدة . إذا كان لديك بالفعل ملف أمازون كوجنيتو مجموعة المستخدمين ، حدد أعضاء الاستيراد الخيار.
  3. في حالة اسم مجموعة مستخدمي Amazon Cognito، إدخال اسم. لا يمكن تغيير هذا الاسم.
  4. في حالة عناوين البريد الإلكتروني، أدخل عناوين البريد الإلكتروني لما يصل إلى 50 عضوًا بالفريق ، مفصولة بفواصل.
  5. اختار إنشاء فريق المشروع.

افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

سيتلقى أعضاء فريقك رسالة بريد إلكتروني تدعوهم للانضمام إلى فريق مشروع Ground Truth Plus. من هناك ، يمكنهم تسجيل الدخول إلى بوابة مشروع Ground Truth Plus لمراجعة ملصقات البيانات.

فحص جودة مجموعة البيانات ذات العلامات

الآن دعنا نتعمق في مثال تتبع كائن الفيديو باستخدام مشاهد شارع سي بي سي ال مجموعة البيانات.

بعد تسمية البيانات الموجودة في الدفعة الخاصة بك ، يتم وضع علامة على الدُفعة كـ جاهز للمراجعة.

افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

حدد الدفعة واختر مراجعة الدفعة. تتم إعادة توجيهك إلى واجهة مستخدم المراجعة. لديك المرونة لاختيار معدل أخذ عينات مختلف لكل دفعة تقوم بمراجعتها. على سبيل المثال ، في مجموعة المثال لدينا ، لدينا إجمالي خمسة مقاطع فيديو. يمكنك تحديد ما إذا كنت تريد مراجعة مجموعة فرعية فقط من مقاطع الفيديو الخمسة هذه أو جميعها.

دعنا الآن نلقي نظرة على الوظائف المختلفة داخل واجهة المستخدم للمراجعة والتي ستساعدك في فحص جودة مجموعة البيانات المصنفة بوتيرة أسرع ، وتقديم ملاحظات حول الجودة:

  • قم بتصفية التسميات بناءً على فئة الملصق - ضمن واجهة المستخدم للمراجعة ، في الجزء الأيمن ، يمكنك تصفية التسميات بناءً على فئة الملصقات الخاصة بها. تكون هذه الميزة مفيدة عندما تكون هناك فئات تصنيف متعددة (على سبيل المثال ، Vehicles, Pedestriansو Poles) في كائن مجموعة بيانات كثيف ، وتريد عرض تسميات فئة تسمية واحدة في كل مرة. على سبيل المثال ، دعنا نركز على Car فئة التسمية. دخول Car فئة التسمية في الجزء الأيسر للتصفية لجميع التعليقات التوضيحية من النوع فقط Car. تُظهر لقطات الشاشة التالية طريقة عرض واجهة المستخدم للمراجعة قبل تطبيق الفلتر وبعده.
    افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي. افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.
  • تراكب قيم السمات المشروحة المرتبطة - يمكن تعيين سمات لكل تسمية ليتم شرحها. على سبيل المثال ، لفئة التسمية Car ، لنفترض أنك تريد أن تطلب من العمال إضافة تعليق توضيحي إلى Color  و  Occlusion سمات لكل مثيل تسمية. عند تحميل واجهة المستخدم للمراجعة ، سترى السمات المقابلة تحت كل مثيل تسمية في الجزء الأيمن. ولكن ماذا لو كنت تريد أن ترى تعليقات السمات هذه مباشرة على الصورة بدلاً من ذلك؟ حددت التسمية Car:1 ، ولتراكب التعليقات التوضيحية للسمات لـ Car:1 ، تضغط Ctrl + A.
    الآن سترى التعليق التوضيحي Dark Blue ل Color السمة والتعليق التوضيحي None ل Occlusion السمة المعروضة مباشرة على الصورة بجوار ملف Car:1 المربع المحيط. الآن يمكنك بسهولة التحقق من ذلك Car:1 تم وضع علامة على أنها Dark Blue، مع عدم وجود انسداد بمجرد النظر إلى الصورة بدلاً من الاضطرار إلى تحديد موقعها Car:1 في الجزء الأيمن لمشاهدة التعليقات التوضيحية للسمات.
    افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.
  • اترك ملاحظات على مستوى التسمية - لكل تسمية ، يمكنك ترك ملاحظات على مستوى التسمية في تلك التسمية ملاحظات التسمية سمة سلسلة مجانية. على سبيل المثال ، في هذه الصورة ، Car:1 يبدو أسود أكثر من الأزرق الداكن. يمكنك ترحيل هذا التناقض كتغذية مرتدة لـ Car:1 يستخدم ال ملاحظات التسمية لتتبع التعليق على ذلك التصنيف على هذا الإطار. سيقوم فريق مراقبة الجودة الداخلية لدينا بمراجعة هذه التعليقات وإدخال تغييرات على عملية التعليقات التوضيحية وسياسات التسمية ، وتدريب المعلقين كما هو مطلوب.
    افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.
  • اترك ملاحظات على مستوى الإطار - وبالمثل ، بالنسبة لكل إطار ، يمكنك ترك تعليقات على مستوى الإطار أسفل هذا الإطار ملاحظات الإطار سمة سلسلة مجانية. في هذه الحالة ، التعليقات التوضيحية لـ Car و  Pedestrian تبدو الفصول صحيحة ويتم تنفيذها جيدًا في هذا الإطار. يمكنك نقل هذه التعليقات الإيجابية باستخدام ملف تقديم التغذية الراجعة الحقل ، وتعليقك مرتبط بهذا الإطار.
    افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.
  • انسخ تعليقات التعليقات التوضيحية إلى إطارات أخرى - يمكنك نسخ الملاحظات على مستوى التسمية والإطار إلى إطارات أخرى إذا قمت بالنقر بزر الماوس الأيمن فوق هذه السمة. هذه الميزة مفيدة عندما تريد تكرار نفس الملاحظات عبر الإطارات لتلك التسمية ، أو تطبيق نفس الملاحظات على مستوى الإطار على عدة إطارات. تتيح لك هذه الميزة إكمال فحص ملصقات البيانات بسرعة.
    افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.
  • قبول أو رفض كل كائن مجموعة بيانات - لكل كائن مجموعة بيانات تقوم بمراجعته ، لديك خيار الاختيار الموافقة على إذا كنت راضيًا عن التعليقات التوضيحية أو اخترت رفض إذا لم تكن راضيًا وتريد إعادة صياغة تلك التعليقات التوضيحية. عندما تختار تقدم، يتم تقديمك مع خيار الموافقة على الفيديو الذي راجعته للتو أو رفضه. في كلتا الحالتين ، يمكنك تقديم تعليق إضافي:
    • إذا اخترت الموافقة على، التعليق اختياري.
      افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.
    • إذا اخترت رفض، التعليق مطلوب ونقترح تقديم ملاحظات مفصلة. سيتم مراجعة ملاحظاتك من قبل فريق مراقبة جودة Ground Truth Plus المخصص ، والذي سيتخذ إجراءات تصحيحية لتجنب أخطاء مماثلة في مقاطع الفيديو اللاحقة.
      افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

بعد إرسال الفيديو مع ملاحظاتك ، تتم إعادة توجيهك مرة أخرى إلى صفحة تفاصيل المشروع في مدخل المشروع ، حيث يمكنك عرض عدد الكائنات المرفوضة ضمن الأشياء المرفوضة العمود ومعدل الخطأ ، والذي يتم حسابه على أنه عدد العناصر المقبولة من العناصر التي تمت مراجعتها ضمن معدل القبول عمود لكل دفعة في مشروعك. على سبيل المثال ، بالنسبة للدفعة 1 في لقطة الشاشة التالية ، فإن معدل القبول هو 80٪ لأنه تم قبول أربعة كائنات من العناصر الخمسة التي تمت مراجعتها.

افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

وفي الختام

تعد مجموعة بيانات التدريب عالية الجودة أمرًا بالغ الأهمية لتحقيق مبادرات ML. مع Ground Truth Plus ، لديك الآن أداة مراجعة مدمجة مُحسّنة تزيل الرفع الثقيل غير المتمايز المرتبط ببناء أدوات مخصصة لمراجعة جودة مجموعة البيانات المصنفة. أطلعك هذا المنشور على كيفية إعداد فريق المشروع واستخدام الميزات المدمجة الجديدة لأداة مراجعة واجهة المستخدم. قم بزيارة وحدة تحكم جراوند تروث بلس للبدء.

كما هو الحال دائمًا ، ترحب AWS بالتعليقات. يرجى تقديم أي تعليقات أو أسئلة.


عن المؤلف

افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.مانيش جويل هو مدير المنتج في Amazon SageMaker Ground Truth Plus. إنه يركز على بناء المنتجات التي تسهل على العملاء تبني التعلم الآلي. في أوقات فراغه ، يستمتع بالرحلات البرية وقراءة الكتب.

افحص ملصقات البيانات الخاصة بك باستخدام أداة مرئية بدون رمز لإنشاء مجموعات بيانات تدريبية عالية الجودة باستخدام Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence. البحث العمودي. عاي.ريفيكا كوستويفا هي مهندسة مطور برامج في Amazon AWS حيث تعمل على مواجهة العملاء والحلول الداخلية لتوسيع نطاق خدمات Sagemaker Ground Truth وقابليتها للتوسع. بصفتها باحثة ، فهي تعمل على تحسين أدوات التجارة لدفع الابتكار إلى الأمام.

الطابع الزمني:

اكثر من التعلم الآلي من AWS