قم بإنشاء بيانات عالية الجودة لنماذج ML باستخدام Amazon SageMaker Ground Truth PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

قم بإنشاء بيانات عالية الجودة لنماذج ML باستخدام Amazon SageMaker Ground Truth

لقد أدى التعلم الآلي (ML) إلى تحسين الأعمال عبر الصناعات في السنوات الأخيرة - بدءًا من نظام التوصية الخاص بك Prime Video حساب لتوثيق التلخيص والبحث الفعال باستخدام اليكساالمساعدة الصوتية. ومع ذلك ، يبقى السؤال حول كيفية دمج هذه التكنولوجيا في عملك. على عكس الطرق التقليدية المستندة إلى القواعد ، يستنبط تعلم الآلة الأنماط من البيانات تلقائيًا لأداء المهمة التي تهمك. على الرغم من أن هذا يتجاوز الحاجة إلى تنظيم قواعد الأتمتة ، إلا أنه يعني أيضًا أن نماذج ML يمكن أن تكون جيدة فقط مثل البيانات التي تم تدريبهم عليها. ومع ذلك ، غالبًا ما يكون إنشاء البيانات مهمة صعبة. في ال مختبر أمازون لحلول التعلم الآلي، لقد واجهنا هذه المشكلة مرارًا وتكرارًا ونريد تسهيل هذه الرحلة لعملائنا. إذا كنت تريد إلغاء تحميل هذه العملية ، يمكنك استخدام أمازون سيج ميكر جراوند تروث بلس.

بنهاية هذا المنشور ، ستتمكن من تحقيق ما يلي:

  • فهم العمليات التجارية التي ينطوي عليها إعداد خط أنابيب للحصول على البيانات
  • حدد خدمات سحابة AWS لدعم خط أنابيب تسمية البيانات وتسريعها
  • قم بتشغيل مهمة الحصول على البيانات ووضع العلامات لحالات الاستخدام المخصصة
  • قم بإنشاء بيانات عالية الجودة وفقًا لأفضل الممارسات التجارية والتقنية

خلال هذا المنشور ، نركز على عملية إنشاء البيانات ونعتمد على خدمات AWS للتعامل مع البنية التحتية ومكونات العملية. وهي التي نستخدمها الحقيقة الأمازون SageMaker الأرض للتعامل مع خط أنابيب البنية التحتية للعلامات وواجهة المستخدم. تستخدم هذه الخدمة نهج نقطة وانطلاق لجمع البيانات الخاصة بك من خدمة تخزين أمازون البسيطة (Amazon S3) وقم بإعداد سير عمل وضع العلامات. بالنسبة إلى وضع العلامات ، فإنه يوفر لك المرونة المضمنة للحصول على تسميات البيانات باستخدام فريقك الخاص ، وملف الأمازون ميكانيكي ترك Force ، أو بائع الملصقات المفضل لديك من سوق AWS. أخيرًا ، يمكنك استخدام ملفات AWS لامدا و أجهزة أمازون SageMaker المحمولة لمعالجة البيانات أو تصورها أو التحكم في جودتها - سواء قبل أو بعد وضع العلامات.

الآن بعد أن تم وضع جميع القطع ، فلنبدأ العملية!

عملية إنشاء البيانات

على عكس الحدس الشائع ، فإن الخطوة الأولى لإنشاء البيانات ليست جمع البيانات. يعد العمل للخلف من المستخدمين للتعبير عن المشكلة أمرًا بالغ الأهمية. على سبيل المثال ، ما الذي يهتم به المستخدمون في الأداة النهائية؟ أين يعتقد الخبراء أن الإشارات ذات الصلة بحالة الاستخدام موجودة في البيانات؟ ما هي المعلومات حول بيئة حالة الاستخدام التي يمكن توفيرها للنموذج؟ إذا كنت لا تعرف إجابات هذه الأسئلة ، فلا داعي للقلق. امنح نفسك بعض الوقت للتحدث مع المستخدمين والخبراء الميدانيين لفهم الفروق الدقيقة. سيوجهك هذا الفهم الأولي في الاتجاه الصحيح ويهيئك للنجاح.

بالنسبة إلى هذا المنشور ، نفترض أنك غطيت هذه العملية الأولية لمواصفات متطلبات المستخدم. ترشدك الأقسام الثلاثة التالية خلال العملية اللاحقة لإنشاء بيانات الجودة: التخطيط وإنشاء بيانات المصدر والتعليق التوضيحي للبيانات. تعد الحلقات التجريبية عند إنشاء البيانات وخطوات التعليق التوضيحي أمرًا حيويًا لضمان الإنشاء الفعال للبيانات المصنفة. يتضمن ذلك التكرار بين إنشاء البيانات ، والتعليق التوضيحي ، وضمان الجودة ، وتحديث خط الأنابيب حسب الضرورة.

يوفر الشكل التالي نظرة عامة على الخطوات المطلوبة في خط أنابيب نموذجي لإنشاء البيانات. يمكنك العمل بشكل عكسي من حالة الاستخدام لتحديد البيانات التي تحتاجها (مواصفات المتطلبات) ، وبناء عملية للحصول على البيانات (التخطيط) ، وتنفيذ عملية الحصول على البيانات الفعلية (جمع البيانات والتعليقات التوضيحية) ، وتقييم النتائج. تتيح لك عمليات التشغيل التجريبية ، المميزة بخطوط متقطعة ، تكرار العملية حتى يتم تطوير خط أنابيب للحصول على البيانات عالية الجودة.

نظرة عامة على الخطوات المطلوبة في خط أنابيب نموذجي لإنشاء البيانات.

التخطيط

يمكن أن تستغرق عملية إنشاء البيانات القياسية وقتًا طويلاً ومضيعة للموارد البشرية القيمة إذا تم إجراؤها بطريقة غير فعالة. لماذا سيكون مضيعة للوقت؟ للإجابة على هذا السؤال ، يجب أن نفهم نطاق عملية إنشاء البيانات. لمساعدتك ، قمنا بتجميع قائمة مراجعة عالية المستوى ووصفًا للمكونات الرئيسية وأصحاب المصلحة الذين يجب أن تضعهم في الاعتبار. قد تكون الإجابة على هذه الأسئلة صعبة في البداية. اعتمادًا على حالة الاستخدام الخاصة بك ، قد يكون بعضها قابلاً للتطبيق.

  • حدد نقطة الاتصال القانونية للحصول على الموافقات المطلوبة - قد يتطلب استخدام البيانات لتطبيقك مراجعة الترخيص أو عقد البائع لضمان الامتثال لسياسات الشركة وحالات الاستخدام. من المهم تحديد الدعم القانوني الخاص بك طوال خطوات الحصول على البيانات والتعليق التوضيحي للعملية.
  • تحديد نقطة الاتصال الأمنية لمعالجة البيانات - قد يؤدي تسريب البيانات المشتراة إلى غرامات خطيرة وتداعيات على شركتك. من المهم تحديد الدعم الأمني ​​الخاص بك خلال خطوات الحصول على البيانات والتعليق التوضيحي لضمان ممارسات آمنة.
  • تفصيل متطلبات حالة الاستخدام وتحديد مصدر البيانات وإرشادات التعليقات التوضيحية - يعد إنشاء البيانات والتعليق عليها أمرًا صعبًا نظرًا للخصوصية العالية المطلوبة. يجب أن يكون أصحاب المصلحة ، بما في ذلك منشئي البيانات والمعلقين ، متوائمين تمامًا لتجنب إهدار الموارد. تحقيقًا لهذه الغاية ، من الشائع استخدام مستند إرشادات يحدد كل جانب من جوانب مهمة التعليق التوضيحي: الإرشادات الدقيقة ، وحالات الحافة ، ومثال تجول ، وما إلى ذلك.
  • توافق مع التوقعات الخاصة بجمع بيانات المصدر الخاصة بك - خذ بعين الاعتبار ما يلي:
    • إجراء بحث على مصادر البيانات المحتملة - على سبيل المثال ، مجموعات البيانات العامة أو مجموعات البيانات الحالية من الفرق الداخلية الأخرى أو البيانات المجمعة ذاتيًا أو المشتراة من البائعين.
    • قم بإجراء تقييم الجودة - إنشاء خط أنابيب تحليل فيما يتعلق بحالة الاستخدام النهائي.
  • التوافق مع التوقعات لإنشاء التعليقات التوضيحية للبيانات - خذ بعين الاعتبار ما يلي:
    • تحديد أصحاب المصلحة التقنيين - يكون هذا عادةً فردًا أو فريقًا في شركتك قادرًا على استخدام الوثائق الفنية المتعلقة بالحقيقة الأرضية لتنفيذ خط أنابيب التعليقات التوضيحية. يتحمل أصحاب المصلحة هؤلاء أيضًا مسؤولية تقييم جودة البيانات المشروحة للتأكد من أنها تلبي احتياجات تطبيق ML الخاص بك.
    • تحديد شروح البيانات - يستخدم هؤلاء الأفراد تعليمات محددة مسبقًا لإضافة تسميات إلى بيانات المصدر الخاصة بك ضمن Ground Truth. قد يحتاجون إلى امتلاك معرفة بالمجال بناءً على حالة الاستخدام وإرشادات التعليقات التوضيحية. يمكنك استخدام قوة عاملة داخلية لشركتك ، أو الدفع مقابل أ قوة عاملة يديرها بائع خارجي.
  • ضمان الإشراف على عملية إنشاء البيانات - كما ترى من النقاط السابقة ، فإن إنشاء البيانات هو عملية مفصلة تضم العديد من أصحاب المصلحة المتخصصين. لذلك ، من الأهمية بمكان مراقبته من البداية إلى النهاية نحو النتيجة المرجوة. يمكن أن يساعدك وجود شخص أو فريق مخصص للإشراف على العملية على ضمان عملية إنشاء بيانات متماسكة وفعالة.

اعتمادًا على المسار الذي قررت أن تسلكه ، يجب عليك أيضًا مراعاة ما يلي:

  • قم بإنشاء مجموعة البيانات المصدر - يشير هذا إلى الحالات التي تكون فيها البيانات الموجودة غير مناسبة للمهمة المطروحة ، أو أن القيود القانونية تمنعك من استخدامها. يجب استخدام الفرق الداخلية أو الموردين الخارجيين (النقطة التالية). هذا هو الحال غالبًا في المجالات المتخصصة للغاية أو المناطق ذات البحث العام المنخفض. على سبيل المثال ، الأسئلة الشائعة للطبيب ، أو الملابس ، أو خبراء الرياضة. يمكن أن يكون داخليًا أو خارجيًا.
  • ابحث عن البائعين وقم بإجراء عملية الإعداد - عند الاستعانة بموردين خارجيين ، يجب وضع عملية تعاقد وإلحاق بين كلا الكيانين.

في هذا القسم ، راجعنا المكونات وأصحاب المصلحة الذين يجب أن نأخذ في الاعتبار. ومع ذلك ، كيف تبدو العملية الفعلية؟ في الشكل التالي ، نحدد سير عمل العملية لإنشاء البيانات والتعليق التوضيحي. يستخدم النهج التكراري دفعات صغيرة من البيانات تسمى الطيارين لتقليل وقت الاستجابة ، واكتشاف الأخطاء في وقت مبكر ، وتجنب إهدار الموارد في إنشاء بيانات منخفضة الجودة. نصف هذه الجولات التجريبية لاحقًا في هذا المنشور. نحن نغطي أيضًا بعض أفضل الممارسات لإنشاء البيانات والتعليقات التوضيحية ومراقبة الجودة.

يوضح الشكل التالي التطور المتكرر لخط أنابيب إنشاء البيانات. عموديًا ، نجد كتلة مصادر البيانات (باللون الأخضر) وكتلة التعليقات التوضيحية (باللون الأزرق). تحتوي كلتا الكتلتين على جولات تجريبية مستقلة (إنشاء البيانات / التعليق التوضيحي ، ومراقبة الجودة وضمان الجودة ، والتحديث). يتم إنشاء بيانات ذات مصادر أعلى بشكل متزايد ويمكن استخدامها لإنشاء تعليقات توضيحية عالية الجودة بشكل متزايد.

أثناء التطوير التكراري لإنشاء البيانات أو خط أنابيب التعليقات التوضيحية ، تُستخدم دفعات صغيرة من البيانات للطيارين المستقلين. تحتوي كل جولة تجريبية على مرحلة إنشاء بيانات أو شرح توضيحي ، وبعض إجراءات ضمان الجودة ومراقبة جودة النتائج ، وخطوة تحديث لتحسين العملية. بعد إتقان هذه العمليات من خلال البرامج التجريبية المتعاقبة ، يمكنك المتابعة لإنشاء البيانات على نطاق واسع والتعليق التوضيحي.

نظرة عامة على التطوير التكراري في مسار إنشاء البيانات.

إنشاء بيانات المصدر

تدور عملية إنشاء المدخلات حول تنظيم العناصر التي تهمك ، والتي تعتمد على نوع مهمتك. قد تكون هذه صورًا (مسح جرائد) أو مقاطع فيديو (مشاهد حركة المرور) أو سحب نقطية ثلاثية الأبعاد (عمليات مسح طبي) أو مجرد نص (مسارات ترجمة أو نسخ نصية). بشكل عام ، عند تنظيم العناصر المتعلقة بالمهمة ، تأكد مما يلي:

  • تعكس حالة الاستخدام في العالم الحقيقي لنظام AI / ML النهائي - يجب أن يتطابق الإعداد الخاص بجمع الصور أو مقاطع الفيديو لبيانات التدريب عن كثب مع إعداد بيانات الإدخال في تطبيق العالم الحقيقي. هذا يعني وجود أسطح مواضع ثابتة أو مصادر إضاءة أو زوايا كاميرا.
  • حساب وتقليل مصادر التباين - خذ بعين الاعتبار ما يلي:
    • تطوير أفضل الممارسات للحفاظ على معايير جمع البيانات - اعتمادًا على مدى دقة حالة الاستخدام الخاصة بك ، قد تحتاج إلى تحديد متطلبات لضمان الاتساق بين نقاط البيانات الخاصة بك. على سبيل المثال ، إذا كنت تقوم بجمع بيانات الصور أو الفيديو من نقاط الكاميرا الفردية ، فقد تحتاج إلى التأكد من الموضع المتسق للأشياء التي تهمك ، أو تتطلب فحص جودة الكاميرا قبل جولة التقاط البيانات. يمكن أن يؤدي ذلك إلى تجنب مشكلات مثل إمالة الكاميرا أو تعتيمها ، وتقليل النفقات العامة المصبوبة مثل إزالة الصور خارج الإطار أو الصور الباهتة ، بالإضافة إلى الحاجة إلى توسيط إطار الصورة يدويًا في المنطقة التي تهمك.
    • استباق مصادر وقت الاختبار المتغيرة - إذا كنت تتوقع تغيرًا في أي من السمات المذكورة حتى الآن أثناء وقت الاختبار ، فتأكد من أنه يمكنك التقاط مصادر التباين هذه أثناء إنشاء بيانات التدريب. على سبيل المثال ، إذا كنت تتوقع أن يعمل تطبيق ML الخاص بك في عدة إعدادات إضاءة مختلفة ، فيجب أن تهدف إلى إنشاء صور ومقاطع فيديو تدريبية في إعدادات إضاءة مختلفة. اعتمادًا على حالة الاستخدام ، يمكن أن يؤثر التباين في وضع الكاميرا أيضًا على جودة ملصقاتك.
  • دمج المعرفة السابقة بالمجال عند توفرها - خذ بعين الاعتبار ما يلي:
    • المدخلات على مصادر الخطأ - يمكن لممارسي المجال تقديم رؤى حول مصادر الخطأ بناءً على سنوات خبرتهم. يمكنهم تقديم ملاحظات حول أفضل الممارسات للنقطتين السابقتين: ما هي الإعدادات التي تعكس حالة الاستخدام الواقعية بشكل أفضل؟ ما هي المصادر المحتملة للتغير أثناء جمع البيانات ، أو في وقت الاستخدام؟
    • أفضل ممارسات جمع البيانات الخاصة بالمجال - على الرغم من أن أصحاب المصلحة التقنيين قد يكون لديهم بالفعل فكرة جيدة عن الجوانب الفنية للتركيز عليها في الصور أو مقاطع الفيديو المجمعة ، يمكن لممارسي المجال تقديم ملاحظات حول أفضل السبل لتنظيم أو جمع البيانات بحيث يتم تلبية هذه الاحتياجات.

مراقبة الجودة وضمان جودة البيانات المُنشأة

الآن بعد أن أعددت خط أنابيب جمع البيانات ، قد يكون من المغري المضي قدمًا وجمع أكبر قدر ممكن من البيانات. انتظر دقيقة! يجب علينا أولاً التحقق مما إذا كانت البيانات التي تم جمعها من خلال الإعداد مناسبة لحالة استخدام الكلمة الحقيقية الخاصة بك. يمكننا استخدام بعض العينات الأولية وتحسين الإعداد بشكل متكرر من خلال الأفكار التي اكتسبناها من تحليل بيانات العينة. اعمل عن كثب مع أصحاب المصلحة التقنيين والأعمال والتعليقات التوضيحية أثناء العملية التجريبية. سيؤدي ذلك إلى التأكد من أن خط الأنابيب الناتج يلبي احتياجات العمل أثناء إنشاء بيانات معنونة جاهزة لـ ML ضمن الحد الأدنى من النفقات العامة.

الشروح

التعليق التوضيحي للمدخلات هو المكان الذي نضيف فيه اللمسة السحرية لبياناتنا - التسميات! اعتمادًا على نوع مهمتك وعملية إنشاء البيانات ، قد تحتاج إلى تعليقات توضيحية يدوية ، أو يمكنك استخدام طرق آلية جاهزة. يمكن أن يكون خط أنابيب التعليقات التوضيحية للبيانات نفسه مهمة صعبة تقنيًا. تعمل شركة Ground Truth على تسهيل هذه الرحلة لأصحاب المصلحة التقنيين من خلال ذخيرة مضمنة لوضع العلامات على سير العمل لمصادر البيانات الشائعة. مع بضع خطوات إضافية ، يمكنك أيضًا إنشاء ملفات سير عمل وضع العلامات المخصصة يتجاوز الخيارات المكونة مسبقًا.

اسأل نفسك الأسئلة التالية عند تطوير سير عمل التعليق التوضيحي المناسب:

  • هل أحتاج إلى عملية التعليقات التوضيحية اليدوية لبياناتي؟ في بعض الحالات ، قد تكون خدمات الملصقات الآلية كافية للمهمة المطروحة. يمكن أن تساعدك مراجعة الوثائق والأدوات المتاحة في تحديد ما إذا كان التعليق التوضيحي اليدوي ضروريًا لحالة الاستخدام الخاصة بك (لمزيد من المعلومات ، راجع ما هو تصنيف البيانات؟). يمكن أن تسمح عملية إنشاء البيانات بمستويات مختلفة من التحكم فيما يتعلق بدقة شرح البيانات. اعتمادًا على هذه العملية ، يمكنك أيضًا في بعض الأحيان تجاوز الحاجة إلى التعليقات التوضيحية اليدوية. لمزيد من المعلومات ، يرجى الرجوع إلى أنشئ مجموعة بيانات مخصصة للأسئلة والأجوبة باستخدام Amazon SageMaker Ground Truth لتدريب نموذج Hugging Face Q&A NLU.
  • ما الذي يشكل الحقيقة الأساسية الخاصة بي؟ في معظم الحالات ، ستأتي الحقيقة الأساسية من عملية التعليقات التوضيحية - وهذا هو بيت القصيد! في حالات أخرى ، قد يتمكن المستخدم من الوصول إلى ملصقات الحقيقة الأساسية. يمكن أن يؤدي ذلك إلى تسريع عملية ضمان الجودة بشكل كبير ، أو تقليل النفقات العامة المطلوبة للتعليقات التوضيحية اليدوية المتعددة.
  • ما هو الحد الأعلى لمقدار الانحراف عن حالة الحقيقة الأرضية الخاصة بي؟ اعمل مع المستخدمين النهائيين لفهم الأخطاء النموذجية حول هذه الملصقات ، ومصادر هذه الأخطاء ، والتقليل المطلوب من الأخطاء. سيساعدك هذا في تحديد جوانب مهمة وضع العلامات الأكثر صعوبة أو التي يحتمل أن تحتوي على أخطاء في التعليقات التوضيحية.
  • هل هناك قواعد موجودة مسبقًا يستخدمها المستخدمون أو الممارسون الميدانيون لتسمية هذه العناصر؟ استخدم هذه الإرشادات وصقلها لإنشاء مجموعة من الإرشادات للمعلقين اليدويين.

تجريب عملية إدخال التعليقات التوضيحية

عند تجربة عملية التعليق التوضيحي للإدخال ، ضع في اعتبارك ما يلي:

  • راجع التعليمات مع المعلقين والممارسين الميدانيين - يجب أن تكون التعليمات موجزة ومحددة. اطلب تعليقات من المستخدمين (هل الإرشادات دقيقة؟ هل يمكننا مراجعة أي تعليمات للتأكد من أنها مفهومة من قبل الممارسين غير الميدانيين؟) والمعلقين التوضيحيين (هل كل شيء مفهوم؟ هل المهمة واضحة؟). إذا أمكن ، أضف مثالاً للبيانات الجيدة والسيئة المصنفة لمساعدة المعلقين على تحديد ما هو متوقع ، وما قد تبدو عليه أخطاء التصنيف الشائعة.
  • جمع البيانات للتعليقات التوضيحية - راجع البيانات مع عميلك للتأكد من أنها تلبي المعايير المتوقعة ، ولمواءمة النتائج المتوقعة من التعليق التوضيحي اليدوي.
  • قدم أمثلة لمجموعة التعليقات التوضيحية اليدوية الخاصة بك كتشغيل اختباري - ما هو التباين النموذجي بين المعلقين في هذه المجموعة من الأمثلة؟ ادرس التباين لكل تعليق توضيحي داخل صورة معينة لتحديد اتجاهات التناسق بين المعلقين. ثم قارن الاختلافات عبر الصور أو إطارات الفيديو لتحديد الملصقات التي يصعب وضعها.

مراقبة جودة الشروح

تشتمل مراقبة جودة التعليقات التوضيحية على مكونين رئيسيين: تقييم التناسق بين المعلقين ، وتقييم جودة التعليقات التوضيحية نفسها.

يمكنك تعيين العديد من المعلقين التوضيحيين للمهمة نفسها (على سبيل المثال ، يقوم ثلاثة من المعلقين بتسمية النقاط الرئيسية على نفس الصورة) ، وقياس متوسط ​​القيمة جنبًا إلى جنب مع الانحراف المعياري لهذه التسميات بين المعلقين. يساعدك القيام بذلك على تحديد أي تعليقات توضيحية خارجية (تم استخدام تسمية غير صحيحة ، أو تسمية بعيدة عن التعليق التوضيحي المتوسط) ، والتي يمكن أن توجه النتائج القابلة للتنفيذ ، مثل تحسين التعليمات أو توفير مزيد من التدريب لبعض المعلقين.

يرتبط تقييم جودة التعليقات التوضيحية نفسها بتنوع المعلق التوضيحي و (عند توفرها) توافر خبراء المجال أو معلومات الحقيقة الأساسية. هل هناك تسميات معينة (عبر جميع صورك) حيث يكون متوسط ​​التباين بين المعلقين مرتفعًا باستمرار؟ هل هناك أي تسميات بعيدة عن توقعاتك للمكان الذي يجب أن تكون فيه ، أو الشكل الذي يجب أن تبدو عليه؟

بناءً على تجربتنا ، يمكن أن تبدو حلقة مراقبة الجودة النموذجية للتعليق التوضيحي للبيانات كما يلي:

  • كرر التعليمات أو وضع الصورة على مراحل بناءً على نتائج التشغيل التجريبي - هل تم حجب أي كائنات ، أم أن التدريج في الصورة لا يتطابق مع توقعات المعلقين أو المستخدمين؟ هل التعليمات مضللة ، أو هل فاتتك أي تسميات أو أخطاء شائعة في صورك النموذجية؟ هل يمكنك تنقيح التعليمات الخاصة بملاحقك؟
  • إذا كنت مقتنعًا بأنك عالجت أية مشكلات من التشغيل التجريبي ، فقم بإجراء مجموعة من التعليقات التوضيحية - لاختبار النتائج من الدُفعة ، اتبع نفس نهج تقييم الجودة لتقييم متغيرات الملصق بين المعلقين وبين الصور.

وفي الختام

يعمل هذا المنشور كدليل لأصحاب المصلحة في الأعمال لفهم تعقيدات إنشاء البيانات لتطبيقات AI / ML. تعمل العمليات الموضحة أيضًا كدليل للممارسين التقنيين لإنشاء بيانات عالية الجودة مع تحسين قيود العمل مثل الموظفين والتكاليف. إذا لم يتم القيام به بشكل جيد ، فقد يستغرق إنشاء البيانات ووضع العلامات ما يصل إلى 4-6 أشهر.

باستخدام الإرشادات والاقتراحات الموضحة في هذا المنشور ، يمكنك استباق حواجز الطرق وتقليل الوقت حتى الانتهاء وتقليل التكاليف في رحلتك نحو إنشاء بيانات عالية الجودة.


عن المؤلفين

قم بإنشاء بيانات عالية الجودة لنماذج ML باستخدام Amazon SageMaker Ground Truth PlatoBlockchain Data Intelligence. البحث العمودي. عاي.جاسلين جريوال هي عالمة تطبيقية في Amazon Web Services ، حيث تعمل مع عملاء AWS لحل مشكلات العالم الحقيقي باستخدام التعلم الآلي ، مع التركيز بشكل خاص على الطب الدقيق وعلم الجينوم. لديها خلفية قوية في المعلوماتية الحيوية وعلم الأورام والجينوميات السريرية. إنها شغوفة باستخدام الذكاء الاصطناعي / التعلم الآلي والخدمات السحابية لتحسين رعاية المرضى.

قم بإنشاء بيانات عالية الجودة لنماذج ML باستخدام Amazon SageMaker Ground Truth PlatoBlockchain Data Intelligence. البحث العمودي. عاي.بوريس أرونشيك هو مدير في مختبر حلول التعلم الآلي في Amazon AI ، حيث يقود فريقًا من علماء ومهندسي ML لمساعدة عملاء AWS على تحقيق أهداف العمل التي تستفيد من حلول AI / ML.

قم بإنشاء بيانات عالية الجودة لنماذج ML باستخدام Amazon SageMaker Ground Truth PlatoBlockchain Data Intelligence. البحث العمودي. عاي.ميغيل روميرو كالفو هو عالم تطبيقي في مختبر أمازون ML Solutions حيث يشترك مع فرق AWS الداخلية والعملاء الاستراتيجيين لتسريع أعمالهم من خلال تبني التعلم الآلي والسحابة.

قم بإنشاء بيانات عالية الجودة لنماذج ML باستخدام Amazon SageMaker Ground Truth PlatoBlockchain Data Intelligence. البحث العمودي. عاي.لين لي تشيونغ هو عالم أول ومدير مع فريق Amazon ML Solutions Lab في Amazon Web Services. تعمل مع عملاء AWS الاستراتيجيين لاستكشاف وتطبيق الذكاء الاصطناعي والتعلم الآلي لاكتشاف رؤى جديدة وحل المشكلات المعقدة.

الطابع الزمني:

اكثر من التعلم الآلي من AWS