نکاتی برای بهبود مدل برچسب های سفارشی شناسایی آمازون

بازنشر افلاطون

دنبال: 0

در این پست، بهترین روش‌ها را برای بهبود عملکرد مدل‌های بینایی کامپیوتری با استفاده از آن مورد بحث قرار می‌دهیم برچسب های سفارشی شناسایی آمازون. Rekognition Custom Labels یک سرویس کاملاً مدیریت شده برای ساخت مدل های دید کامپیوتری سفارشی برای طبقه بندی تصاویر و موارد استفاده تشخیص اشیا است. Rekognition Custom Labels از مدل های از پیش آموزش دیده ساخته شده است شناسایی آمازون، که قبلاً روی ده ها میلیون تصویر در بسیاری از دسته ها آموزش داده شده اند. به جای هزاران تصویر، می توانید با مجموعه کوچکی از تصاویر آموزشی (چند صد یا کمتر) که مخصوص مورد استفاده شما هستند شروع کنید. Rekognition Custom Labels پیچیدگی موجود در ساخت یک مدل سفارشی را از بین می برد. به طور خودکار داده های آموزشی را بررسی می کند، الگوریتم های ML مناسب را انتخاب می کند، نوع نمونه را انتخاب می کند، چندین مدل کاندید را با تنظیمات فراپارامترهای مختلف آموزش می دهد و بهترین مدل آموزش دیده را خروجی می دهد. Rekognition Custom Labels همچنین یک رابط کاربری آسان برای استفاده از کنسول مدیریت AWS برای مدیریت کل گردش کار ML، از جمله برچسب زدن به تصاویر، آموزش مدل، استقرار مدل، و تجسم نتایج آزمایش.

مواقعی وجود دارد که دقت مدل در بهترین حالت نیست و گزینه های زیادی برای تنظیم پارامترهای پیکربندی مدل ندارید. در پشت صحنه عوامل متعددی وجود دارد که نقش کلیدی در ساخت یک مدل با عملکرد بالا دارند، مانند موارد زیر:

زاویه تصویر
وضوح تصویر
نسبت تصویر
قرار گرفتن در معرض نور
وضوح و واضح بودن پس زمینه
کنتراست رنگ
اندازه داده های نمونه

برای آموزش مدل برچسب‌های سفارشی شناسایی درجه تولید، مراحل کلی زیر باید دنبال شود:

بررسی تاکسونومی – این لیستی از ویژگی ها/مواردی را که می خواهید در یک تصویر شناسایی کنید، مشخص می کند.
داده های مرتبط را جمع آوری کنید - این مهمترین مرحله است، جایی که شما باید تصاویر مرتبطی را که باید شبیه آنچه در یک محیط تولید می بینید، جمع آوری کنید. این می تواند شامل تصاویری از اشیاء با پس زمینه، نور، یا زوایای دوربین متفاوت باشد. سپس با تقسیم تصاویر جمع آوری شده، مجموعه داده های آموزشی و آزمایشی ایجاد می کنید. شما باید فقط تصاویر دنیای واقعی را به عنوان بخشی از مجموعه داده آزمایشی بگنجانید، و نباید هیچ تصویری را که به صورت مصنوعی تولید شده است، درج کنید. حاشیه نویسی داده هایی که جمع آوری کرده اید برای عملکرد مدل بسیار مهم است. اطمینان حاصل کنید که جعبه های محدود کننده در اطراف اجسام محکم هستند و برچسب ها دقیق هستند. ما نکاتی را که می‌توانید هنگام ساخت یک مجموعه داده مناسب در نظر بگیرید، در این پست مورد بحث قرار می‌دهیم.
بررسی معیارهای آموزشی - از مجموعه داده های قبلی برای آموزش یک مدل و بررسی معیارهای آموزشی برای امتیاز F1، دقت و یادآوری استفاده کنید. در ادامه این پست در مورد چگونگی تجزیه و تحلیل معیارهای آموزشی با جزئیات صحبت خواهیم کرد.
مدل آموزش دیده را ارزیابی کنید - از مجموعه ای از تصاویر دیده نشده (که برای آموزش مدل استفاده نمی شود) با برچسب های شناخته شده برای ارزیابی پیش بینی ها استفاده کنید. این مرحله باید همیشه انجام شود تا اطمینان حاصل شود که مدل مطابق انتظار در یک محیط تولید عمل می کند.
آموزش مجدد (اختیاری) – به طور کلی، آموزش هر مدل یادگیری ماشینی یک فرآیند تکراری برای دستیابی به نتایج مطلوب است، مدل بینایی کامپیوتری تفاوتی ندارد. نتایج مرحله 4 را مرور کنید تا ببینید آیا نیاز است تصاویر بیشتری به داده های آموزشی اضافه شود یا خیر و مراحل 3 تا 5 بالا را تکرار کنید.

در این پست، ما بر روی بهترین شیوه ها در مورد جمع آوری داده های مرتبط (مرحله 2) و ارزیابی معیارهای آموزش دیده شما (مرحله 3) برای بهبود عملکرد مدل تمرکز می کنیم.

داده های مرتبط را جمع آوری کنید

این مهم‌ترین مرحله آموزش مدل برچسب‌های سفارشی شناسایی درجه تولید است. به طور خاص، دو مجموعه داده وجود دارد: آموزش و آزمایش. داده های آموزشی برای آموزش مدل استفاده می شود و شما باید تلاش خود را صرف ساختن یک مجموعه آموزشی مناسب کنید. مدل‌های برچسب‌های سفارشی شناسایی برای بهینه‌سازی شده‌اند امتیاز F1 در مجموعه داده آزمایشی برای انتخاب دقیق ترین مدل برای پروژه خود. بنابراین، تهیه یک مجموعه داده آزمایشی که شبیه دنیای واقعی باشد، ضروری است.

تعداد تصاویر

توصیه می کنیم حداقل 15 تا 20 تصویر در هر برچسب داشته باشید. داشتن تصاویر بیشتر با تغییرات بیشتر که نشان دهنده مورد استفاده شما باشد، عملکرد مدل را بهبود می بخشد.

مجموعه داده متوازن

در حالت ایده آل، هر برچسب در مجموعه داده باید دارای تعداد مشابهی از نمونه ها باشد. نباید اختلاف زیادی در تعداد تصاویر در هر برچسب وجود داشته باشد. به عنوان مثال، مجموعه داده ای که در آن بیشترین تعداد تصاویر برای یک برچسب 1,000 در مقابل 50 تصویر برای یک برچسب دیگر است، شبیه یک مجموعه داده نامتعادل است. توصیه می کنیم از سناریوهایی با نسبت کج 1:50 بین برچسب با کمترین تعداد تصویر در مقابل برچسب با بیشترین تعداد تصویر اجتناب کنید.

انواع مختلف تصاویر

تصاویری را در مجموعه آموزشی و آزمایشی قرار دهید که شبیه آنچه در دنیای واقعی استفاده خواهید کرد. به عنوان مثال، اگر می خواهید تصاویر اتاق های نشیمن را در مقابل اتاق خواب ها طبقه بندی کنید، باید تصاویر خالی و مبله هر دو اتاق را قرار دهید.

تصویر زیر نمونه ای از یک اتاق نشیمن مبله است.

در مقابل، موارد زیر نمونه ای از یک اتاق نشیمن بدون مبلمان است.

تصویر زیر نمونه ای از یک اتاق خواب مبله است.

تصویر زیر نمونه ای از یک اتاق خواب بدون مبلمان است.

پس زمینه های مختلف

شامل تصاویر با پس زمینه های مختلف. تصاویر با زمینه طبیعی می توانند نتایج بهتری نسبت به پس زمینه ساده ارائه دهند.

تصویر زیر نمونه ای از حیاط جلویی یک خانه است.

تصویر زیر نمونه ای از حیاط جلویی یک خانه متفاوت با پس زمینه متفاوت است.

شرایط نوری متفاوت

تصاویری را با نورهای متفاوت بگنجانید تا شرایط نوری متفاوتی را که در حین استنتاج رخ می‌دهند را پوشش دهد (مثلاً با و بدون فلاش). همچنین می توانید تصاویری با اشباع، رنگ و روشنایی متفاوت اضافه کنید.

تصویر زیر نمونه ای از یک گل در زیر نور معمولی است.

در مقابل، تصویر زیر مربوط به همین گل در زیر نور شدید است.

زوایای مختلف

شامل تصاویر گرفته شده از زوایای مختلف شی. این به مدل کمک می کند تا ویژگی های مختلف اشیاء را بیاموزد.

تصاویر زیر مربوط به یک اتاق خواب از زوایای مختلف است.

نکاتی برای بهبود مدل برچسب‌های سفارشی شناسایی آمازون، هوش داده PlatoBlockchain. جستجوی عمودی Ai.

ممکن است مواردی وجود داشته باشد که امکان به دست آوردن تصاویر با انواع مختلف وجود نداشته باشد. در این سناریوها، تصاویر مصنوعی را می توان به عنوان بخشی از مجموعه داده آموزشی تولید کرد. برای کسب اطلاعات بیشتر در مورد تکنیک های رایج افزایش تصویر، به افزایش داده ها.

برچسب های منفی اضافه کنید

برای طبقه بندی تصاویر، افزودن برچسب های منفی می تواند به افزایش دقت مدل کمک کند. به عنوان مثال، می توانید یک برچسب منفی اضافه کنید که با هیچ یک از برچسب های مورد نیاز مطابقت ندارد. تصویر زیر نشان دهنده برچسب های مختلفی است که برای شناسایی گل های کاملاً رشد یافته استفاده می شود.

اضافه کردن برچسب منفی not_fully_grown به مدل کمک می کند تا ویژگی هایی را بیاموزد که بخشی از آن نیستند fully_grown برچسب.

رسیدگی به سردرگمی برچسب

نتایج را روی مجموعه داده آزمایشی تجزیه و تحلیل کنید تا هر الگوی را که در مجموعه داده آموزشی یا آزمایشی از قلم افتاده است، تشخیص دهید. گاهی اوقات تشخیص چنین الگوهایی با بررسی بصری تصاویر آسان است. در تصویر زیر، مدل در حال تقلای بین برچسب حیاط خلوت در مقابل پاسیو است.

در این سناریو، افزودن تصاویر بیشتر به این برچسب ها در مجموعه داده و همچنین تعریف مجدد برچسب ها به طوری که هر برچسب متمایز باشد، می تواند به افزایش دقت مدل کمک کند.

افزایش داده ها

در داخل برچسب‌های سفارشی Rekognition، ما برای آموزش مدل، داده‌های مختلفی را افزایش می‌دهیم، از جمله برش تصادفی تصویر، لرزش رنگ، نویزهای تصادفی گاوسی و موارد دیگر. بر اساس موارد استفاده خاص شما، افزودن افزودن داده های صریح تر به داده های آموزشی خود نیز ممکن است مفید باشد. به عنوان مثال، اگر شما علاقه مند به تشخیص حیوانات در تصاویر رنگی و سیاه و سفید هستید، به طور بالقوه می توانید با افزودن نسخه های سیاه و سفید و رنگی تصاویر مشابه به داده های آموزشی دقت بهتری کسب کنید.

ما افزایش در داده‌های آزمایشی را توصیه نمی‌کنیم مگر اینکه تقویت‌ها موارد استفاده تولید شما را منعکس کنند.

بررسی معیارهای آموزشی

امتیاز F1، دقت، فراخوانی و آستانه فرضی عبارتند از متریک که به عنوان خروجی از آموزش یک مدل با استفاده از برچسب های سفارشی شناسایی تولید می شوند. مدل ها برای بهترین امتیاز F1 بر اساس مجموعه داده آزمایشی ارائه شده بهینه شده اند. آستانه فرضی نیز بر اساس مجموعه داده های آزمایشی تولید می شود. شما می توانید آستانه را بر اساس نیاز کسب و کار خود از نظر دقت یا فراخوان تنظیم کنید.

از آنجایی که آستانه‌های مفروض بر روی مجموعه داده‌های آزمایشی تنظیم می‌شوند، یک مجموعه آزمایشی مناسب باید منعکس‌کننده مورد استفاده تولید در دنیای واقعی باشد. اگر مجموعه داده آزمایشی نماینده مورد استفاده نباشد، ممکن است نمرات F1 مصنوعی و عملکرد ضعیف مدل را در تصاویر دنیای واقعی خود مشاهده کنید.

این معیارها هنگام انجام ارزیابی اولیه مدل مفید هستند. برای یک سیستم درجه تولید، توصیه می‌کنیم مدل را در برابر یک مجموعه داده خارجی (500 تا 1,000 تصویر دیده‌نشده) که نماینده دنیای واقعی است، ارزیابی کنید. این به ارزیابی نحوه عملکرد مدل در یک سیستم تولید و همچنین شناسایی الگوهای گمشده و اصلاح آنها با آموزش مجدد مدل کمک می کند. اگر بین نمرات F1 و ارزیابی خارجی ناهماهنگی مشاهده کردید، به شما پیشنهاد می کنیم بررسی کنید که آیا داده های آزمون شما منعکس کننده موارد استفاده در دنیای واقعی هستند یا خیر.

نتیجه

در این پست، شما را از طریق بهترین روش‌ها برای بهبود مدل‌های برچسب‌های سفارشی شناسایی آشنا کردیم. ما شما را تشویق می کنیم که در مورد آن بیشتر بدانید برچسب های سفارشی شناسایی و آن را برای مجموعه داده های خاص کسب و کار خود امتحان کنید.

درباره نویسندگان

آمیت گوپتا یک معمار ارشد راه حل های خدمات هوش مصنوعی در AWS است. او مشتاق است که مشتریان را با راه‌حل‌های یادگیری ماشینی با معماری خوب در مقیاس قادر سازد.

یوگش چاتورودی یک معمار راه حل در AWS با تمرکز بر بینایی کامپیوتر است. او با مشتریان کار می کند تا با استفاده از فناوری های ابری به چالش های تجاری آنها رسیدگی کند. خارج از محل کار، او از پیاده روی، مسافرت و تماشای ورزش لذت می برد.

هائو یانگ یک دانشمند کاربردی ارشد در تیم آمازون Rekognition Custom Labels است. علایق اصلی تحقیقاتی او تشخیص اشیا و یادگیری با حاشیه نویسی محدود است. هائو در خارج از آثار، از تماشای فیلم، عکاسی و فعالیت های خارج از منزل لذت می برد.

Pasmeen Mistry مدیر ارشد محصول برای برچسب های سفارشی شناسایی آمازون است. پشمین خارج از محل کار، از پیاده روی های ماجراجویانه، عکاسی و گذراندن وقت با خانواده اش لذت می برد.

تمبر زمان: سپتامبر 9، 2022سپتامبر 10، 2022

تمبر زمان: ژوئن 15، 2022

نکاتی برای بهبود مدل برچسب‌های سفارشی شناسایی آمازون

بازنشر افلاطون

داده های مرتبط را جمع آوری کنید

تعداد تصاویر

مجموعه داده متوازن

انواع مختلف تصاویر

پس زمینه های مختلف

شرایط نوری متفاوت

زوایای مختلف

برچسب های منفی اضافه کنید

رسیدگی به سردرگمی برچسب

افزایش داده ها

بررسی معیارهای آموزشی

نتیجه

درباره نویسندگان

بیشتر از آموزش ماشین AWS

معیارهایی برای ارزیابی تعدیل محتوا در آمازون Rekognition و سایر خدمات تعدیل محتوا

اعلام سازنده گفتگوی بصری برای آمازون لکس

تشخیص ناهنجاری با Amazon SageMaker Edge Manager با استفاده از AWS IoT Greengrass V2

تنظیم خودکار مدل را با Amazon SageMaker JumpStart اجرا کنید

چگونه SIGNAL IDUNA پروژه های یادگیری ماشین را در AWS عملیاتی می کند

Accenture با استفاده از خدمات هوش مصنوعی مولد AWS راه حل تنظیم اسناد تنظیمی ایجاد می کند خدمات وب آمازون

ویژگی های متن چند زبانه را در آمازون نپتون برای آموزش مدل های پیش بینی کدگذاری کنید

تأثیر تولید به‌روزرسانی‌های مدل ML را با آزمایش سایه Amazon SageMaker به حداقل برسانید

با استفاده از Amazon Polly تلفظ ها را سفارشی کنید

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب