مدل‌های طبقه‌بندی تصویر با کارایی بالا را با استفاده از هوش داده‌ای آمازون SageMaker JumpStart PlatoBlockchain بسازید. جستجوی عمودی Ai.

با استفاده از Amazon SageMaker JumpStart، مدل‌های طبقه‌بندی تصویر با عملکرد بالا بسازید

طبقه بندی تصویر یک تکنیک یادگیری ماشینی مبتنی بر بینایی کامپیوتری (ML) است که به شما امکان می دهد تصاویر را طبقه بندی کنید. برخی از نمونه های شناخته شده طبقه بندی تصاویر شامل طبقه بندی ارقام دست نویس، طبقه بندی تصاویر پزشکی و تشخیص چهره می باشد. طبقه بندی تصویر یک تکنیک مفید با چندین برنامه تجاری است، اما ساختن یک مدل طبقه بندی تصویر خوب بی اهمیت نیست.

چندین ملاحظه می توانند در ارزیابی یک مدل ML نقش داشته باشند. فراتر از دقت مدل، سایر معیارهای بالقوه مهم زمان آموزش مدل و زمان استنتاج هستند. با توجه به ماهیت تکراری توسعه مدل ML، زمان های آموزش سریعتر به دانشمندان داده اجازه می دهد تا به سرعت فرضیه های مختلف را آزمایش کنند. استنتاج سریعتر می تواند در برنامه های بلادرنگ حیاتی باشد.

Amazon SageMaker JumpStart تنظیم دقیق و استقرار طیف گسترده ای از مدل های از پیش آموزش داده شده را با یک کلیک در وظایف رایج ML و همچنین مجموعه ای از راه حل های سرتاسری که مشکلات رایج تجاری را حل می کند، ارائه می دهد. این ویژگی‌ها بار سنگین را از هر مرحله از فرآیند ML حذف می‌کنند و توسعه مدل‌های با کیفیت بالا را آسان‌تر می‌کنند و زمان استقرار را کاهش می‌دهند. API های JumpStart به شما این امکان را می دهد که مجموعه وسیعی از مدل های از پیش آموزش دیده با پشتیبانی از JumpStart را در مجموعه داده های خود به صورت برنامه ریزی شده مستقر و تنظیم کنید.

شما می توانید به صورت تدریجی مدل های ML ارائه شده در JumpStart را قبل از استقرار آموزش داده و تنظیم کنید. در زمان نگارش مقاله، 87 مدل طبقه‌بندی تصویر مبتنی بر یادگیری عمیق در JumpStart موجود است.

اما کدام مدل بهترین نتیجه را به شما می دهد؟ در این پست، روشی را برای اجرای آسان چندین مدل و مقایسه خروجی های آنها در سه بعد مورد علاقه ارائه می دهیم: دقت مدل، زمان آموزش و زمان استنتاج.

بررسی اجمالی راه حل

JumpStart به شما این امکان را می دهد که مدل ها را از کنسول JumpStart با استفاده از UI یا با API آن آموزش دهید، تنظیم کنید و اجرا کنید. در این پست از مسیر API استفاده می کنیم و یک دفترچه یادداشت با اسکریپت های کمکی مختلف ارائه می دهیم. می‌توانید این نوت‌بوک را اجرا کنید و نتایجی را برای مقایسه آسان این مدل‌ها با یکدیگر به دست آورید و سپس مدلی را انتخاب کنید که از نظر دقت مدل، زمان آموزش و زمان استنباط بهترین نیاز کسب‌وکار شما را داشته باشد.

La مجموعه داده عمومی استفاده شده در این پست شامل نزدیک به 55,000 تصویر از برگ های گیاهی بیمار و سالم است که در شرایط کنترل شده جمع آوری شده اند، با برچسب های کلاس از 0 تا 38. این مجموعه داده به مجموعه داده‌های قطار و اعتباربخشی تقسیم می‌شود که تقریباً 44,000 تصویر تحت آموزش و 11,000 تصویر در حال تأیید است. در ادامه چند نمونه از تصاویر آورده شده است.

برای این تمرین، مدل‌هایی را از دو چارچوب PyTorch و TensorFlow که توسط JumpStart ارائه شده‌اند انتخاب کردیم. 15 الگوریتم مدل زیر طیف گسترده ای از معماری شبکه های عصبی محبوب را از این چارچوب ها پوشش می دهد:

  • pytorch-ic-alexnet-FT
  • pytorch-ic-densenet121-FT
  • pytorch-ic-densenet201-FT
  • pytorch-ic-googlenet-FT
  • pytorch-ic-mobilenet-v2-FT
  • pytorch-ic-resnet152-FT
  • pytorch-ic-resnet34-FT
  • tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
  • tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
  • tensorflow-ic-imagenet-inception-v3-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
  • tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
  • tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

ما از مدل استفاده می کنیم tensorflow-ic-imagenet-inception-v3-classification-4-FT به عنوان پایه ای که نتایج حاصل از مدل های دیگر با آن مقایسه می شود. این مدل پایه خودسرانه انتخاب شد.

کد مورد استفاده برای اجرای این مقایسه در دسترس است AWS Samples مخزن GitHub.

نتایج

در این بخش، نتایج حاصل از این 15 اجرا را ارائه می کنیم. برای همه این اجراها، فراپارامترهای استفاده شده عبارتند از: دوره = 5، نرخ یادگیری = 0.001، اندازه دسته = 16.

دقت مدل، زمان آموزش و زمان استنتاج از مدل tensorflow-ic-imagenet-inception-v3-classification-4-FT به عنوان پایه در نظر گرفته شد، و نتایج از تمام مدل های دیگر نسبت به این مدل پایه ارائه شده است. هدف ما در اینجا این نیست که نشان دهیم کدام مدل بهترین است، بلکه نشان می‌دهیم که چگونه از طریق JumpStart API، می‌توانید نتایج مدل‌های مختلف را مقایسه کنید و سپس مدلی را انتخاب کنید که به بهترین وجه مناسب مورد استفاده شما باشد.

اسکرین شات زیر مدل پایه ای را که تمام مدل های دیگر با آن مقایسه شده اند برجسته می کند.

مدل‌های طبقه‌بندی تصویر با کارایی بالا را با استفاده از هوش داده‌ای آمازون SageMaker JumpStart PlatoBlockchain بسازید. جستجوی عمودی Ai.

نمودار زیر نمای دقیقی از دقت نسبی در مقابل زمان نسبی تمرین را نشان می دهد. مدل‌های PyTorch با رنگ قرمز و مدل‌های TensorFlow به رنگ آبی کدگذاری شده‌اند.

مدل‌های طبقه‌بندی تصویر با کارایی بالا را با استفاده از هوش داده‌ای آمازون SageMaker JumpStart PlatoBlockchain بسازید. جستجوی عمودی Ai.

به نظر می‌رسد مدل‌هایی که در طرح قبل با بیضی سبز برجسته شده‌اند، ترکیب خوبی از دقت نسبی و زمان آموزش نسبی کم دارند. در جدول زیر جزئیات بیشتری از این سه مدل ارائه شده است.

نام مدل دقت نسبی زمان نسبی آموزش
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT 1.04 1.16

نمودار زیر دقت نسبی را با زمان استنتاج نسبی مقایسه می کند. مدل‌های PyTorch با رنگ قرمز و مدل‌های TensorFlow به رنگ آبی کدگذاری شده‌اند.

مدل‌های طبقه‌بندی تصویر با کارایی بالا را با استفاده از هوش داده‌ای آمازون SageMaker JumpStart PlatoBlockchain بسازید. جستجوی عمودی Ai.

جدول زیر جزئیات سه مدل بیضی سبز را ارائه می دهد.

نام مدل دقت نسبی زمان استنتاج نسبی
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT 1.04 1.43

دو نمودار به وضوح نشان می‌دهند که الگوریتم‌های مدل معینی در سه بعد انتخاب شده بهتر از سایرین عمل می‌کنند. انعطاف پذیری ارائه شده از طریق این تمرین می تواند به شما در انتخاب الگوریتم مناسب کمک کند و با استفاده از دفترچه یادداشت ارائه شده، می توانید به راحتی این نوع آزمایش را بر روی هر یک از 87 مدل موجود اجرا کنید.

نتیجه

در این پست، نحوه استفاده از JumpStart برای ساخت مدل‌های طبقه‌بندی تصویر با کارایی بالا در ابعاد مختلف مورد علاقه، مانند دقت مدل، زمان آموزش و تأخیر استنتاج را نشان دادیم. ما همچنین کدی را برای اجرای این تمرین بر روی مجموعه داده خود ارائه کردیم. شما می توانید هر مدل مورد علاقه خود را از 87 مدلی که در حال حاضر برای طبقه بندی تصاویر در مرکز مدل JumpStart در دسترس هستند، انتخاب کنید. ما شما را تشویق می کنیم که امروز آن را امتحان کنید.

برای جزئیات بیشتر در مورد JumpStart، مراجعه کنید SageMaker JumpStart.


درباره نویسنده

مدل‌های طبقه‌بندی تصویر با کارایی بالا را با استفاده از هوش داده‌ای آمازون SageMaker JumpStart PlatoBlockchain بسازید. جستجوی عمودی Ai.دکتر راجو پنماچا یک معمار راه حل های تخصصی AI/ML در پلتفرم های هوش مصنوعی در AWS است. او دکترای خود را از دانشگاه استنفورد دریافت کرد. او از نزدیک روی مجموعه سرویس‌های کم/بدون کد در SageMaker کار می‌کند، که به مشتریان کمک می‌کند تا به راحتی مدل‌ها و راه‌حل‌های یادگیری ماشین را بسازند و به کار گیرند. وقتی به مشتریان کمک نمی کند، دوست دارد به مکان های جدید سفر کند.

مدل‌های طبقه‌بندی تصویر با کارایی بالا را با استفاده از هوش داده‌ای آمازون SageMaker JumpStart PlatoBlockchain بسازید. جستجوی عمودی Ai.دکتر آشیش ختان یک دانشمند کاربردی ارشد با الگوریتم های داخلی Amazon SageMaker است و به توسعه الگوریتم های یادگیری ماشین کمک می کند. او دکترای خود را از دانشگاه ایلینویز Urbana-Champaign گرفت. او یک محقق فعال در یادگیری ماشین و استنتاج آماری است و مقالات زیادی در کنفرانس های NeurIPS، ICML، ICLR، JMLR، ACL و EMNLP منتشر کرده است.

تمبر زمان:

بیشتر از آموزش ماشین AWS