طبقه بندی تصویر یک تکنیک یادگیری ماشینی مبتنی بر بینایی کامپیوتری (ML) است که به شما امکان می دهد تصاویر را طبقه بندی کنید. برخی از نمونه های شناخته شده طبقه بندی تصاویر شامل طبقه بندی ارقام دست نویس، طبقه بندی تصاویر پزشکی و تشخیص چهره می باشد. طبقه بندی تصویر یک تکنیک مفید با چندین برنامه تجاری است، اما ساختن یک مدل طبقه بندی تصویر خوب بی اهمیت نیست.
چندین ملاحظه می توانند در ارزیابی یک مدل ML نقش داشته باشند. فراتر از دقت مدل، سایر معیارهای بالقوه مهم زمان آموزش مدل و زمان استنتاج هستند. با توجه به ماهیت تکراری توسعه مدل ML، زمان های آموزش سریعتر به دانشمندان داده اجازه می دهد تا به سرعت فرضیه های مختلف را آزمایش کنند. استنتاج سریعتر می تواند در برنامه های بلادرنگ حیاتی باشد.
Amazon SageMaker JumpStart تنظیم دقیق و استقرار طیف گسترده ای از مدل های از پیش آموزش داده شده را با یک کلیک در وظایف رایج ML و همچنین مجموعه ای از راه حل های سرتاسری که مشکلات رایج تجاری را حل می کند، ارائه می دهد. این ویژگیها بار سنگین را از هر مرحله از فرآیند ML حذف میکنند و توسعه مدلهای با کیفیت بالا را آسانتر میکنند و زمان استقرار را کاهش میدهند. API های JumpStart به شما این امکان را می دهد که مجموعه وسیعی از مدل های از پیش آموزش دیده با پشتیبانی از JumpStart را در مجموعه داده های خود به صورت برنامه ریزی شده مستقر و تنظیم کنید.
شما می توانید به صورت تدریجی مدل های ML ارائه شده در JumpStart را قبل از استقرار آموزش داده و تنظیم کنید. در زمان نگارش مقاله، 87 مدل طبقهبندی تصویر مبتنی بر یادگیری عمیق در JumpStart موجود است.
اما کدام مدل بهترین نتیجه را به شما می دهد؟ در این پست، روشی را برای اجرای آسان چندین مدل و مقایسه خروجی های آنها در سه بعد مورد علاقه ارائه می دهیم: دقت مدل، زمان آموزش و زمان استنتاج.
بررسی اجمالی راه حل
JumpStart به شما این امکان را می دهد که مدل ها را از کنسول JumpStart با استفاده از UI یا با API آن آموزش دهید، تنظیم کنید و اجرا کنید. در این پست از مسیر API استفاده می کنیم و یک دفترچه یادداشت با اسکریپت های کمکی مختلف ارائه می دهیم. میتوانید این نوتبوک را اجرا کنید و نتایجی را برای مقایسه آسان این مدلها با یکدیگر به دست آورید و سپس مدلی را انتخاب کنید که از نظر دقت مدل، زمان آموزش و زمان استنباط بهترین نیاز کسبوکار شما را داشته باشد.
La مجموعه داده عمومی استفاده شده در این پست شامل نزدیک به 55,000 تصویر از برگ های گیاهی بیمار و سالم است که در شرایط کنترل شده جمع آوری شده اند، با برچسب های کلاس از 0 تا 38. این مجموعه داده به مجموعه دادههای قطار و اعتباربخشی تقسیم میشود که تقریباً 44,000 تصویر تحت آموزش و 11,000 تصویر در حال تأیید است. در ادامه چند نمونه از تصاویر آورده شده است.
برای این تمرین، مدلهایی را از دو چارچوب PyTorch و TensorFlow که توسط JumpStart ارائه شدهاند انتخاب کردیم. 15 الگوریتم مدل زیر طیف گسترده ای از معماری شبکه های عصبی محبوب را از این چارچوب ها پوشش می دهد:
pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT
ما از مدل استفاده می کنیم tensorflow-ic-imagenet-inception-v3-classification-4-FT
به عنوان پایه ای که نتایج حاصل از مدل های دیگر با آن مقایسه می شود. این مدل پایه خودسرانه انتخاب شد.
کد مورد استفاده برای اجرای این مقایسه در دسترس است AWS Samples مخزن GitHub.
نتایج
در این بخش، نتایج حاصل از این 15 اجرا را ارائه می کنیم. برای همه این اجراها، فراپارامترهای استفاده شده عبارتند از: دوره = 5، نرخ یادگیری = 0.001، اندازه دسته = 16.
دقت مدل، زمان آموزش و زمان استنتاج از مدل tensorflow-ic-imagenet-inception-v3-classification-4-FT
به عنوان پایه در نظر گرفته شد، و نتایج از تمام مدل های دیگر نسبت به این مدل پایه ارائه شده است. هدف ما در اینجا این نیست که نشان دهیم کدام مدل بهترین است، بلکه نشان میدهیم که چگونه از طریق JumpStart API، میتوانید نتایج مدلهای مختلف را مقایسه کنید و سپس مدلی را انتخاب کنید که به بهترین وجه مناسب مورد استفاده شما باشد.
اسکرین شات زیر مدل پایه ای را که تمام مدل های دیگر با آن مقایسه شده اند برجسته می کند.
نمودار زیر نمای دقیقی از دقت نسبی در مقابل زمان نسبی تمرین را نشان می دهد. مدلهای PyTorch با رنگ قرمز و مدلهای TensorFlow به رنگ آبی کدگذاری شدهاند.
به نظر میرسد مدلهایی که در طرح قبل با بیضی سبز برجسته شدهاند، ترکیب خوبی از دقت نسبی و زمان آموزش نسبی کم دارند. در جدول زیر جزئیات بیشتری از این سه مدل ارائه شده است.
نام مدل | دقت نسبی | زمان نسبی آموزش |
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT | 1.01 | 0.74 |
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT | 1.02 | 0.74 |
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT | 1.04 | 1.16 |
نمودار زیر دقت نسبی را با زمان استنتاج نسبی مقایسه می کند. مدلهای PyTorch با رنگ قرمز و مدلهای TensorFlow به رنگ آبی کدگذاری شدهاند.
جدول زیر جزئیات سه مدل بیضی سبز را ارائه می دهد.
نام مدل | دقت نسبی | زمان استنتاج نسبی |
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT | 1.01 | 0.94 |
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT | 1.02 | 0.90 |
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT | 1.04 | 1.43 |
دو نمودار به وضوح نشان میدهند که الگوریتمهای مدل معینی در سه بعد انتخاب شده بهتر از سایرین عمل میکنند. انعطاف پذیری ارائه شده از طریق این تمرین می تواند به شما در انتخاب الگوریتم مناسب کمک کند و با استفاده از دفترچه یادداشت ارائه شده، می توانید به راحتی این نوع آزمایش را بر روی هر یک از 87 مدل موجود اجرا کنید.
نتیجه
در این پست، نحوه استفاده از JumpStart برای ساخت مدلهای طبقهبندی تصویر با کارایی بالا در ابعاد مختلف مورد علاقه، مانند دقت مدل، زمان آموزش و تأخیر استنتاج را نشان دادیم. ما همچنین کدی را برای اجرای این تمرین بر روی مجموعه داده خود ارائه کردیم. شما می توانید هر مدل مورد علاقه خود را از 87 مدلی که در حال حاضر برای طبقه بندی تصاویر در مرکز مدل JumpStart در دسترس هستند، انتخاب کنید. ما شما را تشویق می کنیم که امروز آن را امتحان کنید.
برای جزئیات بیشتر در مورد JumpStart، مراجعه کنید SageMaker JumpStart.
درباره نویسنده
دکتر راجو پنماچا یک معمار راه حل های تخصصی AI/ML در پلتفرم های هوش مصنوعی در AWS است. او دکترای خود را از دانشگاه استنفورد دریافت کرد. او از نزدیک روی مجموعه سرویسهای کم/بدون کد در SageMaker کار میکند، که به مشتریان کمک میکند تا به راحتی مدلها و راهحلهای یادگیری ماشین را بسازند و به کار گیرند. وقتی به مشتریان کمک نمی کند، دوست دارد به مکان های جدید سفر کند.
دکتر آشیش ختان یک دانشمند کاربردی ارشد با الگوریتم های داخلی Amazon SageMaker است و به توسعه الگوریتم های یادگیری ماشین کمک می کند. او دکترای خود را از دانشگاه ایلینویز Urbana-Champaign گرفت. او یک محقق فعال در یادگیری ماشین و استنتاج آماری است و مقالات زیادی در کنفرانس های NeurIPS، ICML، ICLR، JMLR، ACL و EMNLP منتشر کرده است.
- AI
- آی هنر
- مولد هنر ai
- ربات ai
- آمازون SageMaker
- Amazon SageMaker JumpStart
- هوش مصنوعی
- گواهی هوش مصنوعی
- هوش مصنوعی در بانکداری
- ربات هوش مصنوعی
- ربات های هوش مصنوعی
- نرم افزار هوش مصنوعی
- آموزش ماشین AWS
- بلاکچین
- کنفرانس بلاک چین ai
- coingenius
- هوش مصنوعی محاوره ای
- کنفرانس کریپتو ai
- دل-ه
- یادگیری عمیق
- گوگل ai
- متوسط (200)
- فراگیری ماشین
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- بازی افلاطون
- PlatoData
- بازی پلاتو
- مقیاس Ai
- نحو
- زفیرنت