نگاهی گذرا به TorchVision نسخه 0.11 – خاطرات یک توسعه دهنده TorchVision – 2

نگاهی گذرا به TorchVision نسخه 0.11 – خاطرات یک توسعه دهنده TorchVision – 2

نگاهی گذرا به TorchVision نسخه 0.11 – خاطرات یک توسعه دهنده TorchVision – 2 PlatoBlockchain Data Intelligence. جستجوی عمودی Ai.
نگاهی گذرا به TorchVision نسخه 0.11 – خاطرات یک توسعه دهنده TorchVision – 2

چند هفته گذشته در "PyTorch Land" بسیار شلوغ بود زیرا ما دیوانه وار در حال آماده سازی انتشار PyTorch v1.10 و TorchVision نسخه 0.11 هستیم. در این قسط 2 از سریال، برخی از ویژگی های آینده را که در حال حاضر در شاخه انتشار TorchVision گنجانده شده اند، پوشش خواهم داد.

سلب مسئولیت: اگرچه نسخه آینده مملو از پیشرفت‌های متعدد و پیشرفت‌های اشکال/آزمایش/مستندات است، در اینجا من ویژگی‌های جدید «کاربر» را در دامنه‌هایی که شخصاً به آن علاقه‌مند هستم، برجسته می‌کنم. پس از نوشتن پست وبلاگ، من همچنین متوجه سوگیری نسبت به ویژگی هایی شدم که بررسی کردم، نوشتم یا توسعه آنها را از نزدیک دنبال کردم. پوشاندن (یا عدم پوشش) یک ویژگی چیزی در مورد اهمیت آن نمی گوید. نظرات بیان شده صرفاً متعلق به من است.

مدل های جدید

نسخه جدید با مدل های جدید بسته بندی شده است:

  • کای ژانگ یک پیاده سازی از آن را اضافه کرده است معماری RegNet همراه با وزنه های از پیش تمرین شده برای 14 نوع که از نزدیک کاغذ اصلی را تکثیر می کنند.
  • من اخیراً یک پیاده سازی از آن را اضافه کرده ام معماری EfficientNet همراه با وزنه های از پیش تمرین شده برای انواع B0-B7 که توسط لوک ملاس-کیریازی و راس وایتمن ارائه شده است.

افزایش داده های جدید

چند تکنیک جدید افزایش داده به آخرین نسخه اضافه شده است:

  • ساموئل گابریل کمک کرده است TrivialAugment، یک استراتژی جدید ساده اما بسیار مؤثر است که به نظر می رسد نتایج برتر را برای AutoAugment ارائه می دهد.
  • من اضافه کردم RandAugment روش در افزایش خودکار
  • من پیاده سازی را ارائه کرده ام مخلوط کردن و کات میکس تبدیل در مراجع پس از نهایی شدن API آنها در نسخه بعدی به صورت تبدیل منتقل می شوند.

اپراتورها و لایه های جدید

تعدادی از اپراتورها و لایه های جدید گنجانده شده است:

منابع / دستور العمل های آموزشی

اگرچه بهبود اسکریپت های مرجع ما یک تلاش مستمر است، در اینجا چند ویژگی جدید در نسخه آینده گنجانده شده است:

  • پرابهات روی پشتیبانی از میانگین متحرک نمایشی در دستور طبقه بندی ما.
  • من مراجع خود را برای پشتیبانی به روز کرده ام صاف کردن برچسبکه اخیرا توسط Joel Schlosser و Thomas J. Fan در هسته PyTorch معرفی شده است.
  • من گزینه اجرا را گنجانده ام گرم کردن نرخ یادگیری، با استفاده از جدیدترین زمانبندی LR که توسط ایلقر رمضانلی توسعه یافته است.

پیشرفت های دیگر

در اینجا برخی از بهبودهای قابل توجه دیگر اضافه شده در نسخه وجود دارد:

  • الکساندر سوار و فرانسیسکو ماسا توسعه داده اند ابزار مبتنی بر FX که امکان استخراج ویژگی های میانی دلخواه از معماری های مدل را فراهم می کند.
  • نیکیتا شولگا پشتیبانی از CUDA 11.3 به TorchVision.
  • Zhongkai ژو رفع کرده است مسائل وابستگی از JPEG lib (این موضوع باعث سردردهای بزرگ برای بسیاری از کاربران ما شده است).

در حال پیشرفت و بعدی

بسیاری از ویژگی‌های جدید هیجان‌انگیز در دست توسعه هستند که در این نسخه به آن‌ها نرسیدند. چندتایی این جاست:

  • Moto Hira، Parmeet Singh Bhatia و من یک RFC تهیه کرده ایم که مکانیسم جدیدی را برای نسخه سازی مدل و برای مدیریت متا داده های مرتبط با وزنه های از پیش آموزش دیده. این ما را قادر می‌سازد تا چندین وزن از قبل آموزش‌دیده‌شده را برای هر مدل پشتیبانی کنیم و اطلاعات مرتبط مانند برچسب‌ها، تبدیل‌های پیش‌پردازش و غیره را به مدل‌ها متصل کنیم.
  • من در حال حاضر روی استفاده از اولیه های اضافه شده توسط " کار می کنمباتری های موجود” پروژه به منظور بهبود دقت ما مدل های از پیش آموزش دیده. هدف دستیابی به بهترین نتایج در کلاس برای محبوب ترین مدل های از پیش آموزش دیده ارائه شده توسط TorchVision است.
  • فیلیپ مایر و فرانسیسکو ماسا در حال کار بر روی یک نمونه اولیه هیجان انگیز برای TorchVision هستند. مجموعه داده و تغییر می کند API
  • پرابهات روی در حال کار بر روی توسعه PyTorch Core است AveragedModel کلاس برای حمایت از میانگین گیری بافرها علاوه بر پارامترها فقدان این ویژگی معمولاً به عنوان اشکال و اراده گزارش می شود تعداد زیادی کتابخانه پایین دستی را فعال کنید و چارچوب هایی برای حذف پیاده سازی های سفارشی EMA آنها.
  • آدیتیا اوکه یک ابزار کاربردی نوشت که اجازه می دهد رسم نتایج از مدل‌های Keypoint روی تصاویر اصلی (این ویژگی به دلیل غرق شدن ما به انتشار نرسید و نتوانستیم به موقع آن را بررسی کنیم)
  • من در حال ساختن یک نمونه اولیه FX-utility هدف آن شناسایی اتصالات باقیمانده در معماری های مدل دلخواه و تغییر شبکه برای افزودن بلوک های منظم سازی (مانند StochasticDepth).

در نهایت چند ویژگی جدید در بک لاگ ما وجود دارد (موارد روابط عمومی به زودی):

امیدوارم خلاصه بالا برای شما جالب بوده باشد. هر گونه ایده در مورد چگونگی تطبیق قالب مجموعه وبلاگ بسیار استقبال می شود. به من ضربه بزن لینک or توییتر.

تمبر زمان:

بیشتر از Datumbox