Огляд TorchVision v0.11 – Спогади розробника TorchVision – 2

Огляд TorchVision v0.11 – Спогади розробника TorchVision – 2

Короткий огляд TorchVision v0.11 – Мемуари розробника TorchVision – 2 PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.
Огляд TorchVision v0.11 – Спогади розробника TorchVision – 2

The last couple of weeks were super busy in “PyTorch Land” as we are frantically preparing the release of PyTorch v1.10 and TorchVision v0.11. In this 2nd instalment of серія, я розповім про деякі з майбутніх функцій, які наразі включено до версії TorchVision.

Відмова від відповідальності: Незважаючи на те, що майбутній випуск містить численні вдосконалення та вдосконалення помилок/тестів/документації, тут я виділяю нові функції, призначені для користувача, у доменах, які мене особисто цікавлять. Після написання публікації в блозі я також помітив упередженість щодо функцій, які я переглядав, писав або уважно стежив за їх розробкою. Покриття (або невисвітлення) функції нічого не говорить про її важливість. Висловлені думки є виключно моїми.

Нові моделі

Новий випуск наповнений новими моделями:

  • Кай Чжан додав реалізацію Архітектура RegNet разом із попередньо підготовленими вагами для Варіанти 14 які точно відтворюють оригінальний папір.
  • I’ve recently added an implementation of the Архітектура EfficientNet разом із попередньо підготовленими вагами для варіантів B0-B7, наданими Люком Меласом-Кіріазі та Россом Вайтманом.

Нові доповнення даних

До останньої версії додано кілька нових методів розширення даних:

  • Семюель Габріель зробив внесок TrivialAugment, нова проста, але дуже ефективна стратегія, яка, здається, забезпечує кращі результати, ніж AutoAugment.
  • Я додав RandAugment метод автозбільшень.
  • Я надав реалізацію Mixup і CutMix перетворює в посилання. Їх буде переміщено в трансформації в наступному випуску, коли їхній API буде завершено.

Нові оператори та шари

Додано ряд нових операторів і шарів:

Література / Навчальні рецепти

Хоча вдосконалення наших довідкових сценаріїв є постійними зусиллями, ось кілька нових функцій, включених у майбутню версію:

Інші поліпшення

Ось деякі інші помітні покращення, додані у випуск:

  • Олександр Соаре та Франсіско Масса розробили Утиліта на основі FX що дозволяє витягувати довільні проміжні функції з архітектур моделі.
  • Микита Шульга додав підтримку CUDA 11.3 до TorchVision.
  • Zhongkai Zhu виправив проблеми залежності JPEG lib (ця проблема спричинила головний біль у багатьох наших користувачів).

У процесі та далі

Є багато захоплюючих нових функцій, що знаходяться на стадії розробки, які не потрапили в цей випуск. Ось декілька:

  • Мото Хіра, Парміт Сінгх Бхатія та я склали проект RFC, який пропонує новий механізм для Версія моделі і для обробки метаданих, пов’язаних із попередньо підготовленими ваговими коефіцієнтами. Це дозволить нам підтримувати кілька попередньо навчених ваг для кожної моделі та додавати до моделей пов’язану інформацію, таку як мітки, перетворення попередньої обробки тощо.
  • Зараз я працюю над використанням примітивів, доданих "Включені батареї», щоб підвищити точність наших попередньо навчені моделі. Мета полягає в досягненні найкращих у своєму класі результатів для найпопулярніших попередньо навчених моделей, наданих TorchVision.
  • Філіп Майєр і Франсіско Масса працюють над захоплюючим прототипом нового TorchVision Набір даних та Перетворює API.
  • Прабхат Рой працює над розширенням PyTorch Core AveragedModel клас для підтримки усереднення буферів in addition to parameters. The lack of this feature is commonly reported as bug and will увімкнути численні бібліотеки нижнього рівня і фреймворки, щоб видалити їх власні реалізації EMA.
  • Адітя Оке написав утиліту що дозволяє побудова графіків результатів моделей Keypoint на оригінальних зображеннях (функція не потрапила до випуску, оскільки ми були завалені й не змогли вчасно переглянути її 🙁 )
  • Я будую a прототип FX-утиліти метою якого є виявлення залишкових з’єднань у довільній архітектурі моделі та модифікація мережі для додавання блоків регуляризації (наприклад, StochasticDepth).

Нарешті, у нашому резерві є кілька нових функцій (незабаром будуть PR):

Сподіваюся, вам було цікаво наведене вище резюме. Будь-які ідеї щодо адаптації формату серії блогів дуже вітаються. Вдари мене LinkedIn or Twitter.

Часова мітка:

Більше від Датабокс