Краткий обзор TorchVision v0.11 - Мемуары разработчика TorchVision - 2

Краткий обзор TorchVision v0.11 - Мемуары разработчика TorchVision - 2

Краткий обзор TorchVision v0.11 – Мемуары разработчика TorchVision – 2 PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
Краткий обзор TorchVision v0.11 - Мемуары разработчика TorchVision - 2

Последние пару недель в «PyTorch Land» было очень много работы, поскольку мы лихорадочно готовим выпуск PyTorch v1.10 и TorchVision v0.11. В этом 2-м выпуске сериал, я расскажу о некоторых новых функциях, которые в настоящее время включены в релизную ветку TorchVision.

Предупреждение: Несмотря на то, что предстоящий выпуск содержит множество усовершенствований и улучшений в области ошибок/тестирования/документации, здесь я выделяю новые «ориентированные на пользователя» функции в доменах, которые меня лично интересуют. После написания сообщения в блоге я также заметил предвзятость в отношении функций, которые я просматривал, писал или внимательно следил за их разработкой. Покрытие (или непокрытие) признака ничего не говорит о его важности. Высказанные мнения являются исключительно моими собственными.

Новые модели

Новый выпуск упакован с новыми моделями:

  • Кай Чжан добавил реализацию Регнет-архитектура вместе с предварительно обученными весами для 14 вариантов которые точно воспроизводят оригинальную бумагу.
  • Недавно я добавил реализацию Эффективная сетевая архитектура наряду с предварительно обученными весами для вариантов B0-B7, предоставленными Люком Мелас-Кириази и Россом Вайтманом.

Новые дополнения к данным

В последнюю версию добавлено несколько новых методов увеличения данных:

  • Самуэль Гэбриэл внес свой вклад Тривиальное дополнение, новая простая, но очень эффективная стратегия, которая, по-видимому, обеспечивает превосходные результаты по сравнению с AutoAugment.
  • я добавил РандАугмент метод автоаугментации.
  • Я предоставил реализацию Mixup и CutMix превращается в ссылки. Они будут перемещены в преобразованиях в следующем выпуске, как только их API будет завершен.

Новые операторы и слои

Включен ряд новых операторов и слоев:

Справочники / Тренировочные рецепты

Несмотря на то, что мы постоянно работаем над улучшением наших эталонных сценариев, вот несколько новых функций, включенных в следующую версию:

Другие улучшения

Вот некоторые другие заметные улучшения, добавленные в выпуске:

  • Александр Соаре и Франсиско Масса разработали Утилита на основе FX что позволяет извлекать произвольные промежуточные признаки из архитектур модели.
  • Никита Шульга добавил поддержку CUDA 11.3 в ТорчВижн.
  • Чжункай Чжу исправил проблемы зависимости библиотеки JPEG (эта проблема вызвала серьезные проблемы у многих наших пользователей).

В процессе и на очереди

Есть много интересных новых функций, находящихся в стадии разработки, которые не вошли в этот выпуск. Вот некоторые из них:

  • Мото Хира, Пармит Сингх Бхатия и я подготовили RFC, в котором предлагается новый механизм Управление версиями модели и для обработки метаданных, связанных с предварительно обученными весами. Это позволит нам поддерживать несколько предварительно обученных весов для каждой модели и прикреплять к моделям связанную информацию, такую ​​как метки, преобразования предварительной обработки и т. д.
  • В настоящее время я работаю над использованием примитивов, добавленных «Батареи в комплекте”, чтобы повысить точность наших предварительно обученные модели. Цель состоит в том, чтобы достичь лучших в своем классе результатов для самых популярных предварительно обученных моделей, предоставляемых TorchVision.
  • Филип Мейер и Франсиско Масса работают над захватывающим прототипом новой системы TorchVision. Dataset и Трансформации API.
  • Прабхат Рой работает над расширением ядра PyTorch. AveragedModel класс для поддержки усреднение буферов кроме параметров. Отсутствие этой функции обычно считается ошибкой и будет включить многочисленные нижестоящие библиотеки и фреймворки, чтобы удалить свои собственные реализации EMA.
  • Адитья Оке написал утилиту который позволяет построение результатов моделей Keypoint на исходных изображениях (функция не попала в релиз, так как мы были загружены и не смогли вовремя просмотреть ее 🙁 )
  • я строю прототип FX-утилиты который направлен на обнаружение остаточных соединений в произвольной архитектуре модели и изменение сети для добавления блоков регуляризации (таких как StochasticDepth).

Наконец, в нашем бэклоге есть несколько новых функций (скоро будут опубликованы PR):

Я надеюсь, что приведенное выше резюме показалось вам интересным. Приветствуются любые идеи о том, как адаптировать формат серии блогов. Ударь меня по LinkedIn or Twitter.

Отметка времени:

Больше от Датумбокс