Uma prévia do TorchVision V0.11 – Memórias de um desenvolvedor do TorchVision

Republicado por Platão

seguidores: 0

10 de outubro de 2021
Vasilis Vryniotis
. Sem comentários

Uma prévia do TorchVision v0.11 – Memórias de um desenvolvedor TorchVision – 2 PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai. — Uma prévia do TorchVision v0.11 - Memórias de um desenvolvedor TorchVision - 2

As últimas semanas foram super ocupadas em “PyTorch Land”, pois estamos preparando freneticamente o lançamento do PyTorch v1.10 e do TorchVision v0.11. Nesta 2ª parcela do as séries, abordarei alguns dos próximos recursos que estão atualmente incluídos na ramificação de lançamento do TorchVision.

Aviso Legal: Embora a próxima versão esteja repleta de vários aprimoramentos e melhorias de bug/teste/documentação, aqui estou destacando os novos recursos “voltados para o usuário” em domínios em que estou pessoalmente interessado. Depois de escrever a postagem no blog, também notei um viés em relação aos recursos que revisei, escrevi ou acompanhei de perto seu desenvolvimento. Cobrir (ou não cobrir) um recurso não diz nada sobre sua importância. As opiniões expressas são exclusivamente minhas.

Modelos novos

A nova versão está repleta de novos modelos:

Kai Zhang adicionou uma implementação do Arquitetura RegNet juntamente com pesos pré-treinados para 14 variantes que reproduzem fielmente o artigo original.
Eu adicionei recentemente uma implementação do Arquitetura EfficientNet juntamente com pesos pré-treinados para as variantes B0-B7 fornecidos por Luke Melas-Kyriazi e Ross Wightman.

Novos aumentos de dados

Algumas novas técnicas de aumento de dados foram adicionadas à versão mais recente:

Samuel Gabriel contribuiu TrivialAugment, uma nova estratégia simples, mas altamente eficaz, que parece fornecer resultados superiores ao AutoAugment.
Eu adicionei o RandAugmentName método em aumentos automáticos.
Eu forneci uma implementação de Mixup e CutMix transforma em referências. Eles serão movidos em transformações na próxima versão assim que a API for finalizada.

Novos Operadores e Camadas

Vários novos operadores e camadas foram incluídos:

Referências / Receitas de Treinamento

Embora a melhoria de nossos scripts de referência seja um esforço contínuo, aqui estão alguns novos recursos incluídos na próxima versão:

Prabhat Roy adicionou o apoio de Exponential Moving Average em nossa receita de classificação.
Atualizei nossas referências para suporte Suavização de rótulo, que foi recentemente introduzido por Joel Schlosser e Thomas J. Fan no núcleo PyTorch.
Eu incluí a opção de executar Aquecimento da Taxa de Aprendizagem, usando os mais recentes escalonadores LR desenvolvidos por Ilqar Ramazanli.

outras melhorias

Aqui estão algumas outras melhorias notáveis adicionadas na versão:

Alexander Soare e Francisco Massa desenvolveram um Utilitário baseado em FX que permite extrair recursos intermediários arbitrários de arquiteturas de modelo.
Nikita Shulga adicionou suporte de CUDA11.3 para TorchVision.
Zhongkai Zhu corrigiu o problemas de dependência de JPEG lib (esse problema causou grandes dores de cabeça para muitos de nossos usuários).

Em andamento e em andamento

Há muitos novos recursos interessantes em desenvolvimento que não foram incluídos nesta versão. Aqui estão alguns:

Moto Hira, Parmeet Singh Bhatia e eu elaboramos uma RFC, que propõe um novo mecanismo para Controle de versão de modelo e para manipulação de metadados associados a pesos pré-treinados. Isso nos permitirá oferecer suporte a vários pesos pré-treinados para cada modelo e anexar informações associadas, como rótulos, transformações de pré-processamento, etc., aos modelos.
Atualmente estou trabalhando no uso das primitivas adicionadas pelo “baterias incluídas” para melhorar a precisão de nossos modelos pré-treinados. O objetivo é obter os melhores resultados da categoria para os modelos pré-treinados mais populares fornecidos pela TorchVision.
Philip Meier e Francisco Massa estão trabalhando em um protótipo empolgante para o novo Conjunto de dados e Transformações API.
Prabhat Roy está trabalhando na extensão do PyTorch Core AveragedModel classe para apoiar o média dos buffers além de parâmetros. A falta deste recurso é comumente relatada como bug e habilitar várias bibliotecas downstream e estruturas para remover suas implementações de EMA personalizadas.
Aditya Oke escreveu um utilitário que permite plotando os resultados de modelos da Keypoint nas imagens originais (o recurso não chegou ao lançamento porque ficamos inundados e não pudemos revisá-lo a tempo 🙁 )
estou construindo um protótipo FX-utility que visa detectar Conexões Residuais em arquiteturas de Modelo arbitrárias e modificar a rede para adicionar blocos de regularização (como StochasticDepth).

Finalmente, há alguns novos recursos em nosso backlog (PRs em breve):

Espero que você tenha achado o resumo acima interessante. Quaisquer ideias sobre como adaptar o formato da série de blogs são muito bem-vindas. Bata-me em LinkedIn or Twitter.