Un'anteprima di TorchVision V0.11 – Memorie di uno sviluppatore TorchVision

Ripubblicato da Platone

Seguaci: 0

Un'anteprima di TorchVision v0.11 – Memorie di uno sviluppatore TorchVision – 2 PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. — Un'anteprima di TorchVision v0.11 – Memorie di uno sviluppatore TorchVision – 2

Le ultime due settimane sono state super impegnate in "PyTorch Land" mentre stiamo freneticamente preparando il rilascio di PyTorch v1.10 e TorchVision v0.11. In questa seconda puntata di la serie, tratterò alcune delle funzionalità imminenti attualmente incluse nel ramo di rilascio di TorchVision.

Disclaimer: Sebbene la prossima versione sia ricca di numerosi miglioramenti e miglioramenti a bug/test/documentazione, qui sto evidenziando nuove funzionalità "rivolte all'utente" sui domini che mi interessano personalmente. Dopo aver scritto il post sul blog, ho anche notato un pregiudizio verso le funzionalità che ho recensito, scritto o seguito da vicino il loro sviluppo. Coprire (o non coprire) una caratteristica non dice nulla sulla sua importanza. Le opinioni espresse sono esclusivamente mie.

Nuove modelle

La nuova release è ricca di nuovi modelli:

Kai Zhang ha aggiunto un'implementazione del Architettura RegNet insieme a pesi pre-addestrati per Varianti 14 che riproducono fedelmente la carta originale.
Di recente ho aggiunto un'implementazione del Architettura EfficientNet insieme ai pesi pre-addestrati per le varianti B0-B7 forniti da Luke Melas-Kyriazi e Ross Wightman.

Nuovi potenziamenti dei dati

Alcune nuove tecniche di aumento dei dati sono state aggiunte all'ultima versione:

Samuel Gabriel ha contribuito TrivialAugment, una nuova strategia semplice ma molto efficace che sembra fornire risultati superiori all'AutoAugment.
ho aggiunto il RandAugment metodo negli auto-aumenti.
Ho fornito un'implementazione di Mixup e CutMix trasforma in riferimenti. Questi verranno spostati in trasformazioni nella prossima versione una volta finalizzata la loro API.

Nuovi operatori e livelli

Sono stati inclusi numerosi nuovi operatori e livelli:

Riferimenti / Ricette di formazione

Sebbene il miglioramento dei nostri script di riferimento sia uno sforzo continuo, ecco alcune nuove funzionalità incluse nella prossima versione:

Prabhat Roy ha aggiunto il supporto di Media mobile esponenziale nella nostra ricetta di classificazione.
Ho aggiornato i nostri riferimenti al supporto Levigatura etichetta, che è stato recentemente introdotto da Joel Schlosser e Thomas J. Fan su PyTorch core.
Ho incluso l'opzione per eseguire Riscaldamento della velocità di apprendimento, utilizzando gli ultimi schedulatori LR sviluppati da Ilqar Ramazanli.

Altri miglioramenti

Ecco alcuni altri notevoli miglioramenti aggiunti nella versione:

Alexander Soare e Francisco Massa hanno sviluppato un Utilità basata su FX che consente di estrarre caratteristiche intermedie arbitrarie dalle architetture del modello.
Nikita Shulga ha aggiunto il supporto di CUDA11.3 a TorchVision.
Zhongkai Zhu ha risolto il problema problemi di dipendenza di JPEG lib (questo problema ha causato grossi grattacapi a molti dei nostri utenti).

In corso e successivo

Ci sono molte nuove interessanti funzionalità in fase di sviluppo che non sono state presentate in questa versione. Eccone alcuni:

Moto Hira, Parmeet Singh Bhatia ed io abbiamo redatto una RFC, che propone un nuovo meccanismo per Versionamento del modello e per la gestione dei metadati associati ai pesi pre-addestrati. Ciò ci consentirà di supportare più pesi pre-addestrati per ciascun modello e di allegare informazioni associate come etichette, trasformazioni di pre-elaborazione ecc. Ai modelli.
Attualmente sto lavorando per utilizzare le primitive aggiunte dal "Batterie incluse” progetto al fine di migliorare la precisione del nostro modelli pre-addestrati. L'obiettivo è ottenere i migliori risultati della categoria per i modelli pre-addestrati più popolari forniti da TorchVision.
Philip Meier e Francisco Massa stanno lavorando a un entusiasmante prototipo per il nuovo TorchVision dataset ed Trasformazioni API.
Prabhat Roy sta lavorando per estendere PyTorch Core's AveragedModel classe per sostenere il media dei buffer oltre ai parametri. La mancanza di questa funzionalità viene comunemente segnalata come bug e volontà abilitare numerose librerie a valle e framework per rimuovere le loro implementazioni EMA personalizzate.
Aditya Ok ha scritto un'utilità che permette tracciare i risultati di modelli Keypoint sulle immagini originali (la funzione non è arrivata al rilascio perché siamo stati sommersi e non siamo riusciti a rivederla in tempo 🙁 )
sto costruendo un prototipo FX-utility che mira a rilevare le connessioni residue in architetture modello arbitrarie e modificare la rete per aggiungere blocchi di regolarizzazione (come StochasticDepth).

Infine ci sono alcune nuove funzionalità nel nostro backlog (PR in arrivo):

Spero che tu abbia trovato interessante il riassunto di cui sopra. Qualsiasi idea su come adattare il formato della serie di blog è molto ben accetta. Hit me up su LinkedIn or Twitter.