O scurtă privire la TorchVision v0.11 – Memoriile unui dezvoltator TorchVision – 2

O scurtă privire la TorchVision v0.11 – Memoriile unui dezvoltator TorchVision – 2

O scurtă privire la TorchVision v0.11 – Memoriile unui dezvoltator TorchVision – 2 PlatoBlockchain Data Intelligence. Căutare verticală. Ai.
O scurtă privire la TorchVision v0.11 – Memoriile unui dezvoltator TorchVision – 2

Ultimele două săptămâni au fost foarte ocupate în „PyTorch Land”, deoarece pregătim frenetic lansarea PyTorch v1.10 și TorchVision v0.11. În această a doua tranșă a serialul, voi acoperi câteva dintre caracteristicile viitoare care sunt incluse în prezent în ramura de lansare a TorchVision.

Avertisment: Deși viitoarea lansare este plină de numeroase îmbunătățiri și îmbunătățiri de erori/test/documentație, aici evidențiez noi funcții „față de utilizator” pe domeniile care mă interesează personal. După ce am scris postarea pe blog, am observat și o părtinire față de caracteristicile pe care le-am revizuit, am scris sau le-am urmărit îndeaproape dezvoltarea. Acoperirea (sau neacoperirea) unei caracteristici nu spune nimic despre importanța acesteia. Opiniile exprimate sunt numai ale mele.

Modele noi

Noua versiune este plină cu modele noi:

  • Kai Zhang a adăugat o implementare a Arhitectura RegNet împreună cu greutăţi preantrenate pt Variantele 14 care reproduc îndeaproape hârtia originală.
  • Am adăugat recent o implementare a Arhitectura EfficientNet împreună cu greutăți pre-antrenate pentru variantele B0-B7 furnizate de Luke Melas-Kyriazi și Ross Wightman.

Noi creșteri de date

Câteva tehnici noi de creștere a datelor au fost adăugate la cea mai recentă versiune:

  • Samuel Gabriel a contribuit Trivial Augment, o nouă strategie simplă, dar extrem de eficientă, care pare să ofere rezultate superioare AutoAugment.
  • Am adăugat RandAugment metoda în auto-augmentări.
  • Am oferit o implementare a Mixup și CutMix se transformă în referințe. Acestea vor fi mutate în transformări în următoarea ediție, odată ce API-ul lor este finalizat.

Noi operatori și straturi

Au fost incluși o serie de operatori și straturi noi:

Referințe / Rețete de antrenament

Deși îmbunătățirea scripturilor noastre de referință este un efort continuu, iată câteva caracteristici noi incluse în versiunea viitoare:

  • Prabhat Roy a adăugat sprijin pentru Medie mobilă exponențială în rețeta noastră de clasificare.
  • Am actualizat referințele noastre pentru asistență Netezirea etichetei, care a fost introdus recent de Joel Schlosser și Thomas J. Fan pe PyTorch core.
  • Am inclus opțiunea de a performa Încălzirea ratei de învățare, folosind cele mai recente programatoare LR dezvoltate de Ilqar Ramazanli.

Alte îmbunătățiri

Iată câteva alte îmbunătățiri notabile adăugate în versiune:

  • Alexander Soare și Francisco Massa au dezvoltat o Utilitar bazat pe FX care permite extragerea de caracteristici intermediare arbitrare din arhitecturile modelului.
  • Nikita Shulga a adăugat sprijin pentru CUDA 11.3 la TorchVision.
  • Zhongkai Zhu a remediat probleme de dependență de JPEG lib (această problemă a cauzat dureri de cap majore multora dintre utilizatorii noștri).

În curs și în continuare

Există o mulțime de funcții noi interesante în curs de dezvoltare, care nu au ajuns în această versiune. Iată câteva:

  • Moto Hira, Parmeet Singh Bhatia și cu mine am elaborat un RFC, care propune un nou mecanism pentru Versiune model și pentru manipularea metadatelor asociate greutăților pre-antrenate. Acest lucru ne va permite să acceptăm mai multe greutăți pre-antrenate pentru fiecare model și să atașăm la modele informații asociate, cum ar fi etichete, transformări de preprocesare etc.
  • În prezent lucrez la utilizarea primitivelor adăugate de „baterii incluse” proiect pentru a îmbunătăți acuratețea noastră modele pre-antrenate. Ținta este de a obține cele mai bune rezultate din clasă pentru cele mai populare modele pre-antrenate furnizate de TorchVision.
  • Philip Meier și Francisco Massa lucrează la un prototip interesant pentru noua TorchVision Setul de date și transformări API-ul.
  • Prabhat Roy lucrează la extinderea PyTorch Core AveragedModel clasa pentru a sprijini medierea tampoanelor pe lângă parametri. Lipsa acestei caracteristici este de obicei raportată ca bug și voință permite numeroase biblioteci în aval și cadre pentru a elimina implementările EMA personalizate.
  • Aditya Oke a scris un utilitar care permite trasarea rezultatelor de modele Keypoint pe imaginile originale (funcția nu a ajuns la lansare, deoarece am fost copleșiți și nu am putut-o revizui la timp 🙁)
  • construiesc o prototip FX-utility care urmărește să detecteze conexiunile reziduale în arhitecturi de model arbitrare și să modifice rețeaua pentru a adăuga blocuri de regularizare (cum ar fi StochasticDepth).

În cele din urmă, există câteva funcții noi în stocul nostru (PR-uri în curând):

Sper că ați găsit interesant rezumatul de mai sus. Orice idee despre cum să adaptați formatul seriei de blog sunt binevenite. Lovi-mă LinkedIn or Twitter.

Timestamp-ul:

Mai mult de la Datumbox