Kurkistus TorchVision v0.11 - Muistoja TorchVision -kehittäjältä - 2

Kurkistus TorchVision v0.11 - Muistoja TorchVision -kehittäjältä - 2

Katsaus TorchVision v0.11:een – TorchVision-kehittäjän muistelmat – 2 PlatoBlockchain Data Intelligenceä. Pystysuuntainen haku. Ai.
Kurkistus TorchVision v0.11 - Muistoja TorchVision -kehittäjältä - 2

Viimeiset pari viikkoa olivat erittäin kiireisiä ”PyTorch Landissa”, kun valmistelemme kiihkeästi PyTorch v1.10:n ja TorchVision v0.11:n julkaisua. Tässä 2. erässä sarja, käsittelen joitain tulevia ominaisuuksia, jotka sisältyvät tällä hetkellä TorchVisionin julkaisuhaaraan.

Disclaimer: Vaikka tuleva julkaisu on täynnä lukuisia parannuksia ja bugi-/testi-/dokumentaatioparannuksia, korostan tässä uusia "käyttäjälle suunnattuja" ominaisuuksia verkkotunnuksissa, joista olen henkilökohtaisesti kiinnostunut. Blogikirjoituksen kirjoittamisen jälkeen huomasin myös ennakkoluulon ominaisuuksia kohtaan, jotka olen arvostellut, kirjoittanut tai seurannut tarkasti niiden kehitystä. Ominaisuuden peittäminen (tai peittämättä jättäminen) ei kerro mitään sen tärkeydestä. Esitetyt mielipiteet ovat vain omiani.

Uudet mallit

Uusi julkaisu on täynnä uusia malleja:

  • Kai Zhang on lisännyt toteutuksen RegNet-arkkitehtuuri sekä esikoulutetut painot 14-variantit jotka toistavat tarkasti alkuperäisen paperin.
  • Olen äskettäin lisännyt toteutuksen EfficientNet-arkkitehtuuri sekä Luke Melas-Kyriazin ja Ross Wightmanin esiopetetut painot varianteille B0-B7.

Uusia datalisäyksiä

Uusimpaan versioon on lisätty muutamia uusia Data Augmentation -tekniikoita:

  • Samuel Gabriel on osallistunut TrivialAugment, uusi yksinkertainen mutta erittäin tehokas strategia, joka näyttää tarjoavan ylivoimaisia ​​tuloksia AutoAugmentille.
  • Olen lisännyt RandAugment menetelmä automaattisissa lisäyksissä.
  • Olen tarjonnut toteutuksen Mixup ja CutMix muuttuu viitteissä. Nämä siirretään muunnoksissa seuraavassa julkaisussa, kun niiden API on viimeistelty.

Uudet operaattorit ja tasot

Mukana on useita uusia operaattoreita ja tasoja:

Referenssit / Koulutusreseptit

Vaikka viitekäsikirjoitustemme parantaminen on jatkuvaa työtä, tässä on muutamia uusia ominaisuuksia, jotka sisältyvät tulevaan versioon:

  • Prabhat Roy on lisännyt tukea Exponential Moving Average luokitusreseptissämme.
  • Olen päivittänyt referenssimme tukeen Label Smoothing, jonka Joel Schlosser ja Thomas J. Fan esittelivät äskettäin PyTorch-ytimessä.
  • Olen sisällyttänyt esitysvaihtoehdon Oppimisnopeuden lämmittely, käyttämällä uusimpia Ilqar Ramazanlin kehittämiä LR-aikataulureita.

muita parannuksia

Tässä on joitain muita julkaisuun lisättyjä merkittäviä parannuksia:

  • Alexander Soare ja Francisco Massa ovat kehittäneet FX-pohjainen apuohjelma joka mahdollistaa mielivaltaisten väliominaisuuksien poimimisen malliarkkitehtuureista.
  • Nikita Shulga on lisännyt tukea CUDA 11.3 TorchVisionille.
  • Zhongkai Zhu on korjannut riippuvuusongelmia JPEG lib (tämä ongelma on aiheuttanut suurta päänsärkyä monille käyttäjillemme).

Meneillään ja seuraavaksi

Siellä on paljon jännittäviä uusia ominaisuuksia, joita ei ole kehitetty tässä julkaisussa. Tässä muutamia:

  • Moto Hira, Parmeet Singh Bhatia ja minä olemme laatineet RFC:n, joka ehdottaa uutta mekanismia Malliversiointi ja esiopetettuihin painoihin liittyvien metatietojen käsittelyyn. Tämän ansiosta voimme tukea useita esiopetettuja painoja jokaiselle mallille ja liittää niihin liittyviä tietoja, kuten tarroja, esikäsittelymuunnoksia jne.
  • Työskentelen parhaillaan "Sisältää paristot”-projektin tarkkuuden parantamiseksi valmiiksi koulutetut mallit. Tavoitteena on saavuttaa luokkansa parhaat tulokset TorchVisionin suosituimmilla esikoulutetuilla malleilla.
  • Philip Meier ja Francisco Massa työskentelevät TorchVisionin uuden mallin jännittävän prototyypin parissa aineisto ja muunnokset API.
  • Prabhat Roy työskentelee PyTorch Coren laajentamiseksi AveragedModel luokkaa tukemaan puskurien keskiarvon laskeminen parametrien lisäksi. Tämän ominaisuuden puute ilmoitetaan yleensä virheeksi ja tahdoksi mahdollistaa lukuisia loppupään kirjastoja ja viitekehykset niiden mukautetun EMA-toteutuksen poistamiseksi.
  • Aditya Ok kirjoitti apuohjelman mikä sallii tulosten piirtämistä Keypoint-malleista alkuperäisissä kuvissa (ominaisuus ei päässyt julkaisuun, koska tunkeuduimme emmekä pystyneet tarkistamaan sitä ajoissa 🙁 )
  • Rakennan a prototyyppi FX-apuohjelma jonka tarkoituksena on havaita jäännösyhteydet mielivaltaisissa malliarkkitehtuureissa ja muokata verkkoa lisäämään regularisointilohkoja (esim. StochasticDepth).

Lopuksi tilauskannassamme on muutamia uusia ominaisuuksia (PR:t tulossa pian):

Toivottavasti yllä oleva yhteenveto oli kiinnostava. Kaikki ideat blogisarjan muodon mukauttamisesta ovat erittäin tervetulleita. Lyö minua LinkedIn or Twitter.

Aikaleima:

Lisää aiheesta Datumbox