Sekilas Tentang TorchVision V0.11 – Memoar Pengembang TorchVision

Diterbitkan Ulang Oleh Plato

Followers: 0

Sekilas tentang TorchVision v0.11 – Memoirs of a TorchVision developer – 2 PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai. — Sekilas tentang TorchVision v0.11 – Memoirs of a TorchVision developer – 2

Beberapa minggu terakhir sangat sibuk di "PyTorch Land" karena kami dengan panik mempersiapkan rilis PyTorch v1.10 dan TorchVision v0.11. Dalam angsuran ke-2 ini seri, saya akan membahas beberapa fitur mendatang yang saat ini disertakan dalam cabang rilis TorchVision.

Penolakan: Meskipun rilis mendatang dikemas dengan banyak peningkatan dan perbaikan bug/pengujian/dokumentasi, di sini saya menyoroti fitur baru "menghadapi pengguna" pada domain yang saya minati secara pribadi. Setelah menulis posting blog, saya juga melihat adanya bias terhadap fitur yang saya ulas, tulis, atau ikuti dengan cermat perkembangannya. Meliputi (atau tidak menutupi) fitur tidak mengatakan apa-apa tentang pentingnya. Pendapat yang diungkapkan adalah milik saya sendiri.

Model Baru

Rilis baru dikemas dengan model baru:

Kai Zhang telah menambahkan implementasi dari arsitektur RegNet bersama dengan beban yang telah dilatih sebelumnya untuk 14 varian yang secara dekat mereproduksi kertas asli.
Saya baru saja menambahkan implementasi dari Arsitektur Net yang Efisien bersama dengan bobot pra-latihan untuk varian B0-B7 yang disediakan oleh Luke Melas-Kyriazi dan Ross Wightman.

Augmentasi Data Baru

Beberapa teknik Augmentasi Data baru telah ditambahkan ke versi terbaru:

Samuel Gabriel telah berkontribusi Peningkatan Sepele, strategi baru yang sederhana namun sangat efektif yang tampaknya memberikan hasil yang lebih baik daripada AutoAugment.
Saya telah menambahkan RandAugment metode dalam auto-augmentasi.
Saya telah menyediakan implementasi dari Mixup dan CutMix transformasi dalam referensi. Ini akan dipindahkan dalam transformasi pada rilis berikutnya setelah API mereka diselesaikan.

Operator dan Layer Baru

Sejumlah operator dan lapisan baru telah dimasukkan:

Referensi / Resep Pelatihan

Meskipun peningkatan skrip referensi kami adalah upaya berkelanjutan, berikut adalah beberapa fitur baru yang disertakan dalam versi mendatang:

Prabhat Roy telah menambahkan dukungan dari Exponential Moving Average dalam resep klasifikasi kami.
Saya telah memperbarui referensi kami untuk mendukung Penghalusan Label, yang baru-baru ini diperkenalkan oleh Joel Schlosser dan Thomas J. Fan pada inti PyTorch.
Saya telah menyertakan opsi untuk tampil Pemanasan Tingkat Pembelajaran, menggunakan penjadwal LR terbaru yang dikembangkan oleh Ilqar Ramazanli.

perbaikan lainnya

Berikut adalah beberapa peningkatan penting lainnya yang ditambahkan dalam rilis:

Alexander Soare dan Francisco Massa telah mengembangkan Utilitas berbasis FX yang memungkinkan mengekstraksi fitur perantara sewenang-wenang dari arsitektur model.
Nikita Shulga telah menambahkan dukungan dari CUDA 11.3 ke Torch Vision.
Zhongkai Zhu telah memperbaiki masalah ketergantungan lib JPEG (masalah ini telah menyebabkan sakit kepala besar bagi banyak pengguna kami).

Sedang berlangsung & Selanjutnya

Ada banyak fitur baru yang menarik dalam pengembangan yang tidak berhasil dalam rilis ini. Berikut adalah beberapa:

Moto Hira, Parmeet Singh Bhatia dan saya telah menyusun RFC, yang mengusulkan mekanisme baru untuk Versi Model dan untuk menangani meta-data yang terkait dengan bobot yang telah dilatih sebelumnya. Ini akan memungkinkan kami untuk mendukung beberapa bobot pra-pelatihan untuk setiap model dan melampirkan informasi terkait seperti label, transformasi pra-pemrosesan, dll ke model.
Saat ini saya sedang bekerja menggunakan primitif yang ditambahkan oleh "Termasuk Baterai” proyek untuk meningkatkan akurasi kami model pra-terlatih. Targetnya adalah untuk mencapai hasil terbaik di kelasnya untuk model pra-pelatihan paling populer yang disediakan oleh TorchVision.
Philip Meier dan Francisco Massa sedang mengerjakan prototipe menarik untuk TorchVision baru Dataset dan Transformasi API.
Prabhat Roy sedang berupaya memperluas PyTorch Core's AveragedModel kelas untuk mendukung rata-rata dari buffer selain parameter. Kurangnya fitur ini biasanya dilaporkan sebagai bug dan akan aktifkan banyak perpustakaan hilir dan kerangka kerja untuk menghapus implementasi EMA khusus mereka.
Aditya Oke menulis utilitas yang memungkinkan merencanakan hasil model Keypoint pada gambar asli (fitur ini tidak dirilis karena kami kebanjiran dan tidak dapat meninjaunya tepat waktu )
Saya sedang membangun prototipe FX-utilitas yang bertujuan untuk mendeteksi Koneksi Residual dalam arsitektur Model arbitrer dan memodifikasi jaringan untuk menambahkan blok regularisasi (seperti StochasticDepth).

Akhirnya ada beberapa fitur baru di backlog kami (PR segera hadir):

Saya harap Anda menemukan ringkasan di atas menarik. Setiap ide tentang cara mengadaptasi format seri blog sangat diharapkan. Pukul aku LinkedIn or Twitter.