Μια κλεφτή ματιά στο TorchVision v0.11 – Αναμνήσεις ενός προγραμματιστή TorchVision – 2

Μια κλεφτή ματιά στο TorchVision v0.11 – Αναμνήσεις ενός προγραμματιστή TorchVision – 2

Μια κλεφτή ματιά στο TorchVision v0.11 – Αναμνήσεις ενός προγραμματιστή TorchVision – 2 PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
Μια κλεφτή ματιά στο TorchVision v0.11 – Αναμνήσεις ενός προγραμματιστή TorchVision – 2

Οι τελευταίες δύο εβδομάδες ήταν πολύ απασχολημένες στο "PyTorch Land", καθώς ετοιμάζουμε μανιωδώς την κυκλοφορία των PyTorch v1.10 και TorchVision v0.11. Σε αυτή τη 2η δόση του η σειρά, θα καλύψω μερικές από τις επερχόμενες δυνατότητες που περιλαμβάνονται επί του παρόντος στον κλάδο κυκλοφορίας του TorchVision.

Αποποίηση ευθυνών: Αν και η επερχόμενη έκδοση είναι γεμάτη με πολυάριθμες βελτιώσεις και βελτιώσεις σφαλμάτων/δοκιμών/τεκμηρίωσης, εδώ επισημαίνω τις νέες δυνατότητες «που αντιμετωπίζουν οι χρήστες» σε τομείς που με ενδιαφέρουν προσωπικά. Αφού έγραψα την ανάρτηση του ιστολογίου, παρατήρησα επίσης μια προκατάληψη προς τα χαρακτηριστικά που εξέτασα, έγραψα ή παρακολούθησα στενά την ανάπτυξή τους. Η κάλυψη (ή η μη κάλυψη) ενός χαρακτηριστικού δεν λέει τίποτα για τη σημασία του. Οι απόψεις που εκφράζονται είναι αποκλειστικά δικές μου.

Νέα μοντέλα

Η νέα έκδοση είναι γεμάτη με νέα μοντέλα:

  • Ο Kai Zhang πρόσθεσε μια εφαρμογή του Αρχιτεκτονική RegNet μαζί με προπονημένα βάρη για 14 παραλλαγές που αναπαράγουν στενά το αρχικό χαρτί.
  • Πρόσφατα πρόσθεσα μια υλοποίηση του Αρχιτεκτονική EfficientNet μαζί με προπονημένα βάρη για τις παραλλαγές B0-B7 που παρέχονται από τους Luke Melas-Kyriazi και Ross Wightman.

Νέες επαυξήσεις δεδομένων

Μερικές νέες τεχνικές Επαύξησης Δεδομένων έχουν προστεθεί στην πιο πρόσφατη έκδοση:

  • Ο Samuel Gabriel έχει συνεισφέρει TrivialAugment, μια νέα απλή αλλά εξαιρετικά αποτελεσματική στρατηγική που φαίνεται να παρέχει ανώτερα αποτελέσματα στο AutoAugment.
  • Έχω προσθέσει το RandAugment μέθοδος στις αυτόματες αυξήσεις.
  • Έχω παράσχει μια εφαρμογή του Mixup και CutMix μετασχηματίζεται σε αναφορές. Αυτά θα μετακινηθούν σε μετασχηματισμούς στην επόμενη έκδοση μόλις οριστικοποιηθεί το API τους.

Νέοι χειριστές και επίπεδα

Έχουν συμπεριληφθεί ένας αριθμός νέων τελεστών και επιπέδων:

Αναφορές / Εκπαιδευτικές Συνταγές

Αν και η βελτίωση των σεναρίων αναφοράς μας είναι μια συνεχής προσπάθεια, εδώ είναι μερικές νέες δυνατότητες που περιλαμβάνονται στην επερχόμενη έκδοση:

  • Ο Prabhat Roy έχει προσθέσει την υποστήριξη του Εκθετικός κινητός μέσος όρος στη συνταγή ταξινόμησης μας.
  • Έχω ενημερώσει τις αναφορές μας για υποστήριξη Εξομάλυνση ετικετών, το οποίο παρουσιάστηκε πρόσφατα από τους Joel Schlosser και Thomas J. Fan στον πυρήνα PyTorch.
  • Έχω συμπεριλάβει την επιλογή εκτέλεσης Προθέρμανση ποσοστού εκμάθησης, χρησιμοποιώντας τους πιο πρόσφατους προγραμματιστές LR που αναπτύχθηκαν από τον Ilqar Ramazanli.

Άλλες βελτιώσεις

Ακολουθούν ορισμένες άλλες αξιοσημείωτες βελτιώσεις που προστέθηκαν στην έκδοση:

  • Ο Alexander Soare και ο Francisco Massa έχουν αναπτύξει ένα Βοηθητικό πρόγραμμα που βασίζεται σε FX που επιτρέπει την εξαγωγή αυθαίρετων ενδιάμεσων χαρακτηριστικών από αρχιτεκτονικές μοντέλων.
  • Ο Nikita Shulga έχει προσθέσει την υποστήριξη του CUDA 11.3 στο TorchVision.
  • Ο Zhongkai Zhu έχει διορθώσει το ζητήματα εξάρτησης του JPEG lib (αυτό το ζήτημα έχει προκαλέσει μεγάλους πονοκεφάλους σε πολλούς από τους χρήστες μας).

Σε εξέλιξη & Επόμενο

Υπάρχουν πολλά συναρπαστικά νέα χαρακτηριστικά υπό ανάπτυξη που δεν τα κατάφεραν σε αυτήν την έκδοση. Εδώ είναι μερικά:

  • Ο Moto Hira, ο Parmeet Singh Bhatia και εγώ έχουμε συντάξει ένα RFC, το οποίο προτείνει έναν νέο μηχανισμό για Εκδόσεις μοντέλου και για το χειρισμό μεταδεδομένων που σχετίζονται με προεκπαιδευμένα βάρη. Αυτό θα μας επιτρέψει να υποστηρίξουμε πολλαπλά προεκπαιδευμένα βάρη για κάθε μοντέλο και να επισυνάψουμε σχετικές πληροφορίες, όπως ετικέτες, μετασχηματισμούς προεπεξεργασίας κ.λπ. στα μοντέλα.
  • Αυτήν τη στιγμή εργάζομαι για τη χρήση των πρωτόγονων που προστέθηκαν από το "Συμπεριλαμβάνονται μπαταρίες” του έργου προκειμένου να βελτιώσουμε την ακρίβεια μας προ-εκπαιδευμένα μοντέλα. Ο στόχος είναι να επιτευχθούν τα καλύτερα αποτελέσματα στην κατηγορία για τα πιο δημοφιλή προεκπαιδευμένα μοντέλα που παρέχονται από την TorchVision.
  • Ο Philip Meier και ο Francisco Massa εργάζονται σε ένα συναρπαστικό πρωτότυπο για το νέο TorchVision Σύνολο δεδομένων και Μεταμορφώσεις API.
  • Ο Prabhat Roy εργάζεται για την επέκταση του PyTorch Core AveragedModel τάξη για την υποστήριξη των τον μέσο όρο των buffer εκτός από παραμέτρους. Η έλλειψη αυτής της δυνατότητας αναφέρεται συνήθως ως σφάλμα και βούληση ενεργοποιήστε πολλές κατάντη βιβλιοθήκες και πλαίσια για την κατάργηση των προσαρμοσμένων εφαρμογών EMA τους.
  • Aditya Oke έγραψε ένα βοηθητικό πρόγραμμα το οποίο επιτρέπει σχεδιάζοντας τα αποτελέσματα των μοντέλων Keypoint στις αρχικές εικόνες (το χαρακτηριστικό δεν έφτασε στην κυκλοφορία καθώς κατακλύσαμε και δεν μπορέσαμε να το ελέγξουμε εγκαίρως 🙁)
  • χτίζω ένα πρωτότυπο βοηθητικό πρόγραμμα FX που στοχεύει στον εντοπισμό Υπολειμματικών Συνδέσεων σε αυθαίρετες αρχιτεκτονικές Μοντέλων και στην τροποποίηση του δικτύου για την προσθήκη μπλοκ κανονικοποίησης (όπως π.χ. StochasticDepth).

Τέλος, υπάρχουν μερικές νέες δυνατότητες στο ανεκτέλεστο μας (οι PR θα έρθουν σύντομα):

Ελπίζω να βρήκατε ενδιαφέρουσα την παραπάνω περίληψη. Οποιεσδήποτε ιδέες για το πώς να προσαρμόσετε τη μορφή της σειράς ιστολογίων είναι ευπρόσδεκτες. Χτύπησε με LinkedIn or Twitter.

Σφραγίδα ώρας:

Περισσότερα από Databox