Προσδιορισμός συστημάτων αμυντικής κάλυψης στα στατιστικά της επόμενης γενιάς του NFL

Προσδιορισμός συστημάτων αμυντικής κάλυψης στα στατιστικά της επόμενης γενιάς του NFL

Αυτή η ανάρτηση συνυπογράφεται με τους Jonathan Jung, Mike Band, Michael Chi και Thompson Bliss στο National Football League.

A σύστημα κάλυψης αναφέρεται στους κανόνες και τις ευθύνες κάθε αμυντικού ποδοσφαίρου που έχει επιφορτιστεί να σταματήσει μια επιθετική πάσα. Είναι στον πυρήνα της κατανόησης και της ανάλυσης οποιασδήποτε αμυντικής στρατηγικής ποδοσφαίρου. Η ταξινόμηση του συστήματος κάλυψης για κάθε παιχνίδι πάσας θα παρέχει πληροφορίες για το ποδοσφαιρικό παιχνίδι σε ομάδες, ραδιοτηλεοπτικούς φορείς και φιλάθλους. Για παράδειγμα, μπορεί να αποκαλύψει τις προτιμήσεις των καλούντων παιχνιδιών, να επιτρέψει τη βαθύτερη κατανόηση του τρόπου με τον οποίο οι αντίστοιχοι προπονητές και ομάδες προσαρμόζουν συνεχώς τις στρατηγικές τους με βάση τις δυνάμεις του αντιπάλου τους και να επιτρέψει την ανάπτυξη νέων αναλυτικών στοιχείων αμυντικού προσανατολισμού, όπως η μοναδικότητα των καλύψεων.Οι Seth et al.). Ωστόσο, η μη αυτόματη αναγνώριση αυτών των καλύψεων σε βάση ανά παιχνίδι είναι τόσο επίπονη όσο και δύσκολη, επειδή απαιτεί από τους ειδικούς του ποδοσφαίρου να επιθεωρήσουν προσεκτικά το υλικό του αγώνα. Υπάρχει ανάγκη για ένα αυτοματοποιημένο μοντέλο ταξινόμησης κάλυψης που να μπορεί να κλιμακωθεί αποτελεσματικά και αποδοτικά για να μειώσει το κόστος και τον χρόνο διεκπεραίωσης.

Το NFL Επόμενα γενικά στατιστικά καταγράφει την τοποθεσία, την ταχύτητα και πολλά άλλα σε πραγματικό χρόνο για κάθε παίκτη και κάθε παιχνίδι αγώνων ποδοσφαίρου NFL και εξάγει διάφορα προηγμένα στατιστικά που καλύπτουν διαφορετικές πτυχές του παιχνιδιού. Μέσα από μια συνεργασία μεταξύ της ομάδας Next Gen Stats και του Εργαστήριο Amazon ML Solutions, έχουμε αναπτύξει την κατάσταση ταξινόμησης κάλυψης που υποστηρίζεται από μηχανική εκμάθηση (ML) που προσδιορίζει με ακρίβεια το σχέδιο κάλυψης άμυνας με βάση τα δεδομένα παρακολούθησης του παίκτη. Το μοντέλο ταξινόμησης κάλυψης εκπαιδεύεται χρησιμοποιώντας Amazon Sage Maker, και το στατιστικό ήταν ξεκίνησε για τη σεζόν NFL 2022.

Σε αυτήν την ανάρτηση, εμβαθύνουμε στις τεχνικές λεπτομέρειες αυτού του μοντέλου ML. Περιγράφουμε πώς σχεδιάσαμε ένα ακριβές, εξηγήσιμο μοντέλο ML για να κάνουμε ταξινόμηση κάλυψης από δεδομένα παρακολούθησης παικτών, ακολουθούμενη από την ποσοτική μας αξιολόγηση και τα αποτελέσματα επεξήγησης του μοντέλου.

Διατύπωση προβλήματος και προκλήσεις

Ορίζουμε την κατάταξη αμυντικής κάλυψης ως εργασία ταξινόμησης πολλών κατηγοριών, με τρεις τύπους κάλυψης άνδρα (όπου κάθε αμυντικός παίκτης καλύπτει έναν συγκεκριμένο επιθετικό παίκτη) και πέντε τύπους κάλυψης ζώνης (κάθε αμυντικός παίκτης καλύπτει μια συγκεκριμένη περιοχή στο γήπεδο). Αυτές οι οκτώ κατηγορίες απεικονίζονται οπτικά στο ακόλουθο σχήμα: Cover 0 Man, Cover 1 Man, Cover 2 Man, Cover 2 Zone, Cover 3 Zone, Cover 4 Zone, Cover 6 Zone και Prevent (επίσης κάλυψη ζώνης). Οι κύκλοι με μπλε χρώμα είναι οι αμυντικοί παίκτες που τοποθετούνται σε έναν συγκεκριμένο τύπο κάλυψης. κύκλοι με κόκκινο είναι οι επιθετικοί παίκτες. Μια πλήρης λίστα με τα ακρωνύμια των παικτών παρέχεται στο παράρτημα στο τέλος αυτής της ανάρτησης.

Οκτώ καλύψεις εξετάζονται στην ανάρτηση

Η ακόλουθη απεικόνιση δείχνει ένα παράδειγμα παιχνιδιού, με τη θέση όλων των επιθετικών και αμυντικών παικτών στην αρχή του παιχνιδιού (αριστερά) και στη μέση του ίδιου παιχνιδιού (δεξιά). Για να γίνει ο σωστός προσδιορισμός κάλυψης, πρέπει να ληφθούν υπόψη πολλές πληροφορίες με την πάροδο του χρόνου, συμπεριλαμβανομένου του τρόπου με τον οποίο παρατάχθηκαν οι αμυντικοί πριν από το χτύπημα και οι προσαρμογές στην κίνηση των επιθετικών παικτών μετά το χτύπημα της μπάλας. Αυτό θέτει την πρόκληση για το μοντέλο να καταγράψει τη χωροχρονική και συχνά λεπτή κίνηση και αλληλεπίδραση μεταξύ των παικτών.

Δύο καρέ ενός παραδείγματος παιχνιδιού που δείχνει τις τοποθεσίες του παίκτη

Μια άλλη βασική πρόκληση που αντιμετωπίζει η συνεργασία μας είναι η εγγενής ασάφεια γύρω από τα αναπτυσσόμενα προγράμματα κάλυψης. Πέρα από τα οκτώ κοινώς γνωστά σχήματα κάλυψης, εντοπίσαμε προσαρμογές σε πιο συγκεκριμένες κλήσεις κάλυψης που οδηγούν σε ασάφεια μεταξύ των οκτώ γενικών κατηγοριών τόσο για τη μη αυτόματη χαρτογράφηση όσο και για την ταξινόμηση μοντέλων. Αντιμετωπίζουμε αυτές τις προκλήσεις χρησιμοποιώντας βελτιωμένες στρατηγικές εκπαίδευσης και επεξήγηση μοντέλων. Περιγράφουμε τις προσεγγίσεις μας λεπτομερώς στην επόμενη ενότητα.

Επεξηγήσιμο πλαίσιο ταξινόμησης κάλυψης

Εικονίζουμε το συνολικό μας πλαίσιο στο παρακάτω σχήμα, με την εισαγωγή δεδομένων παρακολούθησης παικτών και ετικετών κάλυψης που ξεκινούν από την κορυφή του σχήματος.

Συνολικό πλαίσιο ταξινόμησης κάλυψης

Μηχανική χαρακτηριστικών

Τα δεδομένα παρακολούθησης του παιχνιδιού καταγράφονται με ταχύτητα 10 καρέ ανά δευτερόλεπτο, συμπεριλαμβανομένης της θέσης, της ταχύτητας, της επιτάχυνσης και του προσανατολισμού του παίκτη. Η μηχανική χαρακτηριστικών μας κατασκευάζει ακολουθίες χαρακτηριστικών παιχνιδιού ως είσοδο για την πέψη του μοντέλου. Για ένα δεδομένο πλαίσιο, τα χαρακτηριστικά μας είναι εμπνευσμένα από τη λύση 2020 Big Data Bowl Kaggle Zoo (Gordeev et al.): κατασκευάζουμε μια εικόνα για κάθε βήμα με τους αμυντικούς παίκτες στις σειρές και τους επιθετικούς στις στήλες. Επομένως, το εικονοστοιχείο της εικόνας αντιπροσωπεύει τα χαρακτηριστικά για το τεμνόμενο ζευγάρι παικτών. Διαφορετικός από Gordeev et al., εξάγουμε μια ακολουθία αναπαραστάσεων καρέ, η οποία δημιουργεί αποτελεσματικά ένα μίνι-βίντεο για να χαρακτηρίσει το παιχνίδι.

Το παρακάτω σχήμα απεικονίζει πώς τα χαρακτηριστικά εξελίσσονται με την πάροδο του χρόνου σε αντιστοιχία με δύο στιγμιότυπα ενός παραδείγματος παιχνιδιού. Για οπτική σαφήνεια, δείχνουμε μόνο τέσσερα χαρακτηριστικά από όλα αυτά που εξάγαμε. Το "LOS" στο σχήμα αντιπροσωπεύει τη γραμμή της σύγκρουσης και ο άξονας x αναφέρεται στην οριζόντια κατεύθυνση στα δεξιά του γηπέδου ποδοσφαίρου. Παρατηρήστε πώς οι τιμές χαρακτηριστικών, που υποδεικνύονται από τη γραμμή χρώματος, εξελίσσονται με την πάροδο του χρόνου σε αντιστοιχία με την κίνηση του παίκτη. Συνολικά, κατασκευάζουμε δύο σετ χαρακτηριστικών ως εξής:

  • Χαρακτηριστικά αμυντικού που αποτελούνται από τη θέση του αμυντικού, την ταχύτητα, την επιτάχυνση και τον προσανατολισμό, στον άξονα x (οριζόντια κατεύθυνση προς τα δεξιά του γηπέδου ποδοσφαίρου) και στον άξονα y (κάθετη κατεύθυνση προς την κορυφή του γηπέδου ποδοσφαίρου)
  • Σχετικά χαρακτηριστικά αμυντικού-επιθετικού που αποτελούνται από τα ίδια χαρακτηριστικά, αλλά υπολογίζονται ως η διαφορά μεταξύ αμυντικών και επιθετικών παικτών

Τα εξαγόμενα χαρακτηριστικά εξελίσσονται με την πάροδο του χρόνου που αντιστοιχούν στην κίνηση του παίκτη στο παράδειγμα παιχνιδιού

Μονάδα CNN

Χρησιμοποιούμε ένα συνελικτικό νευρωνικό δίκτυο (CNN) για να μοντελοποιήσουμε τις πολύπλοκες αλληλεπιδράσεις των παικτών παρόμοιες με το Open Source Football (Οι Baldwin et al.) και λύση Big Data Bowl Kaggle Zoo (Gordeev et al.). Η εικόνα που ελήφθη από τη μηχανική χαρακτηριστικών διευκόλυνε τη μοντελοποίηση κάθε καρέ αναπαραγωγής μέσω ενός CNN. Τροποποιήσαμε το συνελικτικό μπλοκ (Conv) που χρησιμοποιήθηκε από τη λύση Zoo (Gordeev et al.) με δομή διακλάδωσης που αποτελείται από ένα ρηχό CNN μίας στρώσης και ένα βαθύ CNN τριών επιπέδων. Το επίπεδο συνέλιξης χρησιμοποιεί έναν πυρήνα 1×1 εσωτερικά: η εξέταση του πυρήνα σε κάθε ζευγάρι παίκτη ξεχωριστά διασφαλίζει ότι το μοντέλο είναι αμετάβλητο σε σχέση με τον παίκτη που παραγγέλνει. Για απλότητα, παραγγέλνουμε τους παίκτες με βάση το NFL ID τους για όλα τα δείγματα παιχνιδιού. Λαμβάνουμε τις ενσωματώσεις πλαισίου ως έξοδο της μονάδας CNN.

Χρονική μοντελοποίηση

Μέσα στη σύντομη περίοδο αναπαραγωγής που διαρκεί λίγα μόλις δευτερόλεπτα, περιέχει πλούσια χρονική δυναμική ως βασικούς δείκτες για τον προσδιορισμό της κάλυψης. Η μοντελοποίηση CNN με βάση το πλαίσιο, όπως χρησιμοποιείται στη λύση Zoo (Gordeev et al.), δεν έχει λάβει υπόψη τη χρονική εξέλιξη. Για να αντιμετωπίσουμε αυτήν την πρόκληση, σχεδιάζουμε μια ενότητα αυτοπροσοχής (Οι Vaswani et al.), στοιβάζονται πάνω από το CNN, για χρονική μοντελοποίηση. Κατά τη διάρκεια της εκπαίδευσης, μαθαίνει να συγκεντρώνει τα μεμονωμένα πλαίσια ζυγίζοντάς τα διαφορετικά (Οι Alammar et al.). Θα το συγκρίνουμε με μια πιο συμβατική, αμφίδρομη προσέγγιση LSTM στην ποσοτική αξιολόγηση. Στη συνέχεια υπολογίζεται ο μέσος όρος των ενσωματώσεων μαθημένης προσοχής ως εξόδου για να επιτευχθεί η ενσωμάτωση ολόκληρου του παιχνιδιού. Τέλος, συνδέεται ένα πλήρως συνδεδεμένο επίπεδο για τον προσδιορισμό της κατηγορίας κάλυψης του παιχνιδιού.

Εξομάλυνση συνόλου μοντέλων και ετικετών

Η ασάφεια μεταξύ των οκτώ σχημάτων κάλυψης και η ανισόρροπη κατανομή τους καθιστούν τον σαφή διαχωρισμό μεταξύ των καλύψεων πρόκληση. Χρησιμοποιούμε το σύνολο μοντέλων για να αντιμετωπίσουμε αυτές τις προκλήσεις κατά τη διάρκεια της εκπαίδευσης μοντέλων. Η μελέτη μας διαπιστώνει ότι ένα σύνολο που βασίζεται στην ψηφοφορία, μια από τις πιο απλοϊκές μεθόδους συνόλου, στην πραγματικότητα ξεπερνά τις πιο σύνθετες προσεγγίσεις. Σε αυτή τη μέθοδο, κάθε βασικό μοντέλο έχει την ίδια αρχιτεκτονική προσοχής CNN και εκπαιδεύεται ανεξάρτητα από διαφορετικούς τυχαίους σπόρους. Η τελική ταξινόμηση λαμβάνει τον μέσο όρο των εξόδων από όλα τα βασικά μοντέλα.

Ενσωματώνουμε περαιτέρω εξομάλυνση ετικετών (Müller et αϊ.) στην απώλεια διασταυρούμενης εντροπίας για τη διαχείριση του πιθανού θορύβου σε ετικέτες χειροκίνητης χαρτογράφησης. Η εξομάλυνση ετικετών κατευθύνει την σχολιασμένη κατηγορία κάλυψης ελαφρώς προς τις υπόλοιπες κατηγορίες. Η ιδέα είναι να ενθαρρύνουμε το μοντέλο να προσαρμοστεί στην εγγενή ασάφεια κάλυψης αντί να προσαρμόζεται υπερβολικά σε τυχόν προκατειλημμένους σχολιασμούς.

Ποσοτική αξιολόγηση

Χρησιμοποιούμε δεδομένα σεζόν 2018-2020 για εκπαίδευση και επικύρωση μοντέλων και δεδομένα σεζόν 2021 για αξιολόγηση μοντέλων. Κάθε σεζόν αποτελείται από περίπου 17,000 παιχνίδια. Πραγματοποιούμε μια πενταπλάσια διασταυρούμενη επικύρωση για να επιλέξουμε το καλύτερο μοντέλο κατά τη διάρκεια της εκπαίδευσης και εκτελούμε βελτιστοποίηση υπερπαραμέτρων για να επιλέξουμε τις καλύτερες ρυθμίσεις για την αρχιτεκτονική πολλαπλών μοντέλων και τις παραμέτρους εκπαίδευσης.

Για να αξιολογήσουμε την απόδοση του μοντέλου, υπολογίζουμε την ακρίβεια κάλυψης, τη βαθμολογία F1, την ακρίβεια top-2 και την ακρίβεια της εργασίας ευκολότερος άνθρωπος έναντι ζώνης. Το μοντέλο Zoo που βασίζεται στο CNN που χρησιμοποιείται σε Οι Baldwin et al. είναι το πιο σχετικό για την ταξινόμηση κάλυψης και το χρησιμοποιούμε ως βάση. Επιπλέον, εξετάζουμε βελτιωμένες εκδόσεις της βασικής γραμμής που ενσωματώνουν τα στοιχεία χρονικής μοντελοποίησης για συγκριτική μελέτη: ένα μοντέλο CNN-LSTM που χρησιμοποιεί ένα αμφίδρομο LSTM για την εκτέλεση της χρονικής μοντελοποίησης και ένα μεμονωμένο μοντέλο προσοχής CNN χωρίς το σύνολο και την ετικέτα εξαρτήματα εξομάλυνσης. Τα αποτελέσματα φαίνονται στον παρακάτω πίνακα.

Μοντέλο Δοκιμή ακρίβειας 8 καλύψεις (%) Top-2 Ακρίβεια 8 καλύψεις (%) Βαθμολογία F1 8 Καλύψεις Δοκιμή ακρίβειας Άνδρας εναντίον Ζώνης (%)
Βασική γραμμή: Μοντέλο ζωολογικού κήπου 68.8 ± 0.4 87.7 ± 0.1 65.8 ± 0.4 88.4 ± 0.4
CNN-LSTM 86.5 ± 0.1 93.9 ± 0.1 84.9 ± 0.2 94.6 ± 0.2
CNN-προσοχή 87.7 ± 0.2 94.7 ± 0.2 85.9 ± 0.2 94.6 ± 0.2
Το δικό μας: Σύνολο 5 μοντέλων CNN-προσοχή 88.9 ± 0.1 97.6 ± 0.1 87.4 ± 0.2 95.4 ± 0.1

Παρατηρούμε ότι η ενσωμάτωση της χρονικής ενότητας μοντελοποίησης βελτιώνει σημαντικά το βασικό μοντέλο Zoo που βασίστηκε σε ένα μόνο πλαίσιο. Σε σύγκριση με την ισχυρή γραμμή βάσης του μοντέλου CNN-LSTM, τα προτεινόμενα στοιχεία μοντελοποίησης, συμπεριλαμβανομένης της ενότητας αυτοπροσοχής, του συνόλου μοντέλων και της εξομάλυνσης ετικετών σε συνδυασμό, παρέχουν σημαντική βελτίωση της απόδοσης. Το τελικό μοντέλο είναι αποδοτικό όπως αποδεικνύεται από τα μέτρα αξιολόγησης. Επιπλέον, εντοπίζουμε πολύ υψηλή ακρίβεια top-2 και σημαντική διαφορά στην ακρίβεια top-1. Αυτό μπορεί να αποδοθεί στην ασάφεια της κάλυψης: όταν η κορυφαία ταξινόμηση είναι λανθασμένη, η 2η εικασία συχνά ταιριάζει με τον ανθρώπινο σχολιασμό.

Επεξηγήσεις και αποτελέσματα μοντέλων

Για να ρίξουμε φως στην ασάφεια της κάλυψης και να κατανοήσουμε τι χρησιμοποίησε το μοντέλο για να καταλήξουμε σε ένα δεδομένο συμπέρασμα, πραγματοποιούμε ανάλυση χρησιμοποιώντας επεξηγήσεις μοντέλων. Αποτελείται από δύο μέρη: καθολικές επεξηγήσεις που αναλύουν όλες τις μαθημένες ενσωματώσεις από κοινού και τοπικές επεξηγήσεις που μεγεθύνουν σε μεμονωμένες αναπαραστάσεις για να αναλύσουν τα πιο σημαντικά σήματα που καταγράφονται από το μοντέλο.

Παγκόσμιες εξηγήσεις

Σε αυτό το στάδιο, αναλύουμε τις μαθημένες ενσωματώσεις παιχνιδιού από το μοντέλο ταξινόμησης κάλυψης σε παγκόσμιο επίπεδο για να ανακαλύψουμε τυχόν μοτίβα που απαιτούν μη αυτόματο έλεγχο. Χρησιμοποιούμε στοχαστική ενσωμάτωση γείτονα κατανεμημένης t (t-SNE) (Οι Maaten et al.) που προβάλλει τις ενσωματώσεις αναπαραγωγής σε δισδιάστατο χώρο, όπως ένα ζεύγος παρόμοιων ενσωματώσεων, έχουν μεγάλη πιθανότητα διανομής τους. Πειραματιζόμαστε με τις εσωτερικές παραμέτρους για να εξαγάγουμε σταθερές δισδιάστατες προβολές. Οι ενσωματώσεις από στρωματοποιημένα δείγματα 2 παιχνιδιών απεικονίζονται στο παρακάτω σχήμα (αριστερά), με κάθε κουκκίδα να αντιπροσωπεύει ένα συγκεκριμένο παιχνίδι. Διαπιστώνουμε ότι η πλειονότητα κάθε σχήματος κάλυψης είναι καλά διαχωρισμένα, αποδεικνύοντας την ικανότητα ταξινόμησης που αποκτά το μοντέλο. Παρατηρούμε δύο σημαντικά μοτίβα και τα διερευνούμε περαιτέρω.

Ορισμένα έργα αναμιγνύονται σε άλλους τύπους κάλυψης, όπως φαίνεται στο παρακάτω σχήμα (δεξιά). Αυτά τα έργα θα μπορούσαν ενδεχομένως να χαρακτηριστούν λανθασμένα και αξίζουν χειροκίνητη επιθεώρηση. Σχεδιάζουμε έναν ταξινομητή K-Nearest Neighbors (KNN) για να αναγνωρίζει αυτόματα αυτά τα έργα και να τα στέλνει για έλεγχο από ειδικούς. Τα αποτελέσματα δείχνουν ότι τα περισσότερα από αυτά είχαν πράγματι επισημανθεί εσφαλμένα.

Οπτικοποίηση t-SNE των ενσωματώσεων αναπαραγωγής και των αναγνωρισμένων παιχνιδιών για μη αυτόματο έλεγχο

Στη συνέχεια, παρατηρούμε αρκετές επικαλυπτόμενες περιοχές μεταξύ των τύπων κάλυψης, εμφανίζοντας ασάφεια κάλυψης σε ορισμένα σενάρια. Για παράδειγμα, στο παρακάτω σχήμα, διαχωρίζουμε το Cover 3 Zone (πράσινο σύμπλεγμα στα αριστερά) και το Cover 1 Man (μπλε σύμπλεγμα στη μέση). Πρόκειται για δύο διαφορετικές έννοιες μίας-υψηλής κάλυψης, όπου η κύρια διάκριση είναι η κάλυψη ανθρώπου έναντι ζώνης. Σχεδιάζουμε έναν αλγόριθμο που προσδιορίζει αυτόματα την ασάφεια μεταξύ αυτών των δύο κλάσεων ως την επικαλυπτόμενη περιοχή των συστάδων. Το αποτέλεσμα απεικονίζεται ως οι κόκκινες κουκκίδες στο παρακάτω δεξιό σχήμα, με 10 τυχαία δειγματοληπτικά παιχνίδια σημειωμένα με μαύρο "x" για μη αυτόματη αναθεώρηση. Η ανάλυσή μας αποκαλύπτει ότι τα περισσότερα από τα παραδείγματα παιχνιδιού σε αυτήν την περιοχή περιλαμβάνουν κάποιο είδος αντιστοίχισης προτύπων. Σε αυτά τα έργα, οι ευθύνες κάλυψης εξαρτώνται από το πώς κατανέμονται οι διαδρομές των επιθετικών δεκτών και οι προσαρμογές μπορούν να κάνουν το παιχνίδι να μοιάζει με ένα μείγμα καλύψεων ζώνης και ανθρώπου. Μια τέτοια προσαρμογή που εντοπίσαμε ισχύει για το Cover 3 Zone, όταν το γωνιακό πίσω μέρος (CB) στη μία πλευρά είναι κλειδωμένο στην κάλυψη ανθρώπου ("Man Everywhere He Goes" ή MEG) και η άλλη έχει μια παραδοσιακή πτώση ζώνης.

Επικαλυπτόμενη περιοχή μεταξύ Cover 3 Zone και Cover 1 Man

Επεξηγήσεις περιπτώσεων

Στο δεύτερο στάδιο, οι επεξηγήσεις περιπτώσεων μεγεθύνουν το μεμονωμένο παιχνίδι ενδιαφέροντος και εξάγουν καρέ-καρέ σημεία αλληλεπίδρασης παίκτη που συνεισφέρουν τα μέγιστα στο καθορισμένο σχήμα κάλυψης. Αυτό επιτυγχάνεται μέσω του αλγόριθμου Guided GradCAM (Ramprasaath et al.). Χρησιμοποιούμε τις επεξηγήσεις περιπτώσεων για προβλέψεις μοντέλων χαμηλής εμπιστοσύνης.

Για το παιχνίδι που εικονογραφήσαμε στην αρχή της ανάρτησης, το μοντέλο προέβλεψε το Cover 3 Zone με 44.5% πιθανότητα και το Cover 1 Man με 31.3% πιθανότητα. Δημιουργούμε τα αποτελέσματα επεξήγησης και για τις δύο κατηγορίες όπως φαίνεται στο παρακάτω σχήμα. Το πάχος της γραμμής υποδηλώνει την ισχύ αλληλεπίδρασης που συμβάλλει στην αναγνώριση του μοντέλου.

Η κορυφαία πλοκή για την εξήγηση της ζώνης κάλυψης 3 έρχεται αμέσως μετά το χτύπημα της μπάλας. Ο CB στα δεξιά της επίθεσης έχει τις ισχυρότερες γραμμές αλληλεπίδρασης, επειδή είναι στραμμένος προς το QB και παραμένει στη θέση του. Καταλήγει να κάνει τετράγωνο και να ταιριάζει με τον δέκτη στο πλάι του, ο οποίος τον απειλεί βαθιά.

Η κάτω πλοκή για την εξήγηση του Cover 1 Man έρχεται λίγο αργότερα, καθώς συμβαίνει το play action fake. Μία από τις ισχυρότερες αλληλεπιδράσεις είναι με τον CB στα αριστερά της επίθεσης, ο οποίος πέφτει με το WR. Τα πλάνα αναπαραγωγής αποκαλύπτουν ότι κρατά τα μάτια του στο QB πριν γυρίσει και τρέξει με τον WR που τον απειλεί βαθιά. Ο SS στα δεξιά της επίθεσης έχει επίσης μια ισχυρή αλληλεπίδραση με τον TE στο πλάι του, καθώς αρχίζει να ανακατεύεται καθώς το TE σπάει μέσα. Καταλήγει να τον ακολουθεί στον σχηματισμό, αλλά το TE αρχίζει να τον μπλοκάρει, υποδεικνύοντας ότι το παιχνίδι ήταν πιθανώς μια επιλογή run-pass. Αυτό εξηγεί την αβεβαιότητα της ταξινόμησης του μοντέλου: το TE κολλάει με το SS από το σχεδιασμό, δημιουργώντας προκαταλήψεις στα δεδομένα.

Η εξήγηση μοντέλου για το Cover 3 Zone έρχεται αμέσως μετά το χτύπημα της μπάλας

Η εξήγηση μοντέλου για το Cover 1 Man έρχεται μια στιγμή αργότερα, καθώς συμβαίνει το play action fake

Συμπέρασμα

Το Amazon ML Solutions Lab και η ομάδα Next Gen Stats του NFL ανέπτυξαν από κοινού τα στατιστικά στοιχεία ταξινόμησης αμυντικής κάλυψης που ήταν πρόσφατα που ξεκίνησε για την ποδοσφαιρική σεζόν NFL 2022. Αυτή η ανάρτηση παρουσίασε τις τεχνικές λεπτομέρειες ML αυτού του στατιστικού, συμπεριλαμβανομένης της μοντελοποίησης της γρήγορης χρονικής εξέλιξης, στρατηγικές εκπαίδευσης για τον χειρισμό της ασάφειας της κατηγορίας κάλυψης και περιεκτικές επεξηγήσεις μοντέλων για την επιτάχυνση της αναθεώρησης των ειδικών τόσο σε παγκόσμιο όσο και σε επίπεδο παρουσίας.

Η λύση καθιστά διαθέσιμες τάσεις και διαχωρισμούς ζωντανής αμυντικής κάλυψης στους ραδιοτηλεοπτικούς φορείς εντός του παιχνιδιού για πρώτη φορά. Ομοίως, το μοντέλο επιτρέπει στο NFL να βελτιώσει την ανάλυσή του για τα αποτελέσματα μετά τον αγώνα και να εντοπίζει καλύτερα τις βασικές αντιστοιχίσεις που οδηγούν σε αγώνες.

Εάν θέλετε βοήθεια για την επιτάχυνση της χρήσης του ML, επικοινωνήστε με το Εργαστήριο Amazon ML Solutions προγράμματος.

Παράρτημα

Ακρωνύμια θέσης παίκτη
Αμυντικές θέσεις
W "Θα" Linebacker, ή η αδύναμη πλευρά LB
M "Mike" Linebacker, ή το μεσαίο LB
S "Sam" Linebacker, ή η ισχυρή πλευρά LB
CB Cornerback
DE Αμυντικό τέλος
DT Αμυντικό τάκλιν
NT Αντιμετώπιση μύτης
FS Δωρεάν Ασφάλεια
SS Ισχυρή ασφάλεια
S Ασφάλεια
LB Linebacker
ΑΥΤΟΣ Β Inside Linebacker
OLB Εξωτερικό Linebacker
MLB Μέσος οπαδός της γραμμής
Επιθετικές θέσεις
X Συνήθως ο νούμερο 1 ευρύς δέκτης σε μια παράβαση, ευθυγραμμίζονται στο LOS. Σε σχηματισμούς ταξιδιών, αυτός ο δέκτης είναι συχνά ευθυγραμμισμένος απομονωμένος στην πίσω πλευρά.
Y Συνήθως στο αρχικό σφιχτό άκρο, αυτός ο παίκτης συχνά ευθυγραμμίζεται στη γραμμή και στην αντίθετη πλευρά με το X.
Z Συνήθως περισσότερο ως δέκτης κουλοχέρη, αυτός ο παίκτης συχνά ευθυγραμμίζεται από τη γραμμή του αγώνα και στην ίδια πλευρά του γηπέδου με το σφιχτό άκρο.
H Παραδοσιακά ένας μπακ, αυτός ο παίκτης είναι πιο συχνά τρίτος πλάγιος δέκτης ή δεύτερος σφιχτός στο σύγχρονο πρωτάθλημα. Μπορούν να ευθυγραμμιστούν σε όλο τον σχηματισμό, αλλά είναι σχεδόν πάντα εκτός της γραμμής του αγώνα. Ανάλογα με την ομάδα, αυτός ο παίκτης θα μπορούσε επίσης να οριστεί ως F.
T Το χαρακτηριστικό τρέξιμο πίσω. Εκτός από άδειους σχηματισμούς, αυτός ο παίκτης θα ευθυγραμμιστεί στο μετόπισθεν και θα αποτελέσει απειλή για να δεχθεί το handoff.
QB Γκόλ
C Κέντρο
G φρουρά
RB Τρέξιμο πίσω
FB Πίσω ολοταχώς
WR Ευρύς δέκτης
TE Σφιχτό τέλος
LG Αριστερή φρουρά
RG Δεξιά φρουρά
T Πιάνω
LT Αριστερό Αντιμετώπιση
RT Σωστό Αντιμετώπιση

αναφορές

  • Tej Seth, Ryan Weisman, «Μελέτη δεδομένων PFF: Η μοναδικότητα του σχήματος κάλυψης για κάθε ομάδα και τι σημαίνει αυτό για τις αλλαγές προπονητών», https://www.pff.com/news/nfl-pff-data-study-coverage-scheme-uniqueness-for-each-team-and-what-that-means-for-coaching-changes
  • Μπεν Μπάλντουιν. "Computer Vision με δεδομένα παρακολούθησης NFL Player με χρήση φακού για R: ​​Ταξινόμηση κάλυψης με χρήση CNN." https://www.opensourcefootball.com/posts/2021-05-31-computer-vision-in-r-using-torch/
  • Dmitry Gordeev, Philipp Singer. "Λύση 1ης θέσης The Zoo." https://www.kaggle.com/c/nfl-big-data-bowl-2020/discussion/119400
  • Vaswani, Ashish, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser και Illia Polosukhin. «Η προσοχή είναι το μόνο που χρειάζεστε». Πρόοδοι σε συστήματα επεξεργασίας νευρωνικών πληροφοριών 30 (2017).
  • Τζέι Αλαμμάρ. «Ο εικονογραφημένος μετασχηματιστής». https://jalammar.github.io/illustrated-transformer/
  • Müller, Rafael, Simon Kornblith και Geoffrey E. Hinton. "Πότε βοηθά η εξομάλυνση ετικετών;" Πρόοδοι στα συστήματα επεξεργασίας νευρωνικών πληροφοριών 32 (2019).
  • Van der Maaten, Laurens και Geoffrey Hinton. "Οπτικοποίηση δεδομένων με χρήση t-SNE." Εφημερίδα της έρευνας μηχανικής μάθησης 9, όχι. 11 (2008).
  • Selvaraju, Ramprasaath R., Michael Cogswell, Abhishek Das, Ramakrishna Vedantam, Devi Parikh και Dhruv Batra. "Grad-cam: Οπτικές επεξηγήσεις από βαθιά δίκτυα μέσω τοπικής προσαρμογής βάσει κλίσης." Σε Πρακτικά του διεθνούς συνεδρίου IEEE για το όραμα του υπολογιστή, σελ. 618-626. 2017.

Σχετικά με τους Συγγραφείς

Προσδιορισμός συστημάτων κάλυψης άμυνας στο NFL's Next Gen Stats PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Χουάν Σονγκ είναι εφαρμοσμένος επιστήμονας στο Amazon Machine Learning Solutions Lab, όπου εργάζεται για την παροχή προσαρμοσμένων λύσεων ML για περιπτώσεις χρήσης υψηλού αντίκτυπου από πελάτες από μια ποικιλία βιομηχανικών κλάδων. Τα ερευνητικά του ενδιαφέροντα είναι τα νευρωνικά δίκτυα γραφημάτων, η όραση υπολογιστών, η ανάλυση χρονοσειρών και οι βιομηχανικές εφαρμογές τους.

Προσδιορισμός συστημάτων κάλυψης άμυνας στο NFL's Next Gen Stats PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Mohamad Al Jazaery είναι εφαρμοσμένος επιστήμονας στο Amazon Machine Learning Solutions Lab. Βοηθά τους πελάτες της AWS να εντοπίσουν και να δημιουργήσουν λύσεις ML για να αντιμετωπίσουν τις επιχειρηματικές τους προκλήσεις σε τομείς όπως η εφοδιαστική, η εξατομίκευση και οι συστάσεις, η όραση υπολογιστών, η πρόληψη απάτης, η πρόβλεψη και η βελτιστοποίηση της εφοδιαστικής αλυσίδας. Πριν από το AWS, απέκτησε το MCS του από το Πανεπιστήμιο της Δυτικής Βιρτζίνια και εργάστηκε ως ερευνητής όρασης υπολογιστών στη Midea. Εκτός δουλειάς, του αρέσει το ποδόσφαιρο και τα βιντεοπαιχνίδια.

Προσδιορισμός συστημάτων κάλυψης άμυνας στο NFL's Next Gen Stats PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Χάιμπο Ντινγκ είναι ανώτερος εφαρμοσμένος επιστήμονας στο Amazon Machine Learning Solutions Lab. Ενδιαφέρεται ευρέως για τη βαθιά μάθηση και την επεξεργασία φυσικής γλώσσας. Η έρευνά του επικεντρώνεται στην ανάπτυξη νέων εξηγήσιμων μοντέλων μηχανικής μάθησης, με στόχο να γίνουν πιο αποτελεσματικά και αξιόπιστα για προβλήματα του πραγματικού κόσμου. Απέκτησε το διδακτορικό του. από το Πανεπιστήμιο της Γιούτα και εργάστηκε ως ανώτερος ερευνητής στην Bosch Research North America πριν ενταχθεί στην Amazon. Εκτός από τη δουλειά, του αρέσει η πεζοπορία, το τρέξιμο και ο χρόνος με την οικογένειά του.

Προσδιορισμός συστημάτων κάλυψης άμυνας στο NFL's Next Gen Stats PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Lin Lee Cheong είναι διευθυντής εφαρμοσμένης επιστήμης με την ομάδα του Amazon ML Solutions Lab στο AWS. Συνεργάζεται με στρατηγικούς πελάτες AWS για να εξερευνήσει και να εφαρμόσει την τεχνητή νοημοσύνη και τη μηχανική μάθηση για να ανακαλύψει νέες ιδέες και να λύσει σύνθετα προβλήματα. Έλαβε το διδακτορικό της. από το Ινστιτούτο Τεχνολογίας της Μασαχουσέτης. Εκτός δουλειάς, της αρέσει το διάβασμα και η πεζοπορία.

Προσδιορισμός συστημάτων κάλυψης άμυνας στο NFL's Next Gen Stats PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Τζόναθαν Γιουνγκ είναι Ανώτερος Μηχανικός Λογισμικού στο National Football League. Τα τελευταία επτά χρόνια εργάζεται στην ομάδα των Next Gen Stats, βοηθώντας στη δημιουργία της πλατφόρμας από τη ροή των ακατέργαστων δεδομένων, τη δημιουργία μικροϋπηρεσιών για την επεξεργασία των δεδομένων και τη δημιουργία API που εκθέτουν τα επεξεργασμένα δεδομένα. Έχει συνεργαστεί με το Amazon Machine Learning Solutions Lab για την παροχή καθαρών δεδομένων με τα οποία μπορούν να εργαστούν, καθώς και την παροχή γνώσης τομέα σχετικά με τα ίδια τα δεδομένα. Εκτός δουλειάς, του αρέσει η ποδηλασία στο Λος Άντζελες και η πεζοπορία στο Sierras.

Προσδιορισμός συστημάτων κάλυψης άμυνας στο NFL's Next Gen Stats PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Mike Band είναι Ανώτερος Διευθυντής Έρευνας και Αναλύσεων για Next Gen Stats στο National Football League. Από τότε που εντάχθηκε στην ομάδα το 2018, είναι υπεύθυνος για τον ιδεασμό, την ανάπτυξη και την επικοινωνία βασικών στατιστικών και πληροφοριών που προέρχονται από δεδομένα παρακολούθησης παικτών για οπαδούς, συνεργάτες εκπομπής NFL και 32 συλλόγους. Ο Mike φέρνει πλούτο γνώσεων και εμπειρίας στην ομάδα με μεταπτυχιακό στην ανάλυση από το Πανεπιστήμιο του Σικάγο, πτυχίο στη διαχείριση αθλημάτων από το Πανεπιστήμιο της Φλόριντα και εμπειρία τόσο στο τμήμα scouting των Minnesota Vikings όσο και στο τμήμα στρατολόγησης του Florida Gator Football.

Προσδιορισμός συστημάτων κάλυψης άμυνας στο NFL's Next Gen Stats PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Michael Chi είναι Ανώτερος Διευθυντής Τεχνολογίας που επιβλέπει τα στατιστικά στοιχεία της επόμενης γενιάς και τη μηχανική δεδομένων στο National Football League. Είναι πτυχιούχος Μαθηματικών και Επιστήμης Υπολογιστών από το Πανεπιστήμιο του Ιλινόις στο Urbana Champaign. Ο Michael εντάχθηκε για πρώτη φορά στο NFL το 2007 και έχει επικεντρωθεί κυρίως στην τεχνολογία και τις πλατφόρμες για τα στατιστικά του ποδοσφαίρου. Στον ελεύθερο χρόνο του, του αρέσει να περνά χρόνο με την οικογένειά του σε εξωτερικούς χώρους.

Προσδιορισμός συστημάτων κάλυψης άμυνας στο NFL's Next Gen Stats PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Thompson Bliss είναι Manager, Football Operations, Data Scientist στο National Football League. Ξεκίνησε στο NFL τον Φεβρουάριο του 2020 ως Επιστήμονας Δεδομένων και προήχθη στον τρέχοντα ρόλο του τον Δεκέμβριο του 2021. Ολοκλήρωσε το μεταπτυχιακό του στην Επιστήμη των Δεδομένων στο Πανεπιστήμιο Columbia στην πόλη της Νέας Υόρκης τον Δεκέμβριο του 2019. Έλαβε Bachelor of Science στη Φυσική και την Αστρονομία με ανηλίκους στα Μαθηματικά και την Επιστήμη Υπολογιστών στο Πανεπιστήμιο του Wisconsin - Madison το 2018.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS