Betydningen av dødballer i fotball (eller fotball i USA) har vært økende de siste årene: nå blir mer enn en fjerdedel av alle mål scoret via dødballer. Frispark og cornere skaper generelt de mest lovende situasjonene, og noen profesjonelle lag har til og med ansatt spesifikke trenere for de delene av spillet.
I dette innlegget deler vi hvordan Bundesliga Match Fact Set Piece Threat hjelper til med å evaluere prestasjon i dødballer. Ettersom lag ser etter å utnytte disse dødballsituasjonene mer og mer, vil Set Piece Threat hjelpe seeren å forstå hvor godt lagene utnytter disse situasjonene. I tillegg vil den forklare leseren hvordan AWS-tjenester kan brukes til å beregne statistikk i sanntid.
Bundesligas Union Berlin er et godt eksempel på relevansen til dødballer. Laget klarte å ta seg opp fra Bundesliga 2 til kvalifisering til en europeisk konkurranse på bare 2 år. De endte på tredjeplass i Bundesliga 2 i løpet av sesongen 18/19, og tjente seg en plass i nedrykkssluttspillet til Bundesliga. I den sesongen scoret de 28 mål fra åpent spill, og rangerte bare på niendeplass i ligaen. Imidlertid rangerte de på andreplass for mål scoret gjennom dødballer (16 mål).
I den første nedrykkssluttkampen mot VfB Stuttgart sikret Union en uavgjort 2:2, og scoret en heading etter en corner. Og i returkampen ble Stuttgart nektet et frisparksmål på grunn av en passiv offside, noe som tillot Union å gå inn i Bundesliga med uavgjort 0:0.
Relevansen av dødballer for Unions suksess slutter ikke der. Union avsluttet sine to første Bundesliga-sesonger med sterke ellevte og syvende, rangert på tredje og første plass i antall dødballmål (scorer 15 mål fra dødballer i begge sesongene). Til sammenligning klarte FC Bayern München – ligamesteren – bare å score 10 mål fra dødballer i begge sesongene. Suksessen Union Berlin har hatt med dødballene sine tillot dem å sikre seg syvendeplassen i Bundesliga-sesongen 20/21, som betydde kvalifisering til UEFA Europa Conference League, som gikk fra Bundesliga 2 til Europa bare 2 år etter opprykk. Ikke overraskende, i den avgjørende kampen, scoret de ett av sine to mål etter en corner. Når dette skrives ligger Union Berlin på fjerde plass i Bundesliga (20. kampdag) og først i hjørneprestasjon, en statistikk vi forklarer senere.
Union Berlins vei til Europa viser tydelig den innflytelsesrike rollen til offensive og defensive prestasjoner under dødballer. Til nå var det imidlertid vanskelig for fans og kringkastere å kvantifisere denne ytelsen på riktig måte, med mindre de ønsket å dissekere massive tabeller på analysenettsteder. Bundesliga og AWS har jobbet sammen for å illustrere trusselen som et lag produserer og trusselen som produseres av dødballer mot laget, og kom med den nye Bundesliga Match Fact: Set Piece Threat.
Hvordan fungerer Set Piece Threat?
For å fastslå trusselen et lag utgjør med dødballene sine, tar vi hensyn til ulike fasetter av dødballprestasjonene deres. Det er viktig å merke seg at vi kun vurderer cornere og frispark som dødballer, og beregner trusselen for hver kategori uavhengig.
Fasett 1: Utfall av en dødball: Mål, skudd eller ingenting
Først vurderer vi utfall av en dødball. Det vil si at vi observerer om det resulterer i et mål. Imidlertid er resultatet generelt påvirket av fine marginer, som en stor redning av målvakten eller hvis et skudd børster stolpen i stedet for å gå inn, så vi kategoriserer også kvaliteten på et skudd som er resultatet av dødballen. Skudd er kategorisert i flere kategorier.
Kategori | Forklaring |
Mål | Et vellykket skudd som førte til mål |
Fremragende | Skudd som nesten førte til mål, som et skudd i stolpen |
Anstendig | Andre bemerkelsesverdige målscener |
Gjennomsnitt | Resten av sjansene som vil være inkludert i et sjanseforhold med relevant trussel om et mål |
none | Ingen reell måltrussel, bør ikke betraktes som en reell sjanse, for eksempel en heading som knapt rørte ballen eller et blokkert skudd |
Ingen skudd | Ingen skudd tatt i det hele tatt |
Videoen ovenfor viser eksempler på skuddresultatkategorier i følgende rekkefølge: fremragende, anstendig, gjennomsnittlig, ingen.
Fasett 2: Potensialet til et skudd
For det andre vurderer algoritmen vår potensialet til et skudd. Dette inkluderer hvor sannsynlig det burde ha resultert i et mål, og tar den faktiske prestasjonen til skuddtakeren ut av ligningen. Vi kvantifiserer med andre ord målpotensialet i situasjonen der skuddet ble tatt. Dette fanges opp av forventet mål (xGoals) verdien av skuddet. Vi fjerner ikke bare forekomsten av flaks eller mangel på det, men også kvaliteten på streiken eller headeren.
Fasett 3: Antall dødballer
Deretter tar vi for oss aspektet ren kvantitet av dødballer som et lag får. Vår definisjon av dødsfallstrussel måler trusselen per sett-del-basis. I stedet for å summere opp alle utfall og xGoal-verdier for et lag i løpet av en sesong, aggregeres verdiene slik at de representerer den gjennomsnittlige trusselen per dødball. På den måten representerer for eksempel cornertrusselen lagets fare for hvert hjørne og anser ikke et lag som mer farlig bare fordi de har flere cornere enn andre lag (og derfor potensielt flere skudd eller mål).
Fasett 4: Utvikling over tid
Det siste aspektet å vurdere er utviklingen av et teams trussel over tid. Tenk for eksempel på et lag som scoret tre mål fra cornere i løpet av de tre første kampdagene, men som ikke klarer å levere noen betydelig trussel i løpet av de neste 15 kampdagene. Dette laget bør ikke anses å utgjøre en betydelig trussel fra cornere på kampdag 19, til tross for at det allerede har scoret tre ganger, noe som fortsatt kan være en god avkastning. Vi redegjør for denne (positive eller negative) utviklingen av et lags dødballkvalitet ved å tildele en rabatt til hver dødball, avhengig av hvor lenge siden det skjedde. Med andre ord, et frispark som ble tatt for 10 kampdager siden har mindre innflytelse på den beregnede trusselen enn et som ble tatt i løpet av siste eller til og med pågående kamp.
Poengsum: Per dødballaggregering
Alle de fire fasettene vi har beskrevet er samlet i to verdier for hvert lag, en for cornere og en for frispark, som beskriver faren som en tilsvarende dødball fra det laget for øyeblikket vil utgjøre. Verdien er definert som det vektede gjennomsnittet av poengsummene til hver dødball, der poengsummen til en dødball er definert som (0.7 * shot-outcome + 0.3 * xG-value)
hvis dødballen resulterte i et skudd og 0 ellers. De shot-outcome
er 1 hvis laget scoret og lavere for andre utfall, for eksempel et skudd som gikk utenfor, avhengig av kvaliteten. Vekten for hver dødball bestemmes av hvor lenge siden den ble tatt, som beskrevet tidligere. Totalt sett er verdiene definert mellom 0–1, hvor 1 er den perfekte poengsummen.
Dødbrikke trussel
Deretter sammenlignes verdiene for hvert lag med ligagjennomsnittet. Den nøyaktige formelen er score(team)/avg_score(league) - 1
. Denne verdien er det vi kaller Set Piece Threat-verdien. Et lag har en trusselverdi på 0 hvis den er nøyaktig like god som ligagjennomsnittet. En verdi på -1 (eller -100%) beskriver et lag som ikke utgjør noen trussel i det hele tatt, og en verdi på +1 (+100%) beskriver et lag som er dobbelt så farlig som ligagjennomsnittet. Med disse verdiene beregner vi en rangering som rangerer lagene fra 1–18 i henhold til deres offensive trussel om henholdsvis cornere og frispark.
Vi bruker de samme dataene og lignende beregninger for også å beregne en defensiv trussel som måler den defensive ytelsen til et lag med hensyn til hvordan de forsvarer dødballer. Nå, i stedet for å beregne en poengsum per egen dødball, beregner algoritmen en poengsum per motstanders dødball. Akkurat som for den offensive trusselen sammenlignes poengsummen med ligagjennomsnittet, men verdien er snudd: -score(team)/avg_score(league) + 1
. På denne måten oppnås en trussel på +1 (+100%) hvis laget tillater motstanderne ingen skudd i det hele tatt, mens et lag med defensiv trussel på -1 (-100%) er dobbelt så utsatt for motstandernes dødballer som ligaen gjennomsnitt. Igjen, et lag med en trussel på 0 er like bra som ligasnittet.
Funn fra Set Piece Threat
Et viktig aspekt ved dødballtrussel er at vi fokuserer på et estimat av trusselen i stedet for mål scoret og sluppet inn via dødballer. Hvis vi tar SC Freiburg og Union Berlin på kampdag 21 som et eksempel, har Freiburg i løpet av denne sesongen scoret syv mål via cornere sammenlignet med fire fra Union Berlin. Trusselrangeringen vår rangerer fortsatt begge lagene ganske like. Faktisk spår vi en corner av Freiburg (ranking 3) til å være 7 % mindre truende enn en corner av Union Berlin (ranking 1). Hovedårsaken til dette er at Union Berlin skapte et tilsvarende antall store sjanser ut av hjørnene sine, men ikke klarte å omsette disse sjansene til mål. Freiburg på den annen side var langt mer effektiv med sine sjanser. Et slikt avvik mellom sjansekvalitet og faktiske mål kan skje i en sport med høy varians som fotball.
Følgende graf viser Union Berlins offensive hjørnerangering (blå) og poengsum (rød) fra kampdagene 6–21. På kampdag 12 scoret Union et mål fra en corner og hadde i tillegg en stor sjanse fra en andre corner som ikke resulterte i mål, men som ble oppfattet som en høy trussel av vår algoritme. I tillegg hadde Union et skudd på mål i fem av sju hjørnespark på kampdag 12. Union hoppet umiddelbart i rangeringen fra tolvte til femte plass som følge av dette, og poengverdien for Union økte i tillegg til ligasnittet. Ettersom Union så flere og flere høye trusselsjanser i de senere kampdagene fra cornere, tok de steg for steg førsteplassen i hjørnetrusselsrangeringen. Poengsummen er alltid i forhold til gjeldende ligagjennomsnitt, noe som betyr at Unions trussel på kampdag 21 er 50 % høyere fra cornere enn den gjennomsnittlige trusselen fra alle lag i ligaen.
Implementering og arkitektur
Bundesliga kampfakta kjører uavhengig AWS Fargate beholdere inni Amazon Elastic Container Service (Amazon ECS). Tidligere Bundesliga-kampfakta bruker rå hendelses- og posisjonsdata for å beregne avansert statistikk. Dette endres med utgivelsen av Set Piece Threat, som analyserer data produsert av en eksisterende Bundesliga Match Fact (xMål) for å beregne rangeringene. Derfor har vi laget en arkitektur for å utveksle meldinger mellom forskjellige Bundesliga-kampfakta under direktesendte kamper i sanntid.
For å garantere at de nyeste dataene gjenspeiles i beregningene av dødsulykker, bruker vi Amazon administrerte strømming for Apache Kafka (Amazon MSK). Denne meldingsmeglertjenesten lar forskjellige Bundesliga-kampfakta sende og motta de nyeste hendelsene og oppdateringene i sanntid. Ved å konsumere en kamp- og Bundesliga-kampfakta-spesifikt emne fra Kafka, kan vi motta de mest oppdaterte dataene fra alle involverte systemer samtidig som vi beholder muligheten til å spille av og behandle meldinger som er sendt tidligere.
Følgende diagram illustrerer løsningsarkitekturen:
Vi introduserte Amazon MSK til dette prosjektet for generelt å erstatte all intern meldingsoverføring for Bundesliga Match Facts-plattformen. Den håndterer injeksjon av posisjons- og hendelsesdata, som kan samles til over 3.6 millioner datapunkter per kamp. Med Amazon MSK kan vi bruke den underliggende vedvarende lagringen av meldinger, som lar oss spille på nytt fra ethvert tidspunkt. Men for Set Piece Threat ligger fokuset på den spesifikke bruken av begivenheter produsert av Bundesliga Match Facts til andre Bundesliga Match Facts som kjører parallelt.
For å lette dette, skiller vi mellom to typer Kafka-emner: globale og kampspesifikke. For det første har hver Bundesliga Match Fact et eget spesifikt globalt emne, som håndterer alle meldinger laget av Bundesliga Match Fact. I tillegg er det et ekstra kampspesifikt emne for hver Bundesliga-kampfakta for hver kamp som håndterer alle meldinger laget av en Bundesliga-kampfakta for en spesifikk kamp. Når flere live-kamper kjøres parallelt, blir hver melding først produsert og sendt til dette Bundesliga Match Fact-spesifikke globale emnet.
En utsendte AWS Lambda funksjonen abonnerer på alle Bundesliga Match Fakta-spesifikke globale emner og har to oppgaver:
- Skriv de innkommende dataene til en database levert gjennom Amazon Relational Database Service (Amazon RDS).
- Omdistribuer meldingene som kan konsumeres av andre Bundesliga-kampfakta til et Bundesliga-kampfakta-spesifikt emne.
Den venstre siden av arkitekturdiagrammet viser de forskjellige Bundesliga-kampfakta som kjører uavhengig av hverandre for hver kamp og produserer meldinger til det globale emnet. Den nye dødballtrusselen Bundesliga Match Fact kan nå konsumere de siste xGoal-verdiene for hvert skudd for en spesifikk kamp (høyre side av diagrammet) for umiddelbart å beregne trusselen produsert av dødballen som resulterte i ett eller flere skudd.
Oppsummering
Vi er begeistret over lanseringen av Set Piece Threat og mønstrene som kommentatorer og fans vil avdekke ved å bruke denne splitter nye innsikten. Ettersom lagene ser etter å utnytte disse dødballsituasjonene mer og mer, vil dødball-trussel hjelpe seeren å forstå hvilket lag som gjør dette med suksess og hvilket lag som fortsatt har litt terreng å dekke, noe som gir ekstra spenning før hver av disse dødballsituasjonene. Det nye Bundesliga Match Fact er tilgjengelig for Bundesligas kringkastere for å avdekke nye perspektiver og historier om en kamp, og lagrangeringer kan ses når som helst i Bundesliga-appen.
Vi er spente på å lære hvilke mønstre du vil avdekke. Del din innsikt med oss: @AWScloud på Twitter, med hashtaggen #BundesligaMatchFacts.
Om forfatterne
simon rolfes spilte 288 Bundesliga-kamper som sentral midtbanespiller, scoret 41 mål og vant 26 landskamper for Tyskland. For tiden fungerer Rolfes som sportsdirektør i Bayer 04 Leverkusen, hvor han overvåker og utvikler pro-spillerlisten, speideravdelingen og klubbens ungdomsutvikling. Simon skriver også ukentlige spalter på Bundesliga.com om de siste Bundesliga-kampfakta drevet av AWS
Luuk Figdor er senior sportsteknologispesialist i AWS Professional Services-teamet. Han jobber med spillere, klubber, ligaer og medieselskaper som Bundesliga og Formel 1 for å hjelpe dem å fortelle historier med data ved hjelp av maskinlæring. På fritiden liker han å lære alt om sinnet og skjæringspunktet mellom psykologi, økonomi og AI.
Jan Bauer er en skyapplikasjonsarkitekt hos AWS Professional Services. Hans interesser er serverløs databehandling, maskinlæring og alt som involverer cloud computing. Han jobber med kunder på tvers av bransjer for å hjelpe dem med å lykkes på sin skyreise.
Pascal Kühner er en skyapplikasjonsutvikler i AWS Professional Services Team. Han jobber med kunder på tvers av bransjer for å hjelpe dem med å oppnå sine forretningsresultater via applikasjonsutvikling, DevOps og infrastruktur. Han elsker ballsport og liker å spille basketball og fotball på fritiden.
Uwe Dick er dataforsker ved Sportec Solutions AG. Han jobber for å gjøre det mulig for Bundesliga-klubber og media å optimere ytelsen ved hjelp av avansert statistikk og data – før, etter og under kamper. På fritiden nøyer han seg med mindre og prøver bare å holde ut hele 90 minutter for fritidsfotballlaget.
Javier Poveda-Panter er en Data Scientist for EMEA sportskunder innenfor AWS Professional Services-teamet. Han gjør det mulig for kunder innen tilskuersport å innovere og utnytte dataene deres, og levere høykvalitets bruker- og fanopplevelser gjennom maskinlæring og datavitenskap. Han følger lidenskapen sin for et bredt spekter av sport, musikk og AI på fritiden.
- Myntsmart. Europas beste Bitcoin og Crypto Exchange.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. FRI TILGANG.
- CryptoHawk. Altcoin Radar. Gratis prøveperiode.
- Kilde: https://aws.amazon.com/blogs/machine-learning/bundesliga-match-fact-set-piece-threat-evaluating-team-performance-in-set-pieces-on-aws/
- "
- 28
- 7
- Om oss
- Ifølge
- Logg inn
- oppnådd
- tvers
- Ytterligere
- avansert
- AI
- algoritme
- Alle
- tillate
- allerede
- Amazon
- analytics
- app
- Søknad
- arkitektur
- AREA
- tilgjengelig
- gjennomsnittlig
- AWS
- basketball
- Bavarian
- megler
- virksomhet
- ring
- sjansene
- Cloud
- cloud computing
- kommer
- Selskaper
- sammenlignet
- konkurranse
- Beregn
- databehandling
- Konferanse
- anser
- forbruke
- Container
- Containere
- Gjeldende
- Kunder
- dato
- datavitenskap
- dataforsker
- Database
- død
- levere
- Til tross for
- Utvikler
- Utvikling
- forskjellig
- Regissør
- Rabatt
- ikke
- Økonomi
- Europa
- europeisk
- Event
- hendelser
- alt
- eksempel
- utveksling
- Erfaringer
- slutt
- Først
- Fokus
- etter
- fotball
- Formula 1
- Gratis
- fullt
- funksjon
- spill
- Games
- Tyskland
- Global
- mål
- Mål
- skal
- god
- flott
- Håndtering
- å ha
- høyde
- hjelpe
- hjelper
- Høy
- Hvordan
- HTTPS
- betydning
- viktig
- I andre
- inkludert
- økt
- bransjer
- påvirke
- Infrastruktur
- innsikt
- interesser
- involvert
- IT
- siste
- lansere
- føre
- ligaer
- LÆRE
- læring
- Led
- Lang
- maskin
- maskinlæring
- Match
- betyr
- Media
- millioner
- tankene
- mest
- musikk
- åpen
- rekkefølge
- ordrer
- Annen
- ellers
- ytelse
- prospektet
- brikke
- plattform
- Spille
- spiller
- spillere
- pro
- produsert
- profesjonell
- prosjekt
- forfremmelse
- Psykologi
- kvalitet
- Fjerdedel
- område
- Raw
- Reader
- sanntids
- motta
- rekreasjons~~POS=TRUNC
- slipp
- representerer
- REST
- Resultater
- Kjør
- rennende
- Vitenskap
- Forsker
- sikre
- server~~POS=TRUNC
- tjeneste
- Tjenester
- sett
- bosetter
- Del
- signifikant
- lignende
- So
- Fotball
- Solutions
- Sport
- Sports
- statistikk
- stats
- lagring
- Stories
- streaming
- sterk
- suksess
- vellykket
- vellykket
- Systemer
- Target
- oppgaver
- lag
- Teknologi
- Gjennom
- tid
- sammen
- temaer
- avdekke
- forstå
- union
- oppdateringer
- us
- bruke
- verdi
- video
- nettsteder
- ukentlig
- Hva
- innenfor
- ord
- Arbeid
- arbeidet
- virker
- skriving
- år