Hur nära är nära?
Den 26 juni tog svenska herrlandslaget oss till åttondelsfinal! Likt det engelska fotbollslaget Burnley, som är en underdog i engelska ligan, har svenska landslaget ett starkt taktiskt försvarsspel. Om ett lag ska lyckas utan dyra toppspelare är det vitalt med en stark taktik vare sig det är VM eller Premier League. Med hjälp av machine learning kan alltså lagen förbättra sitt taktiska spel och därmed överprestera.
Inom ramen för unsupervised learning, där man intresserar sig för likheter mellan inputvariablerna, finns det en hel del olika klustermetoder. Det mest centrala begreppet oavsett metod, är avstånd. Hur nära är nära? Med en väldefinierad distansfunktion använde vi klustermetoden Fast Search and Density Peaks för att hitta kluster av passningssekvenser. Vi sa att passningssekvenserna representerade ett taktiskt spelmönster med motivationen att tränaren hade en taktik som spelarna försökte implementera under matchen.
För att förstå hur spelet förflyttade sig mellan taktiska spelmönster, anpassade vi en modell (stokastisk process) där vi skattade övergångssannolikheter för att ta sig från ett givet spelmönster till ett annat. När vi väl hade ett sätt för att modellera dynamiken i spelet, tittade vi på vilka spelmönster som genererade många mål.
Genom att använda modellen på motståndarlaget kan Burnley finslipa sin taktiska styrka i försvarsspelet för att tillslut vinna ligan. På samma sätt skulle det svenska landslaget kunna analysera sina motståndare i VM-slutspelet. Användandet av machine learning inom fotboll är fortfarande i sin vagga, men jag är säker på att allt fler lag inom kort kommer börja exploatera sin data.