Data-driven identification of optimal substitutions in soccer
View/Open
Cita com:
hdl:2117/394571
Tutor / directorDavis, Jesse
CovenanteeKatholieke Universiteit te Leuven
Document typeBachelor thesis
Date2023-05-25
Rights accessOpen Access
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-NoDerivs 4.0 International
Abstract
L'anàlisi basada en dades del futbol és un camp en auge, i els clubs dediquen cada vegada més recursos a obtenir un avantatge competitiu mitjançant tècniques basades en dades. Les substitucions són la principal eina de la qual disposa un entrenador per a intervenir en el transcurs del joc, i la seva limitació i rellevància han despertat l'interès pel seu estudi. En aquesta tesi busquem un enfocament analític per a la identificació i predicció de substitucions òptimes.
Amb el recent canvi en la legislació futbolística, ara es permeten a cada equip fins a cinc substitucions per partit. Comparem el nou paradigma amb l'anterior i busquem les substitucions òptimes amb l'ús de models basats en dades. Amb classificadors d'aprenentatge automàtic i un model de probabilitat de victòria en directe sensible a les substitucions, s'han avaluat els canvis de jugadors. Els mateixos models s'han utilitzat per a simular substitucions de diferent tipus i en moments alternatius, amb la finalitat de realitzar plantejaments basats en dades que augmentin les probabilitats d'èxit.
L'addició de canvis addicionals ha provocat un augment de les intervencions tàctiques dels entrenadors, però la dinàmica del partit es manté igual. Els models d'aprenentatge automàtic obtenen bons resultats en la predicció de la valoració de les substitucions. El model de probabilitat de victòria és sensible a les substitucions, que solen tenir un millor efecte per a l'equip que les realitza. Les substitucions ofensives solen augmentar les probabilitats de victòria, especialment per als equips que van perdent. No s'observa que cap moment sigui significativament millor per a fer el canvi, però en casos particulars pot ser rellevant. El análisis basado en datos del fútbol es un campo en auge, y los clubes dedican cada vez más recursos a obtener una ventaja competitiva mediante técnicas basadas en datos. Las sustituciones son la principal herramienta de la que dispone un entrenador para intervenir en el transcurso del juego, y su limitación y relevancia han despertado el interés por su estudio. En esta tesis buscamos un enfoque analítico para la identificación y predicción de sustituciones óptimas.
Con el reciente cambio en la legislación futbolística, ahora se permiten a cada equipo hasta cinco sustituciones por partido. Comparamos el nuevo paradigma con el anterior y buscamos las sustituciones óptimas con el uso de modelos basados en datos. Con clasificadores de aprendizaje automático y un modelo de probabilidad de victoria en directo sensible a las sustituciones, se han evaluado los cambios de jugadores. Los mismos modelos se han utilizado para simular sustituciones de distinto tipo y en momentos alternativos, con el fin de realizar planteamientos basados en datos que aumenten las probabilidades de éxito.
La adición de cambios adicionales ha provocado un aumento de las intervenciones tácticas de los entrenadores, pero la dinámica del partido se mantiene igual. Los modelos de aprendizaje automático obtienen buenos resultados en la predicción de la valoración de las sustituciones. El modelo de probabilidad de victoria es sensible a las sustituciones, que suelen tener un mejor efecto para el equipo que las realiza. Las sustituciones ofensivas suelen aumentar las probabilidades de victoria, especialmente para los equipos que van perdiendo. No se observa que ningún momento sea significativamente mejor para hacer el cambio, pero en casos particulares puede ser relevante. Data-driven football analytics is a rising field, and clubs are spending more and more resources on gaining a competitive edge through data-driven techniques. Substitutions are the main tool a coach has to intervene in the course of the game, and their limitation and relevance have attracted interest to their study. In this thesis, we seek a data-informed approach to identifying and predicting optimal substitutions.
With the recent change in football legislation, now each team is permitted up to five substitutions per match. We compare the new paradigm with the prior one and look for optimal substitutions with the use of data-based models. With machine learning classifiers and a substitution sensible in-game win probability model, player changes have been assessed. The same models have been used for simulating alternative types of substitution and timing, in order to make data-driven approaches that increase the chances of success.
The addition of extra substitutions has resulted in an increase in tactical interventions by coaches, but the match dynamics have remained the same. Machine learning models obtain good results in the prediction of substitution assessment. The win probability model is sensible to substitutions, which have generally a better effect on the substituting team. Offensive substitutions generally increase the winning probabilities, especially for losing teams. No timing is observed to be significantly better for doing substitutions, but in particular cases can be very relevant.
DegreeGRAU EN ENGINYERIA FÍSICA/GRAU EN MATEMÀTIQUES
Files | Description | Size | Format | View |
---|---|---|---|---|
TFG Joan Hernanz.pdf | 1,376Mb | View/Open |