Prediciendo Budapest'2023
Aplicando modelos de aprendizaje automático y simulaciones para la predicción de los medallistas en el XIX Campeonato Mundial de Atletismo.
Del 19 al 27 de agosto, Budapest no solo será la capital de Hungría sino que también será la capital mundial del atletismo. La principal ciudad magiar acogerá en esas fechas el XIX Campeonato Mundial de Atletismo. El Centro Nacional de Atletismo de Budapest será la sede de los 49 eventos convocados para esta edición: 24 pruebas femeninas, 24 pruebas masculinas y una mixta.
La familia del atletismo y los aficionados del deporte rey darán seguimiento en estos días a los deportistas de sus países, a sus atletas favoritos o a las pruebas que mayor interés les causen.
El poder conocer el conjunto de atletas que pueden encabezar cada una de las pruebas del campeonato es una herramienta de valor para todos interesados en el magno evento.
Con este fin, el dar seguimiento a los principales atletas en cada uno de los eventos del Campeonato Mundial, SYALIA {\small S.R.L.}, con la colaboración del Grupo de Inteligencia Artificial de la Facultad de Matemática y Computación de la Universidad de La Habana y de Postdata.club, ha desarrollado una guía mínima con la predicción de los resultados de todos los eventos de la cita.
Para ello se han utilizado todas las marcas y tiempos de todos los atletas y equipos que participarán en cita mundialista. Con estos datos, se desarrollaron los modelos de predicción basados en técnicas de Inteligencia Artificial y Ciencia de Datos que arrojaron los resultados que hoy presentamos en en esta guía.
Esperamos que este sea un complemento perfecto para disfrutar de un mejor modo el XIX Campeonato Mundial de Atletismo - Budapest'2023.
Metodología
Las predicciones se realizaron siguiendo un enfoque basado en simulaciones. Estas permiten obtener un resultado por cada uno de los eventos que se pronostica. En los eventos de relevos no se utilizó la metodología de simulaciones y solo se usó el criterio de experto a partir de resultados individuales de quienes conforman el relevo así como las actuaciones de los relevos en otras competiciones importantes (mundiales, olimpiadas y campeonatos de relevos).
Los datos relativos a cada uno de los atletas que participarán en el Campeonato Mundial fueron extraídos del sitio web de World Athletics. De allí se obtuvo la información de las marcas o tiempos de los atletas en las competencias reportadas desde el año 2021 hasta el 2023 (hasta el 10 de agosto). Se tuvieron en cuenta las competencias bajo techo para eventos en los que existe una relativa igualdad de condiciones (los eventos de saltos y la impulsión de la bala).
Posteriormente, se realizó un trabajo de preprocesamiento con el conjunto de resultados de cada atleta, en el cual se ponderan las marcas más recientes. Se eligió una ponderación lineal definida como [4,2,1], lo que significa que las marcas realizadas en el 2023 aparecerán cuatro veces, las del 2022 se repetirán dos veces en el conjunto y las de 2021 solo aparecerán una vez.
De esta forma, mientras menos marcas tiene un atleta mayor será el valor resultante de cada marca (para eventos donde se busca maximizar el valor de la marca se toma valor negativo). Consecuentemente, esto hace que los atletas con mayor cantidad de marcas tengan mejores resultados~(lo se puede interpretar como un factor de experiencia).
Para estimar las marcas que harán los atletas en cada evento se utiliza un modelo \textit{Kernel Distribution Estimation}~(KDE). Este modelo, que se determina uno diferente para cada atleta, permite estimar la función de densidad de probabilidad de las marcas o tiempos de cada atleta.
Posteriormente, se realizaron como mínimo 10000 simulaciones para cada uno de los eventos y se obtiene un pronóstico atendiendo a los valores que más se repiten. Es decir, para seleccionar el orden los participantes en la competencia, se calcula la moda de los lugares en los que quedó cada atleta. Es seleccionado el atleta que más se repite el primer lugar, luego el que más repite el segundo lugar sin ser el primero y así sucesivamente.