Deportes,  destacadas,  Otras carreras,  Running

Los mejores maratones de España 2018

El día 5 de enero, la página Web Maratones España publicaban varios rankings según los siguientes criterios: número de finishers, mejores marcas ganadoras, nº y porcentaje de corredores sub 3 horas y sub 4 horas, participación femenina y tiempo medio de finalización. Son el resultado de recopilar los resultados y clasificaciones de las maratones en ruta celebradas el pasado año 2018.
Juanjo Gibaja nos animaba a Gabriel y a mí vía Twitter a hacer un análisis de correspondencias, cuyo proceso y resultado paso a detallaros. De entre las variables recogidas, me quedo las siguientes:

  • Número de finishers.
  • Tiempo del ganador (en segundos).
  • Tiempo de la ganadora (en segundos).
  • Finishers por debajo de las 3 horas (% sobre el total de finishers).
  • Finishers por debajo de las 4 horas (% sobre el total de finishers).
  • Finishers femeninas (% sobre el total de finishers).

Estos son los datos con los que he elaborado el estudio:

He descartado el tiempo medio porque no dispongo del dato para 4 de las pruebas.
Este es el resultado gráfico:

Con tan sólo 2 dimensiones, capturamos la práctica totalidad de la variabilidad de nuestro set de datos.

¿Cómo contribuye cada columna – variable a la formación de cada dimensión?

La dimensión 1, que explica el 99,7% de la varianza de los datos, está influenciada por el número de finishers (88%), el tiempo de la ganadora (6,9%) y el tiempo del ganador (4,8%).
Gráficamente,
La dimensión 2 está influenciada por el tiempo del ganador (55%) y el tiempo de la ganadora (45%).
Gráficamente,

¿Cómo de bien ha sido representado cada maratón?
La bondad de la representación de las filas (maratones) se mide con el parámetro “cos2“, un parámetro que toma valores de 0 a 1.

 
 
 
 
 
 
 
 
 
Podemos hacer una representación gráfica donde el color vaya asociado a esta variable. San Sebastián es la prueba que sale peor parada con la elección de las dos dimensiones. Es la peor representada. Este es el resultado:

Gracias a STHDA por el magnífico artículo sobre la materia.
#data #bigdata #datascience #tableau #rstudio #running #carreraspopulares #run #train #insights #runningdata #atletismo #athletics #marathon #datascientist #datacy #maraton #racing #atletismo #athletics #sub #elclubdel9 #correrenpositivo #correrennegativo #negativesplit #positivesplit #maratonesdeespana #estadística #analisisdecorrespondencias #correspondenceanalysis

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *