Deportes,  Futbol,  La liga

(Fútbol – LaLiga) Jornada 20 desde Twitter

(Fútbol – LaLiga)
El pasado mes de junio comencé mis capturas de tweets con los partidos de la FIFA World Cup. Podéis buscar algunos artículos tanto en mi blog como en mi cuenta de LinkedIn. Los números del mundial me parecieron muy elevados pero no tenía un contexto con el que compararlos. Lo hice con el Tour y con la Vuelta, con números muy inferiores y con el europeo de Atletismo, con el mismo resultado.
Desde entonces, tenía curiosidad por medir la actividad en Twitter durante un partido de LaLiga. El viernes me lié la manta a la cabeza y decidí capturar una jornada completa. Una de esas jornadas maratonianas de LaLiga que empezó el viernes a las 21:00 y acabó el lunes al filo de las 23:00.
La captura la hice desde el viernes 18 de enero de 2019 a las 20:01:51 hasta el lunes 21 de enero de 2019 a las 23:59:59 (273.600 segundos). Capturé un total de 10.510 tweets. Para que os hagáis una idea de los datos del pasado mundial:

El promedio de tweets por minuto más bajo fue de 1.205 y el más alto de 2.201 (la final). En cuanto al promedio de tweets por segundo, el valor más bajo fue de 20 y el más alto de 37 (en la fina).
¿Qué tenemos en la jornada 20 de LaLiga?

El marco de tiempo es demasiado amplio para poder observar detalles, más allá del pico de 39 tweets por minuto del sábado a las 18:09, coincidiendo con el final del Sevilla – Real Madrid.
Si representamos los tweets día a día con intervalos de horas, este es el resultado:

El domingo es el día con más actividad (y el día con más partidos – 5). Es donde se produce el mayor pico de tweets por hora (728), entre las 11 y las 12 de la noche, con la resaca del Barça – Leganés y el polémico gol de Suárez. Por si, al igual que yo, os lo estáis preguntando, os confirmo que los hashtags sobre el VAR no tienen mucho tirón: apenas 20 entre todos ellos (sin contar el de Morata :)).

El lunes, el pico de tweets por hora se produce entre las 6 y las 7 de la tarde, 2 horas antes del único partido disputado ese día.
Para comparar los datos con los del mundial, deberíamos ceñirnos a las horas propias de los partidos, esto es, 18 horas. Aún dividiendo todos los tweets capturados (10.150 – algunos de los cuales fueron recogidos fuera de estas horas) entre 18 horas, el promedio es de 564 tweets por hora, notablemente inferior a los datos del Mundial de Russia.
En cuanto a goles, se metieron 32 goles, por lo que el precio queda en 317 tweets por gol.
Hashtags
Los hashtags más usados nos permiten hacernos una idea de los partidos más comentados en Twitter:

Prescindiendo del hashtag sobre el que se hizo la captura (#LaLigaSantander), este es el interés que suscitó cada partido:

El partido que más dio de hablar fue el #RealMadridSevilla, seguido del #BarçaLeganes. A pesar de estar a 10 puntos del líder (el Barça), el partido entre el Madrid y el Sevilla (empatados a 33 puntos al comienzo de la jornada), era más atractivo a priori que el Barça – Leganés (separados por 21 puntos al comienzo de la jornada).
Ciudades
En cuanto a las ciudades / regiones más activas, este es el ranking:

Gracias al paquete Wordcloud2 de R, podemos hacer nubes de palabras tan bonitas como estas con los hashtags de los tweets.

Esto ha sido todo lo que ha dado de sí mi experimento de la jornada 20.
¡Hasta pronto!
#futbol #primeradivision #laliga #ligasantander #soccer #football #footballanalytics #bigdata #datascience #rstudio #tableau #datascientist #insights #españa #datacy #datadrivendecisions #victorialocal #victoriavisitante #empate #visualizations #jornada20 #twitter @twitterstream #wordcloud #wordcloud2

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *