Tal y como os comentaba la semana pasada en este artículo, 40 años de U2 dan para mucho. Dan para 16 discos (+ 2 recopilatorios), 25 giras (incluyendo presentaciones de discos), 81 países visitados, 215 canciones, 328 ciudades visitadas, 1.603 conciertos y para 36.251 canciones interpretadas. Entre otras cosas. Sin curiosidad, sin unas cuantas habilidades adquiridas y sin ayuda, se quedaría en eso, en fríos números. En el artículo de la semana pasada, condensé esta información en forma de 13 datos que probablemente muchos de vosotros desconocíais.
Profundizando en los setlist de los 1.603 conciertos, me ha valido de las reglas de asociación para ofreceros algún dato curioso más. Siguiendo con los números, las 36.251 canciones que U2 ha interpretado a lo largo de los 1.603 conciertos, dan para 54.066 reglas.
¿Qué son las reglas de asociación? Para los que estéis menos versados en minería de datos y aprendizaje automático (machine learning), las reglas de asociación se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos, patrones de repetición. Aplicado a los conciertos de U2, busco conjuntos de canciones (parejas, tríos, etc.) que se repitan juntas en muchos conciertos.
Nuestras reglas de asociación U2-eras van a tener este aspecto:
Para evaluar la bondad de una regla se utilizan 4 parámetros:
- support: el respaldo que tiene la regla. El número de conciertos en los que aparecen los elementos de la izquierda (lhs) y los de la derecha (rhs) entre el total de conciertos.
- confidence: el número de conciertos en los que aparecen los elementos de la izquierda (lhs) y los de la derecha (rhs) entre el total de conciertos en los que aparecen los elementos del lado izquierdo (lhs).
- expected confidence: confianza esperable. El número de conciertos en los que aparecen los elementos de la derecha (rhs) entre el total de conciertos.
- lift: estadístico que compara la frecuencia observada de una regla con la frecuencia esperada simplemente por azar (si la regla no existe realmente). Cuanto más se aleje el valor de lift de 1, más evidencias de que la regla no se debe a un artefacto aleatorio, es decir, mayor la evidencia de que la regla representa un patrón real. Se calcula dividiendo la confianza entre la confianza esperable.
Dato #1: Pride (In The Name of Love) y Where The Streets Have No Name han sido interpretadas juntas (no necesariamente seguidas) en el 51% de los conciertos de U2. Regla #1.
Dato #2: Pride (In The Name of Love) ha sido interpretada en el 91% de los conciertos de U2 en los que se ha interpretado Where The Streets Have No Name. Regla #1.
Dato #3: Pride (In The Name of Love), Where The Streets Have No Name y With or Without You han sido interpretadas juntas (no necesariamente seguidas) en el 46% de los conciertos de U2. Regla #2.
Dat
[/caption]Dato #4: Where The Streets Have No Name ha sido interpretada en el 98% de los conciertos de U2 en los que se han interpretado Pride (In The Name of Love) y With or Without You. Regla #2.
Dato #5: Bullet The Blue Sky, Pride (In The Name of Love) y Where The Streets Have No Name han sido interpretadas juntas (no necesariamente seguidas) en el 46% de los conciertos de U2. Regla #3.
Dato #6:<
[/caption]Dato #6: Where The Streets Have No Name ha sido interpretada en el 98% de los conciertos de U2 en los que se han interpretado Bullet the Blue Sky y Pride (In The Name of Love). Regla #3.
Dato #7: Zoo Station y One han sido interpretadas juntas (no necesariamente seguidas) en el 14% de los conciertos de U2. Regla #4.
Dato #8:
[/caption]Dato #8: One ha sido interpretada en el 100% de los conciertos de U2 en los que se ha interpretado Zoo Station. Regla #4. ¿Ocurre lo mismo en sentido contrario? No necesariamente.
Dato #9: Bullet The Blue Sky, Even Better Than The Real Thing, One y Where The Streets Have No Name han sido interpretadas juntas (no necesariamente seguidas) en el 19% de los conciertos de U2. Regla #5.
Dato #10:
[/caption]Dato #10: Where The Streets Have No Name ha sido interpretada en el 100% de los conciertos de U2 en los que se han interpretado Bullet The Blue Sky, Even Better Than The Real Thing y One. Regla #5.
Hemos analizado una muestra muy pequeña (5) de las 54.066 reglas de asociación que he obtenido. En realidad, el número de reglas es mucho mayor pero las he limitado para que el estudio sea manejable y para quedarme con las más representativas. ¿Cómo lo he hecho? Limitando valores mínimos de los parámetros support y confidence:
- Support mínimo de 0.1.
- Confidence mínima de 0.4.
Para terminar, una pequeña reflexión sobre el Dato #1. Las dos canciones con más interpretaciones de U2 (Pride y Where The Streets Have No Name) han sido tocadas juntas en el 51% de los conciertos. ¿Mucho o poco?
Pride (In The Name of Love) pertenece a The Unforgettable Fire (1984) y Where The Streets Have No Name a The Joshua Tree (1987). Por lo tanto, estas dos canciones no podían haber sido tocados antes del 9 de marzo de 1987. Esto es, de los 1.603 conciertos totales, solo en 1.219 de ellos existían ambas canciones. Esto nos deja un saldo “real” de 811 / 1.219 = 66,5%. Dos pesos pesados por separado y juntas.
Si tenéis predilección (o curiosidad) por algún set de canciones, me escribís y sacamos las reglas.
¡Hasta pronto!
Nota: todos los datos de este y del pasado artículo están actualizados a 3 de julio de 2018. Al final de la segunda manga de la gira eXPERIENCE + iNNOCENCE Tour actualizaré el análisis.
#u2 #u2tours #music #livemusic #data #datascience #rstudio #tableau #associationrules #arules #reglasdeasociacion #bigdata #prideinthenameoflove #one #wherethestreetshavenoname #bulletthebluesky #zoostation #evenbetterthantherealthing
2 Comments
Pingback:
Pingback: