Curiosidades,  destacadas,  Música,  Negocio,  U2

Time is irrelevant, it’s not linear…

Llevaba tiempo buscando la forma de visualizar de manera compacta una secuencia temporal muy larga. Ni el formato horizontal (colocar la escala temporal en las columnas) ni el formato vertical (colocar la escala temporal en las columnas) me convencían por dos motivos:

  • Imposibilidad de visualizar todo el rango de un vistazo.
  • Necesidad de scrolls (derivada de la primera).

En concreto, necesitaba visualizar 35 años con una granularidad de días. ¿Para qué? Para visualizar cómo se han ido encadenando las 1.007 interpretaciones en directo de la canción «Pride (in the Name of Love)» por parte de U2.

Tenía los datos procesados de anteriores visualizaciones pero no daba con la tecla. Hasta que hace unas semanas ví una visualización que me fascinó. Vaya, fue verlo y pensar «esto es lo que necesito».

Me descargué el libro de trabajo y comencé a investigar cómo estaba construído. Resultó ser bastante sencillo (si no os asustan los campos calculados :)) La ventaja de Tableau es que puedes copiar las hojas de trabajo y los dashboards a tu propio libro y se crearán los campos calculados correspondientes.

No es necesario que entiendas cómo se construye la vista (aunque sí es muy recomendable para poder adaptarlo a tu caso).

De hecho, cada visualización requiere que los datos estén en un formato determinado y esto es, generalmente, lo que más tiempo lleva. En este caso, se trata de una visualización en espiral en la que el tiempo avanza a medida que la espiral se va haciendo grande. Luego:

  • El orden de mis datos importa y, de alguna forma, tengo que decirle a Tableau el orden de mis puntos. Una nueva variable para mi dataframe.

Además, la espiral se compone de polígonos con 4 vértices por lo que:

  • Para cada elemento de mi visualización (cada día del año), necesito 4 puntos. 4 filas que solo diferirán en un parámetro.

En mi caso, la visualización toma más sentido cuando se visualizan no solo los 1.007 días en los que se ha interpretado el tema sino cuando se visualizan también todos los días en los que no se ha interpretado, para poder inferir patrones. De esta forma,

  • Tuve que construir un dataframe auxiliar con todos los días entre la primera y la última interpretación y cruzarlo con el original.

Todo el procesado lo he realizado, como siempre en RStudio. El dataframe original de 1.007 filas por 15 columnas se ha acabado convirtiendo en un dataframe de 49.988 filas por 20 columnas.

Las etapas preparación de datos / visualización son 100% iterativas con continuas idas y venidas entre RStudio y Tableau.

El resultado final es una visualización interactiva en forma de espiral donde las marcas corresponden a los días en los que se ha interpretado «Pride» en directo.

Si estáis interesados en los detalles más técnicos, no dudéis en escribirme en el blog o a través de datacy.es

datacy – data driven decisions

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *