• Curiosidades,  Datascience (R),  destacadas,  Negocio

    dplyr() – nuevos verbos

    La familia dplyr() no para de crecer. Allá por junio os explicaba el nuevo miembro de la familia, across() que nos permite aplicar una o varias funciones a más de una columna de forma simultánea. Hoy os voy a hablar de dos nuevos verbos que se vienen a hacernos un poco más fácil la tarea de manipular datos en R:…

  • Curiosidades,  Datascience (R),  destacadas,  Social

    Los jueves son los nuevos martes (energía)

    Vamos con un poco de #energía para acabar el miércoles. 1️⃣ Durante la parte más dura del confinamiento, nuestra relación con la energía cambió de forma cuantitativa (-21% con respecto a 2019) y cualitativa (era difícil distinguir un sábado de un martes). 2️⃣ Poco a poco hemos ido recuperando el consumo en relación a 2019: Desde el desconfinamiento estamos en un 4,5%…

  • Curiosidades,  Datascience (R),  destacadas,  Social

    Los hijos del babyBoom

    Hace un par de semanas os presentaba una visualización en forma de espiral y otra en forma de calendario sobre el babyboom en España. Me hice con los datos en el portal del INE y, gracias a la granularidad diaria, opté por una visualización en forma de espiral: necesitaba visualizar 35.770 observaciones (una para cada día del año a lo largo…

  • Curiosidades,  destacadas,  Social

    2011 fue el año en la que cambiamos el tabaco por la cerveza

    El tabaco y la cerveza han seguido trayectorias antagónicas desde 2003 hasta 2019. He descargado los datos relativos a los Impuestos Especiales de la Agencia Tributaria y os ofrezco unos cuántos insights sobre nuestros hábitos de consumo. Tabaco En el siguiente gráfico he confrontado el consumo de tabaco (millones de cajetillas) con el precio del mismo (€/cajetilla). El consumo ha…

  • Curiosidades,  Datascience (R),  destacadas,  Social

    Visualizando el “baby boom”

    La semana pasada me topé con una visualización sobre los nacimientos ocurridos en Estados Unidos a lo largo de unos cuantos años. Mostraba tanto los nacimientos absolutos (el número de nacimientos) como un indicador relativo: el número de nacimientos dividido por el número de nacimientos esperables. La dimensión temporal abarcaba venía marcada por el binomio día-mes. Esto es, la dimensión…

  • Curiosidades,  Datascience (R)

    dplyr 1.0.0

    El pasado mes de junio tenemos disponible la versión 1.0.0 del paquete dplyr. Uno de mis paquetes favoritos para transformación, limpieza y procesos de calidad del dato en R. Dplyr pertenece a la selecta colección de paquetes tidyverse. Confieso que soy muy fan de todo este universo. Si ya habéis actualizado a la versión 1.0.0 de #dplyr, es posible que…