• Curiosidades,  Datascience (R)

    dplyr 1.0.0

    El pasado mes de junio tenemos disponible la versión 1.0.0 del paquete dplyr. Uno de mis paquetes favoritos para transformación, limpieza y procesos de calidad del dato en R. Dplyr pertenece a la selecta colección de paquetes tidyverse. Confieso que soy muy fan de todo este universo. Si ya habéis actualizado a la versión 1.0.0 de #dplyr, es posible que…

  • Datascience (R)

    Pon color a tu código

    La fortaleza de la sencillez. Ayer me topé, por accidente, con una funcionalidad de RStudio que desconocía. Se trata de una función que estará disponible en la próxima versión pero que ya puede ser probada a través de las RStudio daily builds. Pequeños detalles que te pueden hacer “la vida” un poco más fácil. La vida del programador, entiéndase. Te…

  • Curiosidades,  Deportes,  destacadas,  Futbol,  La liga

    14 datos de LaLiga que (probablemente) desconocías

    Se acabó la temporada 2019/2020 de LaLiga Santander. Una temporada diferente con partidos en el mes de julio. Una temporada diferente con dos partes claramente separadas por la COVID-19. 27 jornadas preCOVID y 11 jornadas postCOVID. Os dejo unas cuantas reflexiones en forma de datos sobre lo que han dado de sí los 380 partidos disputados. LaLiga en su conjunto…

  • Curiosidades,  Deportes,  Futbol,  La liga

    Reflexiones tras la jornada 32 (y parte de la 33) de LaLiga

    LaLiga está recuperando el terreno perdido a marchas forzadas, con partidos todos los días de la semana, semana tras semana. Podríamos decir que las condiciones de la competición han variado sustancialmente de la jornada 28 en adelante: mayor concentración de partidos y más cambios permitidos (de 3 a 5). Con estas premisas, a unos les está yendo mejor que a…

  • Datascience (R),  destacadas,  Negocio

    Alterar filas en R con “estilo”

    A estas alturas no os sorprenderá que sea un fan del paquete dplyr de R. Hoy os voy a presentar otra de las novedades de la familia, incluida en la recientemente publicada versión 1.0.0. Se trata de una serie de funciones para alterar filas y está inspirada en UPDATE, INSERT, UPSERT y DELETE de SQL. Como las funciones “join”, estas…

  • Datascience (R),  destacadas,  Negocio

    Renombrar columnas “con estilo” en R

    Hoy os traigo otra perlita de dplyr para los que os gusta (o no os queda más remedio) que manipular datos. Si la semana pasada os mostraba cómo mejorar vuestra productividad con la función across(), hoy os voy a mostrar cómo ordenar columnas en un data frame sin necesidad de aprenderos los índices y/o realizar anotaciones adicionales en un cuaderno.…

  • Curiosidades,  Datascience (R),  destacadas,  Negocio

    Aumenta tu productividad en R con across()

    Cuando trabajamos con datos, es frecuente que realizemos la misma operación sobre varias columnas de un mismo data frame. Copiar y pegar ahorra tiempo pero puede ser fuente de errores (descuidos). Hoy os presento una de las nuevas funcionalidades de uno de mis paquetes favoritos (dplyr). Dplyr pertenece a la colección de paquetes tidyverse, de uso obligado en esto de…

  • Curiosidades,  destacadas,  Social

    El efecto lunes (datos COVID-19)

    Desde que la COVID-19 entró en nuestras vidas, he realizado un seguimiento diario de la evolución de la pandemia tanto en Gipuzkoa como en Euskadi. He analizado los datos y he realizado previsiones a corto plazo. Con bastante acierto, por cierto. Podéis ver los resultados en https://datacy.es/covid/. El efecto lunes Si habéis seguido los datos a diario (ha sido difícil…

  • Curiosidades,  destacadas,  Social

    El nuevo vocabulario del Congreso

    Primero fue el coronavirus, luego el COVID-19, más adelante la COVID-19 y por último la pandemia. Desde mediados de marzo estos 4 términos (junto con unos pocos más) forman parte de nuestras vidas. Han llegado y lo han puesto todo patas arriba. El Congreso de los Diputados no ha sido menos. Desde que se decretara el estado de alarma, se…