• Curiosidades,  Datascience (R),  destacadas,  Social

    Visualizando el «baby boom»

    La semana pasada me topé con una visualización sobre los nacimientos ocurridos en Estados Unidos a lo largo de unos cuantos años. Mostraba tanto los nacimientos absolutos (el número de nacimientos) como un indicador relativo: el número de nacimientos dividido por el número de nacimientos esperables. La dimensión temporal abarcaba venía marcada por el binomio día-mes. Esto es, la dimensión…

  • Curiosidades,  Datascience (R)

    dplyr 1.0.0

    El pasado mes de junio tenemos disponible la versión 1.0.0 del paquete dplyr. Uno de mis paquetes favoritos para transformación, limpieza y procesos de calidad del dato en R. Dplyr pertenece a la selecta colección de paquetes tidyverse. Confieso que soy muy fan de todo este universo. Si ya habéis actualizado a la versión 1.0.0 de #dplyr, es posible que…

  • Datascience (R)

    Pon color a tu código

    La fortaleza de la sencillez. Ayer me topé, por accidente, con una funcionalidad de RStudio que desconocía. Se trata de una función que estará disponible en la próxima versión pero que ya puede ser probada a través de las RStudio daily builds. Pequeños detalles que te pueden hacer «la vida» un poco más fácil. La vida del programador, entiéndase. Te…

  • Datascience (R),  destacadas,  Negocio

    Alterar filas en R con «estilo»

    A estas alturas no os sorprenderá que sea un fan del paquete dplyr de R. Hoy os voy a presentar otra de las novedades de la familia, incluida en la recientemente publicada versión 1.0.0. Se trata de una serie de funciones para alterar filas y está inspirada en UPDATE, INSERT, UPSERT y DELETE de SQL. Como las funciones «join», estas…

  • Datascience (R),  destacadas,  Negocio

    Renombrar columnas «con estilo» en R

    Hoy os traigo otra perlita de dplyr para los que os gusta (o no os queda más remedio) que manipular datos. Si la semana pasada os mostraba cómo mejorar vuestra productividad con la función across(), hoy os voy a mostrar cómo ordenar columnas en un data frame sin necesidad de aprenderos los índices y/o realizar anotaciones adicionales en un cuaderno.…

  • Curiosidades,  Datascience (R),  destacadas,  Negocio

    Aumenta tu productividad en R con across()

    Cuando trabajamos con datos, es frecuente que realizemos la misma operación sobre varias columnas de un mismo data frame. Copiar y pegar ahorra tiempo pero puede ser fuente de errores (descuidos). Hoy os presento una de las nuevas funcionalidades de uno de mis paquetes favoritos (dplyr). Dplyr pertenece a la colección de paquetes tidyverse, de uso obligado en esto de…

  • Curiosidades,  Datascience (R),  destacadas,  Negocio

    Trabajando por filas en R

    La sencillez y la versatilidad del paquete dplyr me han cautivado desde que descubrí esto de la ciencia de datos. Encadenar operaciones mediante el operador pipeline (%>%) permite crear un código secuencial, ordenado y fácil de interpretar. Además, nos permite no tener que repetir en nombre del dataframe o del tibble sobre el que queremos aplicar la operación. dplyr pertenece…

  • Datascience (R),  destacadas,  Negocio

    ¿Tablas bonitas en R? Sí, es posible

    Cuando trabajas con R para explorar, analizar, transformar e incluso visualizar datos, tarde o temprano tendrás la necesidad de recoger tus frutos en un informe, artículo, post, etc. Si el resultado que quieres plasmar viene en forma de tabla, los dataframes o los tibbles de R no son demasiado agraciados a nivel estético. Este miércoles descubrí el paquete gt, disponible…