• Datascience (R),  destacadas,  Negocio

    Alterar filas en R con «estilo»

    A estas alturas no os sorprenderá que sea un fan del paquete dplyr de R. Hoy os voy a presentar otra de las novedades de la familia, incluida en la recientemente publicada versión 1.0.0. Se trata de una serie de funciones para alterar filas y está inspirada en UPDATE, INSERT, UPSERT y DELETE de SQL. Como las funciones «join», estas…

  • Datascience (R),  destacadas,  Negocio

    Renombrar columnas «con estilo» en R

    Hoy os traigo otra perlita de dplyr para los que os gusta (o no os queda más remedio) que manipular datos. Si la semana pasada os mostraba cómo mejorar vuestra productividad con la función across(), hoy os voy a mostrar cómo ordenar columnas en un data frame sin necesidad de aprenderos los índices y/o realizar anotaciones adicionales en un cuaderno.…

  • Curiosidades,  Datascience (R),  destacadas,  Negocio

    Aumenta tu productividad en R con across()

    Cuando trabajamos con datos, es frecuente que realizemos la misma operación sobre varias columnas de un mismo data frame. Copiar y pegar ahorra tiempo pero puede ser fuente de errores (descuidos). Hoy os presento una de las nuevas funcionalidades de uno de mis paquetes favoritos (dplyr). Dplyr pertenece a la colección de paquetes tidyverse, de uso obligado en esto de…

  • destacadas,  Futbol,  La liga,  Negocio

    2 de febrero, día de la Real

    Hace unos meses os presentaba un calendario histórico de la Real Sociedad de Fútbol en forma de espiral. Una visualización de Tableau que resumía los resultados obtenidos en partidos oficiales desde 1926 hasta 2020. Tiene este aspecto: Estos días he aprovechado para obtener otra visualización son los mismos datos. En este caso he agrupado los datos por día del año…

  • Curiosidades,  Datascience (R),  destacadas,  Negocio

    Trabajando por filas en R

    La sencillez y la versatilidad del paquete dplyr me han cautivado desde que descubrí esto de la ciencia de datos. Encadenar operaciones mediante el operador pipeline (%>%) permite crear un código secuencial, ordenado y fácil de interpretar. Además, nos permite no tener que repetir en nombre del dataframe o del tibble sobre el que queremos aplicar la operación. dplyr pertenece…

  • Datascience (R),  destacadas,  Negocio

    ¿Tablas bonitas en R? Sí, es posible

    Cuando trabajas con R para explorar, analizar, transformar e incluso visualizar datos, tarde o temprano tendrás la necesidad de recoger tus frutos en un informe, artículo, post, etc. Si el resultado que quieres plasmar viene en forma de tabla, los dataframes o los tibbles de R no son demasiado agraciados a nivel estético. Este miércoles descubrí el paquete gt, disponible…

  • Curiosidades,  destacadas,  Negocio,  Política,  Social

    Mañana llegaremos a los 140 muertos COVID-19 en Euskadi

    He intentado hacer un modelo explicativo de por qué en Alemania (e incluso en USA), con datos de positivos confirmados por COVID-19 no demasiado inferiores a España, tienen tan «pocos» muertos. Siempre teniendo en cuenta que 1 muerto son muchos muertos.  He buscado variables demográficas (densidad de población), variables macroeconómicas (PIB per capita, personas en nivel de pobreza, etc.), variables sanitarias (número de camas hospitalarias, número de camas…

  • Curiosidades,  Futbol,  La liga,  Negocio

    (LaLiga) Visualizaciones. Bump charts.

    En mi búsqueda constante de nuevas visualizaciones, hace unos días me topé con los bump charts. El bump chart es un tipo de gráfico muy útil para explorar los cambios en el rango de un valor en una dimensión de tiempo o dimensión de lugar o alguna otra dimensión relevante para el análisis. Enseguida me vino a la cabeza visualizar…

  • B/SS,  Deportes,  destacadas,  Negocio,  Running

    55 Behobia SS (2019) – en positivo

    El domingo pasado (el 10 de noviembre de 2019), como cada segundo domingo de noviembre, se disputó la carrera popular Behobia – San Sebastián. Se trata de una carrera popular de 20 kilómetros de distancia (no homologada) que discurre entre las localidades de Behobia y San Sebastián. En esa ocasión, se disputaba la edición 55 y se cumplía el centenario…

  • Curiosidades,  destacadas,  Negocio

    La importancia del contexto. Más allá de los datos

    Decisiones de negocio. Aunque mi día a día profesional esté fuertemente vinculado con los datos y con los números, nunca debemos dejar de lado el contexto de «negocio» en el que trabajamos. Sobre todo, al comienzo y al final de todo proceso de minería de datos. Al comienzo para comprender el negocio: plantear las preguntas que queremos responder y buscar…