Cuando trabajamos con datos, es frecuente que realizemos la misma operación sobre varias columnas de un mismo data frame. Copiar y pegar ahorra tiempo pero puede ser fuente de errores (descuidos). Hoy os presento una de las nuevas funcionalidades de uno de mis paquetes favoritos (dplyr). Dplyr pertenece a la colección de paquetes tidyverse, de uso obligado en esto de…
-
-
Nuestro modelo de consumo (energético) ha cambiado
Mucho hemos hablado de “la curva” desde principios de marzo. Qué si la curva sube, qué si la curva se aplana, ¿cuándo se aplanará? ¿será una recuperación en forma de “V” o en forma de “L”? Hay otra curva de la que no he oído hablar tanto: la curva de la energía. Os he ido informando los lunes sobre la…
-
El efecto lunes (datos COVID-19)
Desde que la COVID-19 entró en nuestras vidas, he realizado un seguimiento diario de la evolución de la pandemia tanto en Gipuzkoa como en Euskadi. He analizado los datos y he realizado previsiones a corto plazo. Con bastante acierto, por cierto. Podéis ver los resultados en https://datacy.es/covid/. El efecto lunes Si habéis seguido los datos a diario (ha sido difícil…
-
El nuevo vocabulario del Congreso
Primero fue el coronavirus, luego el COVID-19, más adelante la COVID-19 y por último la pandemia. Desde mediados de marzo estos 4 términos (junto con unos pocos más) forman parte de nuestras vidas. Han llegado y lo han puesto todo patas arriba. El Congreso de los Diputados no ha sido menos. Desde que se decretara el estado de alarma, se…
-
2 de febrero, día de la Real
Hace unos meses os presentaba un calendario histórico de la Real Sociedad de Fútbol en forma de espiral. Una visualización de Tableau que resumía los resultados obtenidos en partidos oficiales desde 1926 hasta 2020. Tiene este aspecto: Estos días he aprovechado para obtener otra visualización son los mismos datos. En este caso he agrupado los datos por día del año…
-
Los otros “héroes” del confinamiento
El COVID-19 y las medidas adoptadas para frenar contra su expansión han provocado cambios en nuestros hábitos. En nuestros hábitos de consumo, en la forma en la que nos relacionamos, en la forma en la que aprendemos/enseñamos, en el foco de nuestras conversaciones,… y en lo que buscamos en Internet. Supongo que todos estáis al tanto del desabastecimiento del papel…
-
Trabajando por filas en R
La sencillez y la versatilidad del paquete dplyr me han cautivado desde que descubrí esto de la ciencia de datos. Encadenar operaciones mediante el operador pipeline (%>%) permite crear un código secuencial, ordenado y fácil de interpretar. Además, nos permite no tener que repetir en nombre del dataframe o del tibble sobre el que queremos aplicar la operación. dplyr pertenece…
-
Mañana llegaremos a los 140 muertos COVID-19 en Euskadi
He intentado hacer un modelo explicativo de por qué en Alemania (e incluso en USA), con datos de positivos confirmados por COVID-19 no demasiado inferiores a España, tienen tan “pocos” muertos. Siempre teniendo en cuenta que 1 muerto son muchos muertos. He buscado variables demográficas (densidad de población), variables macroeconómicas (PIB per capita, personas en nivel de pobreza, etc.), variables sanitarias (número de camas hospitalarias, número de camas…
-
LaLiga cara a cara
El confinamiento nos va a dejar mucho tiempo para estudiar, leer, recuperar viejos proyectos para los que nunca sacamos tiempo, estar con los más peques de la casa, etc. También nos va a dejar una buena temporada sin LaLiga. Y, ojo, que igual hasta no se acaba el mundo por que no haya partido los viernes, los sábados ni los…
-
LaLiga, una competición igualada
(Fútbol – Ligas europeas) A las puertas de una nueva jornada de LaLiga, y con 21 jornadas ya disputadas, os propongo que confrontemos (con datos) a las 5 ligas más importantes de Europa: LaLiga – España. Premier League – Inglaterra. Ligue 1 – Francia. Seria A – Italia. Bundesliga – Alemania. Más allá de lo que dicen sus respectivas clasificaciones,…