Hoy os traigo otra perlita de dplyr para los que os gusta (o no os queda más remedio) que manipular datos. Si la semana pasada os mostraba cómo mejorar vuestra productividad con la función across(), hoy os voy a mostrar cómo ordenar columnas en un data frame sin necesidad de aprenderos los índices y/o realizar anotaciones adicionales en un cuaderno.…
-
-
Aumenta tu productividad en R con across()
Cuando trabajamos con datos, es frecuente que realizemos la misma operación sobre varias columnas de un mismo data frame. Copiar y pegar ahorra tiempo pero puede ser fuente de errores (descuidos). Hoy os presento una de las nuevas funcionalidades de uno de mis paquetes favoritos (dplyr). Dplyr pertenece a la colección de paquetes tidyverse, de uso obligado en esto de…
-
Nuestro modelo de consumo (energético) ha cambiado
Mucho hemos hablado de “la curva” desde principios de marzo. Qué si la curva sube, qué si la curva se aplana, ¿cuándo se aplanará? ¿será una recuperación en forma de “V” o en forma de “L”? Hay otra curva de la que no he oído hablar tanto: la curva de la energía. Os he ido informando los lunes sobre la…
-
El efecto lunes (datos COVID-19)
Desde que la COVID-19 entró en nuestras vidas, he realizado un seguimiento diario de la evolución de la pandemia tanto en Gipuzkoa como en Euskadi. He analizado los datos y he realizado previsiones a corto plazo. Con bastante acierto, por cierto. Podéis ver los resultados en https://datacy.es/covid/. El efecto lunes Si habéis seguido los datos a diario (ha sido difícil…
-
El nuevo vocabulario del Congreso
Primero fue el coronavirus, luego el COVID-19, más adelante la COVID-19 y por último la pandemia. Desde mediados de marzo estos 4 términos (junto con unos pocos más) forman parte de nuestras vidas. Han llegado y lo han puesto todo patas arriba. El Congreso de los Diputados no ha sido menos. Desde que se decretara el estado de alarma, se…
-
2 de febrero, día de la Real
Hace unos meses os presentaba un calendario histórico de la Real Sociedad de Fútbol en forma de espiral. Una visualización de Tableau que resumía los resultados obtenidos en partidos oficiales desde 1926 hasta 2020. Tiene este aspecto: Estos días he aprovechado para obtener otra visualización son los mismos datos. En este caso he agrupado los datos por día del año…
-
Los otros “héroes” del confinamiento
El COVID-19 y las medidas adoptadas para frenar contra su expansión han provocado cambios en nuestros hábitos. En nuestros hábitos de consumo, en la forma en la que nos relacionamos, en la forma en la que aprendemos/enseñamos, en el foco de nuestras conversaciones,… y en lo que buscamos en Internet. Supongo que todos estáis al tanto del desabastecimiento del papel…
-
Trabajando por filas en R
La sencillez y la versatilidad del paquete dplyr me han cautivado desde que descubrí esto de la ciencia de datos. Encadenar operaciones mediante el operador pipeline (%>%) permite crear un código secuencial, ordenado y fácil de interpretar. Además, nos permite no tener que repetir en nombre del dataframe o del tibble sobre el que queremos aplicar la operación. dplyr pertenece…
-
LaLiga cara a cara
El confinamiento nos va a dejar mucho tiempo para estudiar, leer, recuperar viejos proyectos para los que nunca sacamos tiempo, estar con los más peques de la casa, etc. También nos va a dejar una buena temporada sin LaLiga. Y, ojo, que igual hasta no se acaba el mundo por que no haya partido los viernes, los sábados ni los…
-
LaLiga, una competición igualada
(Fútbol – Ligas europeas) A las puertas de una nueva jornada de LaLiga, y con 21 jornadas ya disputadas, os propongo que confrontemos (con datos) a las 5 ligas más importantes de Europa: LaLiga – España. Premier League – Inglaterra. Ligue 1 – Francia. Seria A – Italia. Bundesliga – Alemania. Más allá de lo que dicen sus respectivas clasificaciones,…