Hoy os traigo otra perlita de dplyr para los que os gusta (o no os queda más remedio) que manipular datos. Si la semana pasada os mostraba cómo mejorar vuestra productividad con la función across(), hoy os voy a mostrar cómo ordenar columnas en un data frame sin necesidad de aprenderos los índices y/o realizar anotaciones adicionales en un cuaderno.…
-
-
Aumenta tu productividad en R con across()
Cuando trabajamos con datos, es frecuente que realizemos la misma operación sobre varias columnas de un mismo data frame. Copiar y pegar ahorra tiempo pero puede ser fuente de errores (descuidos). Hoy os presento una de las nuevas funcionalidades de uno de mis paquetes favoritos (dplyr). Dplyr pertenece a la colección de paquetes tidyverse, de uso obligado en esto de…
-
2 de febrero, día de la Real
Hace unos meses os presentaba un calendario histórico de la Real Sociedad de Fútbol en forma de espiral. Una visualización de Tableau que resumía los resultados obtenidos en partidos oficiales desde 1926 hasta 2020. Tiene este aspecto: Estos días he aprovechado para obtener otra visualización son los mismos datos. En este caso he agrupado los datos por día del año…
-
¿Hay vida (digital) después de la muerte?
Mi primer recuerdo de un cantante famoso muerto es el de Kurt Cobain. Me pilló con 15 años y todavía no me interesaba demasiado la música. Sí que le interesaba a Juan, uno de mis compañero de autobús. Además, era fan de Nirvana. Recuerdo que el día de la muerte y los días posteriores, muchos compañeros del colegio hablaban de…
-
Los otros “héroes” del confinamiento
El COVID-19 y las medidas adoptadas para frenar contra su expansión han provocado cambios en nuestros hábitos. En nuestros hábitos de consumo, en la forma en la que nos relacionamos, en la forma en la que aprendemos/enseñamos, en el foco de nuestras conversaciones,… y en lo que buscamos en Internet. Supongo que todos estáis al tanto del desabastecimiento del papel…
-
Trabajando por filas en R
La sencillez y la versatilidad del paquete dplyr me han cautivado desde que descubrí esto de la ciencia de datos. Encadenar operaciones mediante el operador pipeline (%>%) permite crear un código secuencial, ordenado y fácil de interpretar. Además, nos permite no tener que repetir en nombre del dataframe o del tibble sobre el que queremos aplicar la operación. dplyr pertenece…
-
LaLiga cara a cara
El confinamiento nos va a dejar mucho tiempo para estudiar, leer, recuperar viejos proyectos para los que nunca sacamos tiempo, estar con los más peques de la casa, etc. También nos va a dejar una buena temporada sin LaLiga. Y, ojo, que igual hasta no se acaba el mundo por que no haya partido los viernes, los sábados ni los…
-
LaLiga, una competición igualada
(Fútbol – Ligas europeas) A las puertas de una nueva jornada de LaLiga, y con 21 jornadas ya disputadas, os propongo que confrontemos (con datos) a las 5 ligas más importantes de Europa: LaLiga – España. Premier League – Inglaterra. Ligue 1 – Francia. Seria A – Italia. Bundesliga – Alemania. Más allá de lo que dicen sus respectivas clasificaciones,…
-
(LaLiga) Visualizaciones. Bump charts.
En mi búsqueda constante de nuevas visualizaciones, hace unos días me topé con los bump charts. El bump chart es un tipo de gráfico muy útil para explorar los cambios en el rango de un valor en una dimensión de tiempo o dimensión de lugar o alguna otra dimensión relevante para el análisis. Enseguida me vino a la cabeza visualizar…
-
The Joshua Tree Tour 2019. Punto y final.
El domingo pasado se cerraba la quinta manga de la gira del 20 aniversario de The Joshua Tree, ese álbum que catapultó a U2 a la fama mundial llenando estadios a finales de los 80. La gira aniversario comenzó el 12 de mayo de 2017 en Vancouver (Canadá) y, con otro tour de por medio, finalizó el 15 de diciembre…