A estas alturas no os sorprenderá que sea un fan del paquete dplyr de R. Hoy os voy a presentar otra de las novedades de la familia, incluida en la recientemente publicada versión 1.0.0. Se trata de una serie de funciones para alterar filas y está inspirada en UPDATE, INSERT, UPSERT y DELETE de SQL. Como las funciones “join”, estas…
-
-
Renombrar columnas “con estilo” en R
Hoy os traigo otra perlita de dplyr para los que os gusta (o no os queda más remedio) que manipular datos. Si la semana pasada os mostraba cómo mejorar vuestra productividad con la función across(), hoy os voy a mostrar cómo ordenar columnas en un data frame sin necesidad de aprenderos los índices y/o realizar anotaciones adicionales en un cuaderno.…
-
Aumenta tu productividad en R con across()
Cuando trabajamos con datos, es frecuente que realizemos la misma operación sobre varias columnas de un mismo data frame. Copiar y pegar ahorra tiempo pero puede ser fuente de errores (descuidos). Hoy os presento una de las nuevas funcionalidades de uno de mis paquetes favoritos (dplyr). Dplyr pertenece a la colección de paquetes tidyverse, de uso obligado en esto de…
-
2 de febrero, día de la Real
Hace unos meses os presentaba un calendario histórico de la Real Sociedad de Fútbol en forma de espiral. Una visualización de Tableau que resumía los resultados obtenidos en partidos oficiales desde 1926 hasta 2020. Tiene este aspecto: Estos días he aprovechado para obtener otra visualización son los mismos datos. En este caso he agrupado los datos por día del año…
-
¿Hay vida (digital) después de la muerte?
Mi primer recuerdo de un cantante famoso muerto es el de Kurt Cobain. Me pilló con 15 años y todavía no me interesaba demasiado la música. Sí que le interesaba a Juan, uno de mis compañero de autobús. Además, era fan de Nirvana. Recuerdo que el día de la muerte y los días posteriores, muchos compañeros del colegio hablaban de…
-
Los otros “héroes” del confinamiento
El COVID-19 y las medidas adoptadas para frenar contra su expansión han provocado cambios en nuestros hábitos. En nuestros hábitos de consumo, en la forma en la que nos relacionamos, en la forma en la que aprendemos/enseñamos, en el foco de nuestras conversaciones,… y en lo que buscamos en Internet. Supongo que todos estáis al tanto del desabastecimiento del papel…
-
Trabajando por filas en R
La sencillez y la versatilidad del paquete dplyr me han cautivado desde que descubrí esto de la ciencia de datos. Encadenar operaciones mediante el operador pipeline (%>%) permite crear un código secuencial, ordenado y fácil de interpretar. Además, nos permite no tener que repetir en nombre del dataframe o del tibble sobre el que queremos aplicar la operación. dplyr pertenece…
-
¿Tablas bonitas en R? Sí, es posible
Cuando trabajas con R para explorar, analizar, transformar e incluso visualizar datos, tarde o temprano tendrás la necesidad de recoger tus frutos en un informe, artículo, post, etc. Si el resultado que quieres plasmar viene en forma de tabla, los dataframes o los tibbles de R no son demasiado agraciados a nivel estético. Este miércoles descubrí el paquete gt, disponible…
-
LaLiga cara a cara
El confinamiento nos va a dejar mucho tiempo para estudiar, leer, recuperar viejos proyectos para los que nunca sacamos tiempo, estar con los más peques de la casa, etc. También nos va a dejar una buena temporada sin LaLiga. Y, ojo, que igual hasta no se acaba el mundo por que no haya partido los viernes, los sábados ni los…
-
LaLiga, una competición igualada
(Fútbol – Ligas europeas) A las puertas de una nueva jornada de LaLiga, y con 21 jornadas ya disputadas, os propongo que confrontemos (con datos) a las 5 ligas más importantes de Europa: LaLiga – España. Premier League – Inglaterra. Ligue 1 – Francia. Seria A – Italia. Bundesliga – Alemania. Más allá de lo que dicen sus respectivas clasificaciones,…