Me he acercado (una vez más)a la página Web del Eustat para recoger datos sobre el tejido empresarial en Gipuzkoa y en Donostia – San Sebastián. Son datos de 2020 que os resumo en una serie de indicadores Empresas En Gipuzkoa tenemos 57.571 empresas. Teniendo en cuenta que somos 713.00 Gipuzkoanos, esto nos sale a 8 empresas por cada 100…
-
-
Las ricas de entre las ricas; cada vez más ricas
Si la semana pasada hablábamos de las personas en riesgo de pobreza y/o de exclusión social (ERPES o AROPES), hoy vamos a hablar de empresas ricas. De las empresas más ricas del mundo, de hecho. Recuerdo cuando estudiaba en la Universidad, allá por finales de los 90 y comienzos de los 2000, y en las asignaturas relacionadas con la economía…
-
dplyr() – nuevos verbos
La familia dplyr() no para de crecer. Allá por junio os explicaba el nuevo miembro de la familia, across() que nos permite aplicar una o varias funciones a más de una columna de forma simultánea. Hoy os voy a hablar de dos nuevos verbos que se vienen a hacernos un poco más fácil la tarea de manipular datos en R:…
-
Impacto de la COVID-19 en el Retail
Estudio para valorar el impacto de la COVID-19 en el mundo del Retail. Ficha del estudio Título: Mundo del retail y crisis de la COVID-19 Objetivo: Analizar el impacto de la COVID-19 en el mundo del retail a través del interés mostrado por los usuarios de Google. Metodología: Análisis de datos procedentes de Google Trends. Fecha: Julio de 2020 Datos:…
-
Alterar filas en R con “estilo”
A estas alturas no os sorprenderá que sea un fan del paquete dplyr de R. Hoy os voy a presentar otra de las novedades de la familia, incluida en la recientemente publicada versión 1.0.0. Se trata de una serie de funciones para alterar filas y está inspirada en UPDATE, INSERT, UPSERT y DELETE de SQL. Como las funciones “join”, estas…
-
Renombrar columnas “con estilo” en R
Hoy os traigo otra perlita de dplyr para los que os gusta (o no os queda más remedio) que manipular datos. Si la semana pasada os mostraba cómo mejorar vuestra productividad con la función across(), hoy os voy a mostrar cómo ordenar columnas en un data frame sin necesidad de aprenderos los índices y/o realizar anotaciones adicionales en un cuaderno.…
-
Aumenta tu productividad en R con across()
Cuando trabajamos con datos, es frecuente que realizemos la misma operación sobre varias columnas de un mismo data frame. Copiar y pegar ahorra tiempo pero puede ser fuente de errores (descuidos). Hoy os presento una de las nuevas funcionalidades de uno de mis paquetes favoritos (dplyr). Dplyr pertenece a la colección de paquetes tidyverse, de uso obligado en esto de…
-
2 de febrero, día de la Real
Hace unos meses os presentaba un calendario histórico de la Real Sociedad de Fútbol en forma de espiral. Una visualización de Tableau que resumía los resultados obtenidos en partidos oficiales desde 1926 hasta 2020. Tiene este aspecto: Estos días he aprovechado para obtener otra visualización son los mismos datos. En este caso he agrupado los datos por día del año…
-
Trabajando por filas en R
La sencillez y la versatilidad del paquete dplyr me han cautivado desde que descubrí esto de la ciencia de datos. Encadenar operaciones mediante el operador pipeline (%>%) permite crear un código secuencial, ordenado y fácil de interpretar. Además, nos permite no tener que repetir en nombre del dataframe o del tibble sobre el que queremos aplicar la operación. dplyr pertenece…
-
¿Tablas bonitas en R? Sí, es posible
Cuando trabajas con R para explorar, analizar, transformar e incluso visualizar datos, tarde o temprano tendrás la necesidad de recoger tus frutos en un informe, artículo, post, etc. Si el resultado que quieres plasmar viene en forma de tabla, los dataframes o los tibbles de R no son demasiado agraciados a nivel estético. Este miércoles descubrí el paquete gt, disponible…