Social Data Text Mining
¿De qué se habló en Gipuzkoa en 2024?
Datos extraídos de los titulares de Noticias de Gipuzkoa en
2024
Actualizado en octubre de 2024
Elaborado por datacy.
Para el presente estudio me he basado en los titulares de las portadas diarias de el diario Noticias de Gipuzkoa.
He agrupado los titulares por meses para ver la evolución de los temas más tratados a lo largo del año.
He utilizado técnicas de minería de datos para recoger la información, extraer las palabras más repetidas y visualizarlas en forma de nube de palabras.
De manera muy resumida, este es el proceso seguido para obtener el resultado final (la nube de palabras de cada mes):
Lectura automatizada de los tirulares de la portada de cada día.
Agrupación de los titulares por mes.
Extracción de las palabras contenidas en cada titular –> creación del corpus.
Eliminación de palabras vacías del corpus (artículos, preposiciones, etc.). También se han eliminado las palabras “Donostia” “Gipuzkoa”, “Euskadi”, “Gobierno” y “Vasco” ya que, tratándose de El Diario Vasco, se sobreentiende el contexto geográfico.
Agrupación y resumen de frecuencias por cada término.
Creación de la nube de palabras (visualización).
En los 528 titulares analizados, he contabilizado 3744 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de enero:Terms | value | Peso (%) |
---|---|---|
ley | 21 | 0.56 |
gaza | 17 | 0.45 |
amnistía | 17 | 0.45 |
detenido | 17 | 0.45 |
sánchez | 16 | 0.43 |
psoe | 14 | 0.37 |
hamás | 14 | 0.37 |
israel | 13 | 0.35 |
trump | 13 | 0.35 |
pnv | 12 | 0.32 |
En los 488 titulares analizados, he contabilizado 3302 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de febrero:Terms | value | Peso (%) |
---|---|---|
detenido | 17 | 0.51 |
prisión | 14 | 0.42 |
valencia | 14 | 0.42 |
gaza | 12 | 0.36 |
incendio | 12 | 0.36 |
ley | 11 | 0.33 |
tolosa | 11 | 0.33 |
trump | 11 | 0.33 |
urkullu | 11 | 0.33 |
agresión | 11 | 0.33 |
En los 526 titulares analizados, he contabilizado 3545 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de marzo:Terms | value | Peso (%) |
---|---|---|
pnv | 14 | 0.39 |
caso | 12 | 0.34 |
muertos | 11 | 0.31 |
ley | 10 | 0.28 |
koldo | 10 | 0.28 |
irun | 10 | 0.28 |
pradales | 10 | 0.28 |
ataque | 10 | 0.28 |
amnistía | 9 | 0.25 |
rusia | 9 | 0.25 |
En los 508 titulares analizados, he contabilizado 3331 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de abril:Terms | value | Peso (%) |
---|---|---|
sánchez | 28 | 0.84 |
pnv | 21 | 0.63 |
israel | 16 | 0.48 |
pradales | 13 | 0.39 |
eta | 10 | 0.30 |
gaza | 10 | 0.30 |
irán | 8 | 0.24 |
ataque | 8 | 0.24 |
accidente | 8 | 0.24 |
aprueba | 8 | 0.24 |
En los 502 titulares analizados, he contabilizado 3448 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de junio:Terms | value | Peso (%) |
---|---|---|
pnv | 21 | 0.61 |
elecciones | 17 | 0.49 |
pradales | 15 | 0.44 |
sánchez | 13 | 0.38 |
ultraderecha | 13 | 0.38 |
gaza | 12 | 0.35 |
eta | 12 | 0.35 |
heridos | 12 | 0.35 |
biden | 11 | 0.32 |
europa | 11 | 0.32 |
En los 514 titulares analizados, he contabilizado 3527 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de julio:Terms | value | Peso (%) |
---|---|---|
biden | 22 | 0.62 |
sánchez | 17 | 0.48 |
menores | 15 | 0.43 |
trump | 14 | 0.40 |
israel | 14 | 0.40 |
detenido | 12 | 0.34 |
juez | 12 | 0.34 |
pradales | 10 | 0.28 |
caso | 10 | 0.28 |
presidente | 10 | 0.28 |
En los 525 titulares analizados, he contabilizado 3492 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de agosto:Terms | value | Peso (%) |
---|---|---|
detenido | 29 | 0.83 |
puigdemont | 27 | 0.77 |
sánchez | 18 | 0.52 |
illa | 18 | 0.52 |
trump | 15 | 0.43 |
venezuela | 14 | 0.40 |
caso | 14 | 0.40 |
semana | 14 | 0.40 |
gonzález | 13 | 0.37 |
joven | 13 | 0.37 |
En los 495 titulares analizados, he contabilizado 3404 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de septiembre:Terms | value | Peso (%) |
---|---|---|
sánchez | 24 | 0.71 |
detenido | 19 | 0.56 |
muertos | 18 | 0.53 |
trump | 16 | 0.47 |
venezuela | 14 | 0.41 |
muerte | 12 | 0.35 |
líbano | 12 | 0.35 |
israel | 11 | 0.32 |
heridos | 10 | 0.29 |
madrid | 10 | 0.29 |
En los 518 titulares analizados, he contabilizado 3640 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de octubre:Terms | value | Peso (%) |
---|---|---|
israel | 23 | 0.63 |
pnv | 20 | 0.55 |
muertos | 16 | 0.44 |
sánchez | 16 | 0.44 |
errejón | 15 | 0.41 |
líbano | 13 | 0.36 |
gaza | 13 | 0.36 |
muere | 13 | 0.36 |
madrid | 11 | 0.30 |
muerte | 10 | 0.27 |
En los 508 titulares analizados, he contabilizado 3621 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el mes de noviembre:Terms | value | Peso (%) |
---|---|---|
dana | 72 | 1.99 |
valencia | 32 | 0.88 |
trump | 32 | 0.88 |
mazón | 22 | 0.61 |
víctimas | 20 | 0.55 |
sánchez | 18 | 0.50 |
israel | 16 | 0.44 |
detenido | 14 | 0.39 |
detenidos | 13 | 0.36 |
pnv | 13 | 0.36 |
En los 5.661 titulares analizados, he contabilizado 38.959 palabras (una vez excluídas las palabras vacías).
Estas son las palabras más utilizadas en el año 2024:Terms | value | Peso (%) |
---|---|---|
sánchez | 190 | 0.49 |
detenido | 154 | 0.40 |
pnv | 150 | 0.39 |
trump | 136 | 0.35 |
israel | 133 | 0.34 |
gaza | 109 | 0.28 |
eta | 103 | 0.26 |
muertos | 101 | 0.26 |
muere | 95 | 0.24 |
pradales | 88 | 0.23 |