datacy - data driven decisions


Social Data Text Mining
¿De qué se habló en Gipuzkoa en 2024?
Datos extraídos de los titulares de Noticias de Gipuzkoa en 2024
Actualizado en octubre de 2024
Elaborado por datacy.

0. Introducción

Para el presente estudio me he basado en los titulares de las portadas diarias de el diario Noticias de Gipuzkoa.

He agrupado los titulares por meses para ver la evolución de los temas más tratados a lo largo del año.

He utilizado técnicas de minería de datos para recoger la información, extraer las palabras más repetidas y visualizarlas en forma de nube de palabras.

1. Metodología de trabajo

De manera muy resumida, este es el proceso seguido para obtener el resultado final (la nube de palabras de cada mes):

  • Lectura automatizada de los tirulares de la portada de cada día.

  • Agrupación de los titulares por mes.

  • Extracción de las palabras contenidas en cada titular –> creación del corpus.

  • Eliminación de palabras vacías del corpus (artículos, preposiciones, etc.). También se han eliminado las palabras “Donostia” “Gipuzkoa”, “Euskadi”, “Gobierno” y “Vasco” ya que, tratándose de El Diario Vasco, se sobreentiende el contexto geográfico.

  • Agrupación y resumen de frecuencias por cada término.

  • Creación de la nube de palabras (visualización).

2. Resultados año 2024

2.1. Enero

En los 528 titulares analizados, he contabilizado 3736 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de enero:
Terms value Peso (%)
ley 21 0.56
gaza 17 0.46
amnistía 17 0.46
detenido 17 0.46
sánchez 16 0.43
psoe 14 0.37
hamás 14 0.37
israel 13 0.35
trump 13 0.35
pnv 12 0.32

2.2. Febrero

En los 488 titulares analizados, he contabilizado 3301 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de febrero:
Terms value Peso (%)
detenido 17 0.51
prisión 14 0.42
valencia 14 0.42
gaza 12 0.36
incendio 12 0.36
ley 11 0.33
tolosa 11 0.33
trump 11 0.33
urkullu 11 0.33
agresión 11 0.33

2.3. Marzo

En los 526 titulares analizados, he contabilizado 3542 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de marzo:
Terms value Peso (%)
pnv 14 0.40
caso 12 0.34
muertos 11 0.31
ley 10 0.28
koldo 10 0.28
irun 10 0.28
pradales 10 0.28
ataque 10 0.28
amnistía 9 0.25
rusia 9 0.25

2.4. Abril

En los 508 titulares analizados, he contabilizado 3328 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de abril:
Terms value Peso (%)
sánchez 28 0.84
pnv 21 0.63
israel 16 0.48
pradales 13 0.39
eta 10 0.30
gaza 10 0.30
irán 8 0.24
ataque 8 0.24
accidente 8 0.24
aprueba 8 0.24

2.5. Mayo

2.6. Junio

En los 502 titulares analizados, he contabilizado 3443 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de junio:
Terms value Peso (%)
pnv 21 0.61
elecciones 17 0.49
pradales 15 0.44
sánchez 13 0.38
ultraderecha 13 0.38
gaza 12 0.35
eta 12 0.35
heridos 12 0.35
biden 11 0.32
europa 11 0.32

2.7. Julio

En los 514 titulares analizados, he contabilizado 3521 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de julio:
Terms value Peso (%)
biden 22 0.62
sánchez 17 0.48
menores 15 0.43
trump 14 0.40
israel 14 0.40
detenido 12 0.34
juez 12 0.34
pradales 10 0.28
caso 10 0.28
presidente 10 0.28

2.8. Agosto

En los 525 titulares analizados, he contabilizado 3485 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de agosto:
Terms value Peso (%)
detenido 29 0.83
puigdemont 27 0.77
sánchez 18 0.52
illa 18 0.52
trump 15 0.43
venezuela 14 0.40
caso 14 0.40
semana 14 0.40
gonzález 13 0.37
joven 13 0.37

2.9. Septiembre

En los 495 titulares analizados, he contabilizado 3402 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de septiembre:
Terms value Peso (%)
sánchez 24 0.71
detenido 19 0.56
muertos 18 0.53
trump 16 0.47
venezuela 14 0.41
muerte 12 0.35
líbano 12 0.35
israel 11 0.32
heridos 10 0.29
madrid 10 0.29

2.10. Octubre

En los 518 titulares analizados, he contabilizado 3635 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de octubre:
Terms value Peso (%)
israel 23 0.63
pnv 20 0.55
muertos 16 0.44
sánchez 16 0.44
errejón 15 0.41
líbano 13 0.36
gaza 13 0.36
muere 13 0.36
madrid 11 0.30
muerte 10 0.28

2.11. Noviembre

En los 508 titulares analizados, he contabilizado 3614 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de noviembre:
Terms value Peso (%)
dana 72 1.99
valencia 32 0.89
trump 32 0.89
mazón 22 0.61
víctimas 20 0.55
sánchez 18 0.50
israel 16 0.44
detenido 14 0.39
detenidos 13 0.36
pnv 13 0.36

2.12. Diciembre

En los 521 titulares analizados, he contabilizado 3654 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de diciembre:
Terms value Peso (%)
navidad 21 0.57
trump 17 0.47
lotería 14 0.38
dana 12 0.33
sánchez 12 0.33
siria 11 0.30
detenido 11 0.30
israel 10 0.27
muere 10 0.27
psoe 9 0.25

2.13. Resumen del año

En los 6.186 titulares analizados, he contabilizado 42.601 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el año 2024:
Terms value Peso (%)
sánchez 202 0.47
detenido 165 0.39
pnv 159 0.37
trump 154 0.36
israel 143 0.34
gaza 117 0.27
eta 108 0.25
muertos 108 0.25
muere 105 0.25
pradales 97 0.23