datacy - data driven decisions


Social Data Text Mining
¿De qué se habló en Gipuzkoa en 2024?
Datos extraídos de los titulares de Noticias de Gipuzkoa en 2024
Actualizado en octubre de 2024
Elaborado por datacy.

0. Introducción

Para el presente estudio me he basado en los titulares de las portadas diarias de el diario Noticias de Gipuzkoa.

He agrupado los titulares por meses para ver la evolución de los temas más tratados a lo largo del año.

He utilizado técnicas de minería de datos para recoger la información, extraer las palabras más repetidas y visualizarlas en forma de nube de palabras.

1. Metodología de trabajo

De manera muy resumida, este es el proceso seguido para obtener el resultado final (la nube de palabras de cada mes):

  • Lectura automatizada de los tirulares de la portada de cada día.

  • Agrupación de los titulares por mes.

  • Extracción de las palabras contenidas en cada titular –> creación del corpus.

  • Eliminación de palabras vacías del corpus (artículos, preposiciones, etc.). También se han eliminado las palabras “Donostia” “Gipuzkoa”, “Euskadi”, “Gobierno” y “Vasco” ya que, tratándose de El Diario Vasco, se sobreentiende el contexto geográfico.

  • Agrupación y resumen de frecuencias por cada término.

  • Creación de la nube de palabras (visualización).

2. Resultados año 2024

2.1. Enero

En los 528 titulares analizados, he contabilizado 3744 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de enero:
Terms value Peso (%)
ley 21 0.56
gaza 17 0.45
amnistía 17 0.45
detenido 17 0.45
sánchez 16 0.43
psoe 14 0.37
hamás 14 0.37
israel 13 0.35
trump 13 0.35
pnv 12 0.32

2.2. Febrero

En los 488 titulares analizados, he contabilizado 3302 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de febrero:
Terms value Peso (%)
detenido 17 0.51
prisión 14 0.42
valencia 14 0.42
gaza 12 0.36
incendio 12 0.36
ley 11 0.33
tolosa 11 0.33
trump 11 0.33
urkullu 11 0.33
agresión 11 0.33

2.3. Marzo

En los 526 titulares analizados, he contabilizado 3545 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de marzo:
Terms value Peso (%)
pnv 14 0.39
caso 12 0.34
muertos 11 0.31
ley 10 0.28
koldo 10 0.28
irun 10 0.28
pradales 10 0.28
ataque 10 0.28
amnistía 9 0.25
rusia 9 0.25

2.4. Abril

En los 508 titulares analizados, he contabilizado 3331 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de abril:
Terms value Peso (%)
sánchez 28 0.84
pnv 21 0.63
israel 16 0.48
pradales 13 0.39
eta 10 0.30
gaza 10 0.30
irán 8 0.24
ataque 8 0.24
accidente 8 0.24
aprueba 8 0.24

2.5. Mayo

2.6. Junio

En los 502 titulares analizados, he contabilizado 3448 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de junio:
Terms value Peso (%)
pnv 21 0.61
elecciones 17 0.49
pradales 15 0.44
sánchez 13 0.38
ultraderecha 13 0.38
gaza 12 0.35
eta 12 0.35
heridos 12 0.35
biden 11 0.32
europa 11 0.32

2.7. Julio

En los 514 titulares analizados, he contabilizado 3527 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de julio:
Terms value Peso (%)
biden 22 0.62
sánchez 17 0.48
menores 15 0.43
trump 14 0.40
israel 14 0.40
detenido 12 0.34
juez 12 0.34
pradales 10 0.28
caso 10 0.28
presidente 10 0.28

2.8. Agosto

En los 525 titulares analizados, he contabilizado 3492 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de agosto:
Terms value Peso (%)
detenido 29 0.83
puigdemont 27 0.77
sánchez 18 0.52
illa 18 0.52
trump 15 0.43
venezuela 14 0.40
caso 14 0.40
semana 14 0.40
gonzález 13 0.37
joven 13 0.37

2.9. Septiembre

En los 495 titulares analizados, he contabilizado 3404 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de septiembre:
Terms value Peso (%)
sánchez 24 0.71
detenido 19 0.56
muertos 18 0.53
trump 16 0.47
venezuela 14 0.41
muerte 12 0.35
líbano 12 0.35
israel 11 0.32
heridos 10 0.29
madrid 10 0.29

2.10. Octubre

En los 518 titulares analizados, he contabilizado 3640 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el mes de octubre:
Terms value Peso (%)
israel 23 0.63
pnv 20 0.55
muertos 16 0.44
sánchez 16 0.44
errejón 15 0.41
líbano 13 0.36
gaza 13 0.36
muere 13 0.36
madrid 11 0.30
muerte 10 0.27

2.13. Resumen del año

En los 5.152 titulares analizados, he contabilizado 35.325 palabras (una vez excluídas las palabras vacías).

Estas son las palabras más utilizadas en el año 2023:
Terms value Peso (%)
sánchez 172 0.49
detenido 140 0.40
pnv 137 0.39
israel 117 0.33
trump 104 0.29
gaza 102 0.29
eta 98 0.28
muertos 92 0.26
muere 89 0.25
muerte 81 0.23