Este domingo (2 de diciembre de 2018), tendrán lugar las Elecciones al Parlamento de Andalucía. Ya han tenido lugar los dos y únicos debates televisivos entre los cuatro principales candidatos a presidir Andalucía y creo que es un buen momento para analizar las palabras contenidas en los programas políticos de los partidos a los que representan estas personas.
Estos son los candidatos y el partido al que representan (por orden alfabético de partido):
- Juan Marín – Ciudadanos.
- Teresa Rodríguez – Podemos
- Juanma Moreno – PP.
- Susana Díaz – PSOE.
He descargado los programas en formato pdf y he trabajado sobre ellos. Los cuatro partidos coinciden en que “Andalucía” es la palabra más usada, con estos resultados:
He eliminado la palabra “Andalucía” y todas sus derivaciones del resto del estudio porque, al ser la más repetida en los 4 partidos, no aporta valor diferencial y porque, debido al alto valor relativo de las apariciones, resta protagonismo al resto de términos. Este es el resultado por partido.
Ciudadanos
Podemos
PP
PSOE
Los 4 partidos incluyen a la palabra “personas“ entre las 3 más utilizadas (con las cribas que hemos mencionado).
Los partidos tradicionalmente llamados “de izquierdas” (Podemos y PSOE), incluyen la palabra “servicios” en el top3.
Los partidos tradicionalmente llamados “de derechas” (Ciudadanos y PP), incluyen la palabra “empleo” en el top3.
El PSOE es el único que incluye en el top20 los términos “igualdad” y “mujeres“.
Esta es la fotografía general de los 4 programas:
Las palabras son sólo eso, palabras y dice el refranero que se las lleva el viento. En este caso, son palabras escritas en programas electorales, que deberían ser contratos para con los ciudadanos.
#data #datamining #mineriadedatos #elecciones #politica #rstudio #tableau #datascience #datacy #datadrivendecisions #ciudadanos #cs #podemos #pp #psoe #eleccionesandalucia2018
3 Comments
Gabriel
Interesantísimo, Iulen. El lenguaje nos señala.
Juan José Gibaja Martíns
Estaría genial realizar un Análisis Factorial de Correspondencias (por ejemplo con el paquete FactoMineR de R) sobre la tabla de contingencia cuyas filas sean los cuatro partidos políticos y cuyas columnas sean las palabras que has seleccionado. Proporcionaría una representación visual muy interesante de este conjunto de datos.
Pingback: