Continúo con el análisis de los programas electorales de los partidos a los que pertenecen los cuatro principales candidatos a presidir Andalucía tras las elecciones del domingo (2 de diciembre de 2018).
Esta vez y, alentado y guiado por Juan José Gibaja Martíns, he realizado un Análisis Factorial de Correspondencias sobre la tabla de contingencia cuyas filas sean los cuatro partidos políticos y cuyas columnas sean las 21 palabras más utilizadas en los programas de los 4 partidos.
El análisis de correspondencias (correspondence analysis, CA) es una técnica de representación de datos multivariantes en dimensión reducida.
Cuando los objetos o individuos (partidos políticos en este caso) se describen mediante un conjunto de variables (palabras en nuestro caso), existen varios métodos para representar los datos en dimensión reducida, normalmente en dos o tres dimensiones. El análisis de correspondencias es uno de ellos.
Mi objetivo es representar las filas (partidos políticos) como puntos de un espacio cartesiano de 2 dimensiones y cuya distancia entre ellos se ajuste a la proximidad de sus perfiles. Dos partidos con perfiles muy similares deben representarse con puntos muy cercanos y al revés, dos objetos con perfiles muy distintos se representan con puntos muy distantes. Al mismo tiempo, también representamos las palabras (columnas de la tabla) como puntos del mismo espacio y la proximidad de los puntos que representan los partidos a un punto que representa una palabra indica la importancia relativa de esa palabra en el perfil del partido.
Estos son los candidatos y el partido al que representan (por orden alfabético de partido):
- Juan Marín – Ciudadanos.
- Teresa Rodríguez – Podemos
- Juanma Moreno – PP.
- Susana Díaz – PSOE.
Este es el resultado obtenido:
Interpretación
La dimensión horizontal (parte izquierda vs parte derecha) explica el 68,97% de la variabilidad total y opone los partidos de izquierdas (PSOE y Podemos – representados a la derecha) frente a los partidos de derechas (Ciudadanos y PP – representados a la izquierda).
La dimensión vertical (arriba-abajo) explica el 22,60% de la variabilidad total y opone al PSOE frente al resto de los demás partidos analizados (Podemos, PP y Ciudadanos).
Esta representación en dos dimensiones recoge algo más del 90% de la variabilidad total del conjunto de datos (es una excelente representación).
A modo anecdótico, el PSOE tiene 17 alusiones a la “transformación digital” y hay un total de 11 referencias a “big data” (PSOE – 5; PP – 4; Ciudadanos – 2).
Bueno, esto ha sido todo en cuanto a las elecciones autonómicas de Andalucía 2018.
¡Hasta pronto!
#data #datamining #mineriadedatos #elecciones #politica #rstudio #tableau #datascience #datacy #datadrivendecisions #ciudadanos #cs #podemos #pp #psoe #eleccionesandalucia2018 #politics #andalucia #juntadeandalucia #estadística #analisisdecorrespondencias #correspondenceanalysis
No Comments
Gabriel
No conocía esta técnica/herramienta… y me ha parecido muy interesante.
Pingback: