Análisis de encuestas electorales en Cataluña
Análisis Bayesiano de las encuestas de las elecciones catalanas del 27S
Virgilio Gómez Rubio
Departamento de Matemáticas
Universidad de Castilla-La Mancha
Campus de Albacete
Introducción
El próximo 27 de septiembre se celebran en Cataluña elecciones al parlamento regional. Dada la expectación que han levantado, numerosos medios han publicado encuestas sobre el resultado de las elecciones. Incluimos aquí un análisis de algunas de ellas para combinarlas y determinar con mayor precisión el porcentaje de votos totales que obtendrá cada partido.
Actualización: Se han añadido los porcentajes de voto reales obtenidos en las elecciones.
Métodos
Cada encuesta contiene los porcentajes de votos que recibirá cada partido, así como el número de personas encuestadas. Usaremos un modelo jerárquico Bayesiano multinomial-Dirichlet para combinar todos los resultados y obtener estimaciones más precisas de las proporciones de voto.
En concreto, las encuestas que hemos considerado en este análisis se han obtenido de Electograph y se han resumido en una tabla. Los datos son:
Empresa | FechaInicio | FechaFin | Cliente | N | Error | Metodo | CUP | JpSi | CatSi | Unio | PSC | Cs | PP | OTROSBL |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Técnicas Demoscópicas | 21/09/15 | 21/09/15 | 8TV | 1200 | 2.80 | Teléfono | 7.0 | 41.0 | 12.0 | 2.5 | 12.0 | 13.0 | 11.0 | 1.5 |
Invymark | 14/09/15 | 14/09/15 | La Sexta | NA | NA | 6.3 | 43.4 | 12.6 | 1.8 | 10.6 | 14.3 | 8.9 | 2.1 | |
MyWord | 10/09/15 | 17/09/15 | La Ser | 1000 | 3.20 | Online | 8.1 | 40.1 | 12.6 | 1.5 | 11.7 | 15.4 | 8.8 | 1.8 |
NC Report (5) | 11/09/15 | 19/09/15 | La Razón | 1255 | 2.82 | Teléfono | 6.2 | 38.0 | 12.4 | 3.7 | 12.1 | 15.3 | 9.9 | 2.4 |
SigmaDos | 16/09/15 | 17/09/15 | El Mundo | 1400 | 2.67 | Teléfono | 7.3 | 40.5 | 11.2 | 2.8 | 10.8 | 14.8 | 9.6 | 3.0 |
Celeste-Tel | 14/08/15 | 18/09/15 | eldiario.es | 1100 | 3.10 | Teléfono | 6.2 | 38.8 | 12.6 | 3.1 | 12.1 | 14.6 | 9.9 | 2.7 |
NC Report (4) | 19/09/15 | 19/09/15 | La Razón | NA | NA | Teléfono | 5.9 | 38.0 | 12.5 | 3.5 | 12.2 | 15.4 | 10.0 | 2.5 |
GAD3 | 14/09/15 | 18/09/15 | ABC | 800 | 3.50 | Teléfono | 6.4 | 40.7 | 10.3 | 1.9 | 11.9 | 14.1 | 10.2 | 4.5 |
Feedback | 14/09/15 | 17/09/15 | La Vanguardia | 1000 | 3.16 | Teléfono | 6.4 | 40.7 | 11.1 | 4.2 | 10.1 | 14.4 | 10.6 | 2.5 |
Metroscopia | 14/09/15 | 16/09/15 | El País | 1717 | 2.40 | Teléfono | 8.4 | 41.2 | 11.4 | 2.7 | 11.7 | 14.9 | 7.3 | 2.4 |
Hemos usado el paquete rjags para ajustar el modelo Bayesiano usando este código:
model {
for(i in 1:n.encuestas) {
votos[i, 1:n.partidos] ~ dmulti(p[1:n.partidos], n[i])
}
p[1:n.partidos] ~ ddirch(alpha[1:n.partidos])
indep <- sum(p[1:2])
no.indep <- sum(p[3:7])
diferencia <- indep - no.indep
otros <- p[8]
}
Resultados
El modelo Bayesiano nos combina los datos de las distintas encuestas de manera que se obtiene una estimación de las proporciones de voto mucho más fiable. La siguiente figura muestra las distribuciones marginales a posteriori de las proporciones de voto según partido:
También se podrían agrupar los porcentajes de votos en partidos independentistas (CUP y Junts pel Sí), no independentintas (el resto de partidos considerados) y otros/votos en blanco. Con esta agrupación, tendríamos:
Por último, si consideramos la diferencia en el voto entre partidos independentinstas y no independentistas:
De esta manera, parece que los votos recibidos por los partidos no independentistas superarían de manera clara a los de los independentistas, aunque esta diferencia es pequeña. De alrededor de un 3%.
Conclusiones
En este resumen hecho planteado un análisis de diversas encuestas electorales para las elecciones catalanas del 27S. Hemos utilizado un modelo jerárquico Bayesiano que permite combinar todos estos resultados de una manera adecuada y sencilla. Además, el uso de estas técnicas nos permite hacer inferencia sobre los porcentajes de voto y cantidades derivadas.
No hemos considerado el número de escaños que obtendría cada partido al no disponer de información a nivel provincial.
Apéndice: Software y datos utilizados
- R, para el análisis de datos
- Electograph, que recopila los datos de las encuestas utilizados