Análisis Bayesiano de las encuestas de las elecciones catalanas del 27S

Virgilio Gómez Rubio

Departamento de Matemáticas

Universidad de Castilla-La Mancha

Campus de Albacete

Introducción

El próximo 27 de septiembre se celebran en Cataluña elecciones al parlamento regional. Dada la expectación que han levantado, numerosos medios han publicado encuestas sobre el resultado de las elecciones. Incluimos aquí un análisis de algunas de ellas para combinarlas y determinar con mayor precisión el porcentaje de votos totales que obtendrá cada partido.

Actualización: Se han añadido los porcentajes de voto reales obtenidos en las elecciones.

Métodos

Cada encuesta contiene los porcentajes de votos que recibirá cada partido, así como el número de personas encuestadas. Usaremos un modelo jerárquico Bayesiano multinomial-Dirichlet para combinar todos los resultados y obtener estimaciones más precisas de las proporciones de voto.

En concreto, las encuestas que hemos considerado en este análisis se han obtenido de Electograph y se han resumido en una tabla. Los datos son:

Empresa FechaInicio FechaFin Cliente N Error Metodo CUP JpSi CatSi Unio PSC Cs PP OTROSBL
Técnicas Demoscópicas 21/09/15 21/09/15 8TV 1200 2.80 Teléfono 7.0 41.0 12.0 2.5 12.0 13.0 11.0 1.5
Invymark 14/09/15 14/09/15 La Sexta NA NA   6.3 43.4 12.6 1.8 10.6 14.3 8.9 2.1
MyWord 10/09/15 17/09/15 La Ser 1000 3.20 Online 8.1 40.1 12.6 1.5 11.7 15.4 8.8 1.8
NC Report (5) 11/09/15 19/09/15 La Razón 1255 2.82 Teléfono 6.2 38.0 12.4 3.7 12.1 15.3 9.9 2.4
SigmaDos 16/09/15 17/09/15 El Mundo 1400 2.67 Teléfono 7.3 40.5 11.2 2.8 10.8 14.8 9.6 3.0
Celeste-Tel 14/08/15 18/09/15 eldiario.es 1100 3.10 Teléfono 6.2 38.8 12.6 3.1 12.1 14.6 9.9 2.7
NC Report (4) 19/09/15 19/09/15 La Razón NA NA Teléfono 5.9 38.0 12.5 3.5 12.2 15.4 10.0 2.5
GAD3 14/09/15 18/09/15 ABC 800 3.50 Teléfono 6.4 40.7 10.3 1.9 11.9 14.1 10.2 4.5
Feedback 14/09/15 17/09/15 La Vanguardia 1000 3.16 Teléfono 6.4 40.7 11.1 4.2 10.1 14.4 10.6 2.5
Metroscopia 14/09/15 16/09/15 El País 1717 2.40 Teléfono 8.4 41.2 11.4 2.7 11.7 14.9 7.3 2.4

Hemos usado el paquete rjags para ajustar el modelo Bayesiano usando este código:

 model {
   for(i in 1:n.encuestas) {
     votos[i, 1:n.partidos] ~ dmulti(p[1:n.partidos], n[i])
   }
   p[1:n.partidos] ~ ddirch(alpha[1:n.partidos])
 
   indep <- sum(p[1:2])
   no.indep <- sum(p[3:7])
 
   diferencia <-  indep - no.indep
 
   otros <- p[8]
 
 }

Resultados

El modelo Bayesiano nos combina los datos de las distintas encuestas de manera que se obtiene una estimación de las proporciones de voto mucho más fiable. La siguiente figura muestra las distribuciones marginales a posteriori de las proporciones de voto según partido:

plot of chunk unnamed-chunk-5

También se podrían agrupar los porcentajes de votos en partidos independentistas (CUP y Junts pel Sí), no independentintas (el resto de partidos considerados) y otros/votos en blanco. Con esta agrupación, tendríamos:

plot of chunk unnamed-chunk-6

Por último, si consideramos la diferencia en el voto entre partidos independentinstas y no independentistas:

plot of chunk unnamed-chunk-7

De esta manera, parece que los votos recibidos por los partidos no independentistas superarían de manera clara a los de los independentistas, aunque esta diferencia es pequeña. De alrededor de un 3%.

Conclusiones

En este resumen hecho planteado un análisis de diversas encuestas electorales para las elecciones catalanas del 27S. Hemos utilizado un modelo jerárquico Bayesiano que permite combinar todos estos resultados de una manera adecuada y sencilla. Además, el uso de estas técnicas nos permite hacer inferencia sobre los porcentajes de voto y cantidades derivadas.

No hemos considerado el número de escaños que obtendría cada partido al no disponer de información a nivel provincial.

Apéndice: Software y datos utilizados

  • R, para el análisis de datos
  • Electograph, que recopila los datos de las encuestas utilizados