Análisis Bayesiano de las encuestas de las elecciones catalanas del 27S

Predicción de escaños a partir de varias encuestas

Virgilio Gómez Rubio

Departamento de Matemáticas

Universidad de Castilla-La Mancha

Campus de Albacete

Introducción

Después de hacer una análisis combinando varias encuestas para modelizar el procentaje de votos que obtendría cada partido en las elecciones catalanas del 27S, nos centraremos ahora en la predicción de escaños. Para ellos usaremos datos de varias encuentas para las que existen resultados a niven provincial, que es la circunscripción electoral. A la hora de combinar las encuestas usaremos un modelo jerárquico Bayesiano basado, que se describe más abajo.

Métodos

Hemos encontrado referencias a 4 encuestas publicadas en medios de comunicación que recogen la intención de voto a nivel provincial. Queremos combinar estas encuestas para obtener una estimación más precisa de los porcentajes de voto a nivel provincial y, a partir de aquí, obtener una estimación de los escaños obtenidos por cada partido en cada provincia y de ahí sacar el número de escaños totales.

En concreto, las encuestas que hemos considerado en este análisis se han obtenido de diversas webs y se han resumido en una tabla. Los datos son:

Empresa Provincia Dato N Error CUP JpSi CatSi Unio PSC Cs PP OTROSBL
DYM Barcelona Escaños 533 2.9 4.50 35.00 10.00 0.00 7.00 17.50 10.00 0.00
  Gerona Escaños 209 2.9 2.00 10.50 1.00 0.00 1.50 0.00 2.00 0.00
  Lérida Escaños 211 2.9 1.00 11.00 0.00 0.00 0.00 1.00 2.00 0.00
  Tarragona Escaños 204 2.9 2.00 7.50 1.00 0.00 2.00 3.50 2.00 0.00
CIS Barcelona Votos 1201 2.9 6.00 35.10 16.00 1.50 13.10 15.20 9.20 3.90
  Gerona Votos 597 4.1 5.30 52.00 6.90 1.00 10.00 11.50 9.90 3.50
  Lérida Votos 605 4.1 7.00 53.50 5.30 1.50 9.00 9.90 8.00 5.80
  Tarragona Votos 596 4.1 4.60 39.20 10.20 1.70 9.30 17.80 11.50 5.60
Feedback Barcelona Escaños NA NA NA NA NA NA NA NA NA NA
  Gerona Escaños NA NA NA NA NA NA NA NA NA NA
  Lérida Escaños NA NA NA NA NA NA NA NA NA NA
  Tarragona Escaños NA NA NA NA NA NA NA NA NA NA
GESOP Barcelona Votos 383 NA 9.14 46.21 10.70 1.57 8.88 15.40 4.70 3.39
  Gerona Votos 48 NA 12.50 60.42 2.08 2.08 4.17 10.42 2.08 6.25
  Lérida Votos 28 NA 3.57 75.00 3.57 0.00 0.00 14.29 0.00 3.57
  Tarragona Votos 56 NA 7.14 57.14 7.14 1.79 7.14 14.29 5.36 0.00

Algunas de las encuestas muestran ya directamente los escaños estimados para cada partido, con lo que no las hemos incorporado en nuestro modelo.

Usaremos un modelo jerárquico Bayesiano multinomial-Dirichlet para combinar todos los resultados y obtener estimaciones más precisas de las proporciones de voto en cada provincia.

Hemos usado el paquete rjags para ajustar el modelo Bayesiano usando este código:

 model {
   for(i in 1:n.encuestas) {
     for(j in 1:n.provincias) {
     votos[i, j, 1:n.partidos] ~ dmulti(p[j, 1:n.partidos], n[i, j])
     }
     
   }
 
   for(j in 1:n.provincias) {
     p[j, 1:n.partidos] ~ ddirch(alpha[1:n.partidos])
   }
 }

A la hora de ajustar el modelo usando simulación MCMC hemos usado 5000 iteraciones de calentamiento y otras 10000 para obtener las estimaciones de los parámetros. A la hora de generar estas simulaciones, nos hemos quedado con 1 de cada 10 simulaciones para disminuir la autocorrelación. Además, con cada una de estas 10000 simulaciones hemos estimado el número de escaños que correspondería a cada partido para obtener una simulación de los escaños por provincias y totales.

Resultados

Una vez que hemos ajsutado el modelo, podemos estimar el número de escaños por provincia usando las medias a posteriori de los porcentajes de voto por provincias y partidos:

  Barcelona Gerona Lérida Tarragona
CatSi 13 1 1 2
Cs 14 2 1 3
CUP 6 1 1 1
JpSi 34 10 10 9
OTROSBL 0 0 0 0
PP 7 1 1 2
PSC 11 2 1 1
Unio 0 0 0 0

Los escaños totales por partidos serían:

  escanyos
CatSi 17
Cs 20
CUP 9
JpSi 63
OTROSBL 0
PP 11
PSC 15
Unio 0

Para dar una medida de la variabilidad de esta estimación, hemos usado los resultados de las simulaciones para estimar el número de escaños totales que cada partido obtendría. Para ello hemos usado los porcentajes estimados en cada iteración y calculado los escaños. Posteriormente, hemos calculado una serie de estadísticos resumen con los escaños obtenidos por cada partido.

Aquí vemos los estadísticos resumen:

  CUP JpSi CatSi Unio PSC Cs PP
Min. 5.0000 58.0000 12.0000 0 11.0000 16.0000 9.0000
1st Qu. 8.0000 63.0000 16.0000 0 14.0000 20.0000 11.0000
Median 8.0000 64.0000 16.0000 0 15.0000 20.0000 11.0000
Mean 8.2545 63.6836 16.4667 0 14.7819 20.4298 11.3835
3rd Qu. 9.0000 65.0000 17.0000 0 15.0000 21.0000 12.0000
Max. 11.0000 69.0000 21.0000 0 19.0000 25.0000 15.0000

Y aquí tenemos un intervalo de credibilidad al 95% para el número de escaños por partido:

  CUP JpSi CatSi Unio PSC Cs PP
2.5% 7 61 14 0 13 18 10
97.5% 10 67 19 0 17 23 13

El modelo Bayesiano nos combina los datos de las distintas encuestas de manera que se obtiene una estimación de las proporciones de voto mucho más fiable. La siguiente figura muestra las distribuciones marginales a posteriori de los escaños obtenidos por cada partido:

plot of chunk unnamed-chunk-12

Por último, vamos a mostrar en una gráfica el número de escaños que obtendrían los partidos independentistas, junto con el límite de 68 escaños que marca la mayoría absoluta:

plot of chunk unnamed-chunk-13

La gráfica indica que los partidos nacionalistas obtendrían una mayoría absoluta con una gran probabilidad.

Conclusiones

Hemos visto cómo los modelos jerárquicos Bayesianos nos permiten combinar datos de diferentes encuestas para poder realizar una estimación del número de escaños que obtendría cada partido en las elecciones catalanas de 27 de septiembre de 2015. Los resultados muestran que los partidos nacionalistas obtendrían una mayoría absoluta en número de escaños con una probabilidad del 99.78%.

Apéndice: Software y datos utilizados