Pronósticos electorales

Compartir:

El 3 de noviembre pasado, día de la elección presidencial en los Estados Unidos, Joe Biden tenía una probabilidad de triunfo superior al 90%. Esta expresión corresponde a un pronóstico, que es algo que hacemos todo el tiempo. Es más, muchos columnistas de opinión buscan construirse una reputación como tipos astutos recordando todas las veces que sus predicciones resultaron confirmadas. 

Como nadie realmente lleva la cuenta de sus predicciones erróneas, nos transmite la idea de que, si se lo propusiera, se sacaría el Melate mañana. Nuestro columnista de cabecera tiene incentivos para hacer pronósticos descabellados, que lo distingan del resto de la manada. Con suerte, su pronóstico se cumplirá y quedará como una inteligencia superior que vio lo que los demás no supieron ver. 

Si no se cumple su predicción, sus lectores seremos indulgentes, pues sabemos que es un ser humano, no una deidad que conoce el futuro.

Pero esta benevolencia que mostramos hacia los que usan sus columnas de opinión como una bola de cristal se esfuma en cuanto escuchamos expresiones como “La probabilidad del triunfo de Biden es de 93.1%”. Algo se despierta en nosotros, tal vez activado por la mención de decimales, que nos motiva a exigir de los modelos estadísticos una precisión milimétrica.

Nuestro columnista suele usar expresiones como “no tengo ninguna duda” o “no puede ser de otra forma”. Si lo juzgaramos en correspondencia con la certeza que muestra, no deberíamos perdonarle un solo error. En cambio, la estadística es una disciplina que estudia, cuantifica y modela la incertidumbre.

Para formarse una idea del resultado de una elección, uno puede recurrir a distintas fuentes: los compañeros de trabajo, los taxistas, el columnista, el pulpo Paul… Algunas personas recurren a las encuestas bajo la idea, correcta, de que los porcentajes tomados de una muestra aleatoria pueden ser generalizados a la población. 

A veces se nos olvida que un porcentaje como 52% en la muestra no significa 52% en la población. Toda encuesta viene acompañada de un error muestral, y aunque sabemos que el porcentaje de la muestra gravita alrededor del porcentaje de la población lo más que podemos decir (con un grado razonable de confianza) es que este último se encuentra dentro de cierto intervalo.

Aquí es donde entra la industria del pronóstico. Medios como The Economist y FiveThirtyEight utilizan la información proporcionada por todas las encuestas de las que pueden echar mano para generar con ellas una estimación que es más precisa que la de cada una por separado. La idea aquí es sacar provecho de que todos los porcentajes obtenidos de las muestras gravitan alrededor de la misma cantidad, que es el porcentaje de la población. 

En el caso de las elecciones presidenciales de Estados Unidos, el sistema de colegio electoral hace que, para saber quién ganará la elección presidencial, se requiera primero determinar la probabilidad de triunfo de cada candidato en cada estado. 

Para ello, con encuestas de nivel estatal se obtiene la probabilidad de que, por ejemplo, Biden obtenga la mayoría de votos en el estado. Solo entonces se puede calcular su probabilidad de triunfo en el colegio electoral. Así, asignar a Biden una probabilidad de triunfo de 93% significa un 93% de probabilidad de obtener por lo menos 270 votos electorales

En la noche del 3 de noviembre, estos pronósticos estaban siendo fuertemente cuestionados en medios informativos y redes sociales. La razón es que, habiéndose declarado un vencedor en 42 estados y el distrito de Columbia, Biden no había reunido los 270 votos del colegio electoral, y en 7 de los 8 estados restantes Trump llevaba una ventaja con un avance estimado en el conteo de entre 50 y 75%. Para muchos, esta información fue suficiente para anticipar el triunfo de Trump, lo que a su vez dio motivo a negar la validez de las encuestas y los pronósticos basados en ellas.

Sabiendo el resultado, es claro que las encuestas preelectorales daban un mejor fundamento que la información disponible en la noche del martes. Al contrastar los resultados con el modelo de The Economist (que hizo públicamente disponible tanto el código como la información para replicarlo), la predicción del semanario había fallado únicamente en Florida, y en los 42 casos restantes había ganado el candidato el candidato previsto. 

Como en el resto de los estados, con excepción de Hawai, se tenía a Biden como el ganador más probable, durante esa malhadada noche The Economist insistía en asignar a Biden una probabilidad de triunfo de 80%, mientras que expertos y comentadores de redes sociales se preparaban para cuatro años más de Trump. De hecho, en los mercados de apuestas la relación entre estos candidatos llegó a ser próxima a 1:1.

La evolución en el tiempo del total acumulado de la votación es un pésimo predictor del resultado electoral cuando los votantes de los distritos que son contabilizados en las primeras fases tienen un perfil muy distinto al de los votantes de los distritos contabilizados hacia el final. 

Donde la comunicación no es un problema, en los condados rurales los votos se reportan antes porque son menos poblados. Biden rebasó a Trump en cuanto comenzaron a contabilizarse los votos de los condados urbanos, en donde él es claramente favorecido. Asimismo, en ciertos estados se facilitó la opción de voto por correo, dada la contingencia actual por la pandemia. 

Como esta opción fue especialmente socorrida por votantes del Partido Demócrata, donde los votos por correo fueron contabilizados al final se creó la ilusión del triunfo de Trump mientras los resultados fueron incompletos.

Entonces, no se puede decir que los pronósticos erraron. Pero, bien pensado, incluso si hubiese ganado Trump, de eso no se sigue que el modelo que predijo su derrota con probabilidad de 93% esté equivocado. Me explico. 

Digamos que le ofrecen la siguiente apuesta. Se tira un dado no cargado. Si sale un número mayor a dos, usted gana mil pesos. En caso contrario, pierde cien

Por principios básicos de teoría de la probabilidad, usted ganará esos mil pesos con probabilidad de 66.7%. Para mucha gente sería más que razonable aceptar la apuesta. Digamos que la acepta y cae el número dos. En una situación así, resultaría absurdo concluir que la teoría de la probabilidad es un fraude. Antes de lanzar el dado, el mejor pronóstico posible es que caerá algún número entre 3 y 6.  Este hecho no cambia al caer el dos en un lanzamiento en particular.

El error es pretender juzgar la calidad del pronóstico a partir del resultado específico observado. Lo que estos pronósticos probabilísticos expresan es el grado de seguridad que tenemos en una creencia. 

A diferencia de otras fuentes como nuestra intuición, nuestro columnista favorito o el pulpo Paul, el uso de la estadística y la teoría de la probabilidad da a estos pronósticos un vínculo entre la información de la que disponemos, las conclusiones a las que llegamos y nuestra seguridad en estas. A veces los pronósticos son errados y los modelos son perfectibles, pero que no le quepa duda, es un fundamento mucho más sólido que las alternativas conocidas.

Otro título del autor: Las manzanas podridas de López Obrador

SUSCRÍBETE A NUESTRO NEWSLETTER

Recibe las noticias más relevantes de México cada mañana, inicia tu día informado.