Bayesianos contra frecuentistas

El edificio de la estadística descansa en el concepto de probabilidad. Y, sin embargo, no existe un consenso universal sobre cómo interpretar este concepto.

Existen dos formas de interpretar la idea de probabilidad: la interpretación clásica (o frecuentista) y la interpretación bayesiana. Mark C. Chu-Carroll nos da una buena explicación al respecto en su blog, que trataré de resumir aquí.

La interpretación clásica, mayoritaria por lo menos hasta ahora, define la probabilidad en términos de experimentación. Si repites un experimento un número infinito de veces y compruebas que en 350 de cada 1.000 ocasiones se ha producido  un determinado resultado, un frecuentista diría que la probabilidad de ese resultado es del 35%. Basándose en esta definición, un frecuentista afirma que es posible asociar a cada evento una probabilidad de obtener un valor VERDADERO del mismo.

La aproximación clásica se basa por lo tanto en estudiar la probabilidad "real" de las cosas, tratando de determinar hasta qué punto una medición realizada sobre un conjunto de experimentos se aproxima a la probabilidad real que subyace. Es por ello que un frecuentista definiría probabilidad como una expresión matemática que predice en qué medida es verosímil que ciertos eventos ocurran basándose en el patrón observado hasta este momento.

Sir Ronald Fisher

Ronald Fisher. uno de los padres de la estadística frecuentista moderna

Por el contrario, la interpretación bayesiana se basa en un conocimiento limitado de las cosas. Afirma que sólo asocias una probabilidad a un evento porque hay incertidumbre sobre el mismo, es decir, porque no conoces todos los hechos. En realidad, un evento dado, o bien ocurrirá (probabilidad=100%) o bien no ocurrirá (probabilidad=0%). Cualquier otra cosa es una aproximación que hacemos del problema a partir de nuestro conocimiento incompleto del mismo. El enfoque bayesiano se basa por lo tanto en la idea de refinar predicciones a partir de nuevas evidencias. Un bayesiano definiría probabilidad como la expresión matemática que mide el nivel de conocimiento que tenemos para hacer una predicción. Por lo tanto, para un bayesiano, estríctamente hablando es incorrecto decir "predigo que hay un 30% de probabilidades de que ocurra el evento P", sino que debería decir "basándome en el conocimiento actual que tengo, tengo un 30% de certeza de que P ocurrirá".

bayes

Thomas Bayes. creador del concepto de probabilidad condicionada que rige el pensamiento bayesiano.

¿Importa tanto la diferencia?

La dos formas de entender una probabilidad son más relevantes de lo que pudiera parecer. Es muy diferente pensar en la probabilidad como el número de veces en que un experimento arrojará un resultado, a concebirla como el grado de conocimiento que tengo sobre dicho resultado. En varios problemas, ambos enfoques pueden ser equivalentes. En otros, no tanto.

La aproximación bayesiana hace que algunas cosas sean más claras. Emplear una visión clásica lleva a muchas personas a confundir el significado de las estadísticas. Por ejemplo, si un estudio muestra que de cada 100 fumadores 10 van a desarrollar cáncer de pulmón, una interpretación clásica del dato puede llevarnos  pensar que si fumo, tengo un 10% de probabilidad de enfermar. Y esto no es cierto. Lo que realmente nos dice el estudio es que el dato (10 de cada 100 fumadores desarrollan cáncer) puede considerarse como un buen punto de partida para hacer una predicción sobre las opciones de desarrollar cáncer si fumo, pero un bayesiano dejaría muy claro que se trata de un conocimiento muy incompleto, y que por lo tanto no es de mucha utilidad a no ser que disponga de más información para incrementar mi certeza.

Como contrapartida, el razonamiento bayesiano puede llevarnos al absurdo. Un bayesiano cree que puedes hacer un análisis probabilístico prácticamente de cualquier cosa, simplemente alineando los factores que pueden influir en ella y combinando  adecuadamente tu conocimiento sobre esos factores. Esta idea ha sido empleada frecuentemente por auténticos obsesos del pensamiento bayesiano para asignar una probabilidad a la existencia de Dios, a que la tierra haya sido visitada por alienígenas, a que los artistas hayan incluído mensajes secretos en sus pinturas, etc.

Los frecuentistas no son víctimas de este problema. Un frecuentista considera que las probabilidades sólo tienen sentido en el ámbito de experimentos repetibles. Bajo este punto de visto, es absurdo asignar una probabilidad a la existencia de Dios, porque la existencia de un creador del universo no es un problema que podamos repetir y observar numerosas veces.

Los frecuentistas no creen que sea posible asignar una probabilidad a absolutamente cualquier cosa, algo que a menudo es ridículo.

Y entonces, ¿quién tiene razón?

Probablemente ambos tienen razón. O ambos están equivocados. Hay escenarios en los que la idea de una probabilidad fija basada en un modelo repetible y observable, en un experimento controlado, es demasiado simple. Y otros casos en que la idea de una probabilidad que mide el grado de conocimiento de una cosa es igualmente simplista.

Como en tantas otras cosas de la ciencia - y de la vida - no existe un enfoque universalmente válido. La visión frecuentista ha aportado un rigor y un sistema de trabajo a muchos ámbitos de la estadística, empezando por el cálculo del error muestral. La visión bayesiana, por el contrario, ha mostrado ser una buena herramienta para hacer predicciones sobre sucesos complejos, tomando datos de múltiples fuentes de forma simultánea. También es la base de uno de los algoritmos más exitosos en el análisis de utilidad de estudios tipo Conjoint.

En cualquier caso, la polarización de las ideas no suele ser una buena consejera para tomar buenas decisiones. Y en el momento de emplear un enfoque frecuentista o bayesiano de un problema, no deberíamos olvidar esta máxima.

¡Suscríbete a nuestro boletín de noticias para recibir actualizaciones exclusivas y las últimas noticias!