La Estadística es como un partido de baloncesto

La Estadística es como un partido de baloncesto. En Estadística buscamos la significación, que es equivalente a preguntarnos en qué momento, a lo largo de un partido de baloncesto, podemos decir que el partido está ganado.

En Estadística casi todo gira en torno a la noción de contraste de hipótesis: una decisión entre dos afirmaciones. A una de ellas, que es la preferente, que afirma lo que podemos decir antes de empezar cualquier estudio, la llamamos Hipótesis nula. A la otra, la que aceptaremos sólo cuando rechacemos la Hipótesis nula, la llamamos Hipótesis alternativa. Otra forma de decisión en Estadística es a través de un intervalo de confianza, que, desde otro punto de vista, es otra forma de contrastar. Si dentro del intervalo está lo afirmado en la Hipótesis nula, la mantenemos, sino la rechazamos y aceptamos la Hipótesis alternativa.

En los contrastes de hipótesis contrastamos: Igualdad versus diferencia, No relación versus relación, Odds ratio igual a uno versus Odds ratio diferente de uno, Pendiente de una recta de regresión igual a cero versus Pendiente de la recta distinta de cero, Distribución normal versus Distribución no normal, etc. Partiendo, siempre, de que, «a priori», es cierta la Hipótesis nula. O sea, que lo que podemos decir, antes de hacer cualquier estudio, son cosas como: las poblaciones que comparamos son iguales, las variables que estamos estudiando no tienen relación, la Odds ratio es uno, la pendiente de una recta de regresión es cero, la distribución de una variable es la normal, etc.

En Ciencias, son las diferencias, las relaciones, la no normalidad, lo que debe demostrarse. Las igualdades, las no relaciones o la normalidad parten como ciertas. La Estadística, como lenguaje de las Ciencias que es, está centrada en esta fundamental actividad de contraste de hipótesis.

Bueno, y ¿todo esto que tiene que ver con el baloncesto? Pues mucho. Muchísimo. Veamos.

Una cosa muy importante: en baloncesto no existe el empate. Siempre gana un equipo u otro. Si se acaba con los mismos puntos se hace una prórroga de 5 minutos. Si aún así no gana ninguno se continúa haciendo prórrogas hasta que uno acabe ganando.

En los contrastes de hipótesis podemos decir claramente que, en realidad, siempre es cierta la Hipótesis alternativa. Sorprendente, ¿no? O sea, las medias de dos poblaciones que comparamos son siempre distintas, la correlación entre dos variables nunca es cero, siempre es distinta de cero. Una Odds ratio nunca es uno, es siempre distinta de uno. La pendiente de una recta nunca es cero. Una variable nunca sigue una campana de Gauss. Siempre la cierta es, en realidad, la Hipótesis alternativa. El problema es en qué momento lo podemos decir. En qué momento podemos decir que una población es mayor que la otra y no al revés. En qué momento podemos decir que la correlación es positiva y no negativa. En qué momento podemos decir que la Odds ratio es mayor o menor que 1. Que la pendiente no es cero. Que la distribución no es normal. Etc.

También es así en un partido de baloncesto. En qué momento podemos decir, con pocas probabilidades de equivocarnos, que el que está ganando ahora va a ganar.

Si el resultado de un partido lo expresáramos en términos estadísticos, lo haríamos así:

H₀: Empate.

H₁: Gana algún equipo de los dos.

Sabemos ciertamente que la nula (H₀) no es cierta, que la cierta es la alternativa (H₁). El problema es en qué momento podemos decir que la nula la rechazamos porque ya sabemos, con muchas posibilidades de acertar, cómo es lo afirmado en la Hipótesis alternativa. A la Hipótesis alternativa vamos a ir únicamente cuando sea fiable lo que podamos decir. Como en un partido de baloncesto: únicamente diremos que no se empata (que, en realidad, no se acabará empatando nunca) cuando podamos concretar con precisión qué equipo romperá el empate.

Antes de empezar el partido no podemos decir quién va a ganar, por lo que es razonable partir de una hipótesis nula como ésta. Pero sabiendo que no es cierta, sabiendo que es una provisionalidad que mantendremos hasta que no podamos concretar con mucha verosimilitud quién va a ganar. El problema, pues, es en qué momento lo podremos decir. En qué momento del partido podremos decir quién lo ganará. En qué momento podremos decir quién ganará y que tal afirmación esté hecha con una probabilidad muy baja de equivocarnos. Sólo en ese momento rechazaremos la H₀, a pesar de que sabemos que no es cierta.

A los 10 minutos de partido si nuestro equipo gana de 15 puntos no diremos que ya hemos ganado, porque muchas veces, en situaciones como ésta, faltando 30 minutos de partido, y con una diferencia de 15 puntos, el equipo que iba ganando ha acabado perdiendo. Esta misma diferencia de 15 puntos faltando dos minutos sí que muy posiblemente nos permita decir que el partido está ganado.

Si pudiéramos ver entre millones de partidos de baloncesto en cuántos partidos, faltando el tiempo que falta para acabar y con la diferencia de puntos que hay en ese momento, ha acabado perdiendo el equipo que estaba ganando, podríamos decidir con más criterio. Por ejemplo, se podría establecer el protocolo siguiente: si ha cambiado el resultado final en menos del 5% de los casos, podemos decir que el partido está ya ganado. Si hiciéramos esto estaríamos haciendo algo equivalente al procedimiento seguido en la decisión estadística en un contraste de hipótesis.

Si la diferencia de puntos es muy pequeña deberemos esperar siempre mucho para hacer un pronóstico fiable, un pronóstico significativo. A veces, en ciertos partidos muy igualados, necesitaremos mucho tiempo de partido para decir, con significación, quién ganará. En Estadística para decir que hay una diferencia significativa o que hay una correlación significativa, necesitamos, a veces, una muestra muy grande. Otras veces, con un tamaño de muestra relativamente pequeño nos bastará para afirmar diferencias o relaciones significativas. Dependerá, como en el baloncesto, de la cantidad de muestra que tengamos y de la diferencia que haya entre las medias de las muestras a comparar, del valor de correlación muestral o de la Odds ratio que tengamos.

La Estadística es, pues, como un partido de baloncesto. La equivalencia está en la voluntad de pronosticar qué sucederá al final del partido (cuando tengamos toda la población) durante el partido (con una muestra). Y hacer no un pronóstico cualquiera, no un pronóstico un tanto al azar, sino un pronóstico significativo, un pronóstico casi seguro, un pronóstico que tenga muy pocas posibilidades de ser erróneo, porque en miles y miles de circunstancias equivalentes casi nunca ha sucedido algo diferente a lo que se está afirmando en el pronóstico.

El concepto de significación es nuclear en la Estadística. Posiblemente pueda definirse a la Estadística como la ciencia de la significación.

LA MATEMÁTICA Y LA ESTADÍSTICA: UNA ORQUESTA HECHA INSTRUMENTO

Unas gramáticas de la Gramática de la Matemática y de la Estadística. Jaume Llopis Pérez.

La Estadística es como un partido de baloncesto

2 comentarios en “La Estadística es como un partido de baloncesto”

Deja un comentario Cancelar la respuesta

Comparte esto:

2 comentarios en “La Estadística es como un partido de baloncesto”

Deja un comentario Cancelar la respuesta