Introducción al contraste de hipótesis

Supongamos que queremos jugarnos dinero entre tú que lees y yo que escribo mediante una moneda. Si sale cara ganas tú. Si sale cruz gano yo. Cada vez que alguien gane le dará 100 euros a su oponente. ¡Esto va en serio, hay que concentrarse!

Yo pongo la moneda para jugar. Pero te dejo que elijas con cuál de las dos monedas que yo propongo quieres jugar: La moneda 1 ó la moneda 2.

Supongamos que, previamente, ante notario, hemos hecho una serie de lanzamientos independientes de cada una de las dos monedas. Con la moneda 1 hemos hecho 1000 lanzamientos y han salido 550 caras y 450 cruces. Con la moneda 2 hemos hecho sólo 10 lanzamientos, porque nos ha faltado tiempo, y han salido 8 caras y 2 cruces.

Repito: tú puedes elegir la moneda. La moneda 1 ó la moneda 2. Recuerda que tú ganas con cara, yo gano con cruz. ¿Cuál eliges? ¿La 1? ¿La 2? ¿Cuál?

Cuando he planteado esto en mis clases la mayoría de gente elige la moneda 2. Esta relación de 8 caras y 2 cruces es tentadora para quien gana con cara. En cambio, la moneda 1 parece poco apetecible. Las caras salen ganando pero por muy poco. Sólo 550 respecto a 450.

Pero yo de ti escogería la moneda 1. Preferiría que escogieras la moneda 2 para mi beneficio, pero a ti te conviene, sin lugar a dudas, la moneda 1.

Veamos por qué. Veámoslo, además, planteado como un contraste de hipótesis.

En un caso como éste la Hipótesis nula contemplaría la afirmación de que la moneda es equilibrada, de que la probabilidad de cara y cruz es la misma: 0.5. En cambio, en la Hipótesis alternativa tendríamos la afirmación de que la moneda no es equilibrada, de que la probabilidad de cara y cruz no es 0.5, de que la moneda está trucada.

Supongamos que cogiéramos una moneda sacada de fábrica, una moneda que seguro que es equilibrada, una moneda que se ajusta perfectamente a lo que dice la Hipótesis nula. Y que hiciéramos 100000 experimentos de lanzar esa moneda 10 veces. O sea, que hiciéramos un millón de lanzamientos independientes agrupándolos de 10 en 10 para que queden como 100000 experimentos de lanzar 10 veces esa moneda equilibrada. En cada uno de esos 100000 experimentos de lanzar la moneda 10 veces anotaríamos el número de caras que obtuviéramos.

Esto nos llevaría su tiempo, claro. Pero nos daría una idea de los resultados que podríamos obtener bajo la Hipótesis nula, con la moneda 2, siendo cierta la Hipótesis nula.

Pero, aún más largo, supongamos que cogiéramos, también, esa misma moneda y hiciéramos 100000 experimentos pero ahora de lanzar esa moneda 1000 veces en cada experimento. O sea, que hiciéramos cien millones de lanzamientos independientes agrupándolos de 1000 en 1000 para que quedaran como 100000 experimentos de lanzar 1000 veces esa moneda equilibrada. En cada uno de esos 100000 experimentos de lanzar la moneda 1000 veces anotaríamos, de nuevo, el número de caras que obtuviéramos.

Como puede verse, esto nos llevaría mucho tiempo. Mucho.

Pero, ahora, gracias a la informática, gracias a la simulación, se puede hacer en un minuto. En un minuto podemos imitar perfectamente lo que pasaría en la realidad si cogiéramos una moneda recién salida de fábrica donde ingenieros certificaran que es correcta, y que hiciéramos todos esos experimentos que acabamos de comentar.

Si se hace esto con la moneda 2 vemos que los resultados que obtenemos del número de caras en 10 lanzamientos realizado 100000 veces es el siguiente:

IMG_5766

Observemos que el más frecuente es el 5 (5 caras y 5 cruces) con 24712 veces. Pero observemos que un valor de 8 caras y 2 cruces o 2 caras y 8 cruces sale un número no despreciable de veces (4328 y 4437 veces, respectivamente). Lo que significa que si es cierta la Hipótesis nula es razonable ver estas combinaciones; o sea, que no es muy improbable ver lo que vemos con la moneda 2 y que sea cierta la Hipótesis nula. En una moneda equilibrada ver lo que vemos en la moneda equilibrada tiene la suficiente probabilidad como para no dudar de ese equilibrio si en una moneda vemos ese resultado.

Si se hace esto mismo con la moneda 1 vemos que los resultados que obtenemos del número de caras en 1000 lanzamientos realizados 100000 veces es ahora el siguiente:

IMG_5767

Observemos ahora que el valor 550 no sale ni una sola vez. En 100000 experimentos de lanzar una moneda equilibrada 1000 veces en ninguna ocasión ha salido un resultado tan o más desequilibrado del visto en la moneda 1, o sea: 550 caras y 450 cruces. Por lo tanto, en este caso ver lo que vemos en la moneda 1 es muy poco probable si fuera cierta la Hipótesis nula. Por eso en este caso podríamos rechazarla y pasarnos a la Hipótesis alternativa, que afirma que la probabilidad de cara y cruz no es 0.5/0.5, que la moneda no está equilibrada. Y como la estimación es que la cara es más probable que la cruz si se gana con cara interesa elegir la moneda 1. A la larga ganarás más porque saldrá más veces.

Es muy importante entender esto porque en realidad todos los contrastes de hipótesis en Estadística se rigen por mecanismos de este tipo. Observemos que en este segundo caso, con la moneda 1, rechazamos la Hipótesis nula que afirma el equilibrio de la moneda (probabilidad 0.5/0.5) porque lo que vemos en esa moneda, nuestra experiencia con esa moneda, nos proporciona un valor de caras y cruces que es muy poco probable verlo en una moneda equilibrada. Lo observado está muy alejado de lo esperado en el caso de ser cierta la Hipótesis nula. Aquí está la clave. En ver la posición relativa de lo que ves respecto a lo que deberías ver en el caso de ser cierta la Hipótesis nula. De hecho, el p-valor de un contraste de hipótesis es un número entre el 0 y el 1 que cuantifica esta posición relativa. Si es grande (y por grande en Estadística significa que es mayor que 0.05) quiere decir que lo que vemos en nuestra muestra es algo bastante probable de ver si la Hipótesis nula fuera cierta. Sin embargo, si ese p-valor es pequeño (menor que 0.05) quiere decir que lo que vemos está muy alejado de lo que deberíamos ver en el caso de ser cierto lo que afirma la Hipótesis nula.

Por esto el p-valor para la moneda 2 sería un p-valor superior a 0.05 y, sin embargo, para la moneda 1 sería un p-valor inferior a 0.05.

Todo esto, evidentemente, es con la información que tenemos. Los contrastes de hipótesis se realizan con la información que se tiene. Por encima de todo en ciencia interesa ser coherente con el nivel de información que se tiene. Esto es muy importante.

1 comentario en “Introducción al contraste de hipótesis

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s