La significación estadística

La noción de significación, en Estadística, significa algo así como fiabilidad. Un resultado significativo es un resultado por el que podemos apostar. Ante una afirmación estadísticamente significativa podemos pensar que si volviésemos a hacer lo mismo, si volviésemos a empezar todo lo que habíamos hecho y que nos ha llevado a tales afirmaciones, y lo hiciésemos en las mismas circunstancias, pero con otra muestra, acabaríamos diciendo algo similar, algo equivalente.

Podemos pensar, pues, que estamos ante una muestra tipo, ante una buena muestra de muestras, una muestra representativa del conjunto de muestras que hubiéramos podido tener.

Una afirmación si es estadísticamente significativa representa que la Estadística cree en este resultado, cree que es muy poco probable que sea fruto del azar del muestreo. Si una técnica estadística duda de la representatividad de un muestreo dice: «esto no significativo».

La significación estadística se mide mediante el p-valor. Éste es un valor que va del 0 al 1, con dos sectores bien diferenciados: del 0 al 0,05 y del 0,05 al 1. Una metáfora posible, en esta situación, es la de las notas: En nuestro sistema educativo las notas van del 0 al 10, y es bien distinto el sector de notas que va del 0 al 5 que el que va del 5 al 10. Esto mismo sucede con el p-valor. La frontera del 0,05 en el p-valor es, en cierto modo, equivalente al 5 en las notas. Pero cuidado: 0,05, no 0,5.

Por ejemplo: Una correlación será significativa si su p-valor es inferior a 0,05. Si no es significativa hemos de presuponer que r = 0. Siguiendo la metáfora de las notas, es como si se examinara la afirmación r = 0: si el p-valor es igual o superior a 0,05 aprueba, si el p-valor es inferior a 0,05 suspende, decidimos, entonces, que la r no es 0 y nos quedamos con el signo y la magnitud de la r calculada. De esta forma podemos decir que una r = 0,8 con un p-valor de 0,26 es, en realidad, una correlación más baja que una r = 0,4 con p = 0,001. Porque, en este caso, la r = 0,8, al no ser significativa, no podemos fiarnos de ella. Puede ser un efecto del azar del muestreo. Esto quiere decir que de la misma forma que en esta muestra hemos calculado una r = 0,8 en otra muestra tomada en las mismas condiciones podríamos tener r = -0,8. Por eso ante esta posibilidad la técnica estadística nos dice: “Ante la duda mejor afirmar que no hay relación; o sea, que r es igual a 0”.

Al basarse la decisión en un número entre 0 y 1 y en una frontera (0,05), el paralelismo con la enseñanza es claro: En la enseñanza, en España, las notas son un número del 0 al 10, con una frontera muy clara en el 5. Como puede verse la frontera en el p-valor está relativamente mucho más a favor del aprobado. Esto es para que cuando suspenda r = 0 tengamos muy pocas posibilidades de errar. Observemos que el margen de la afirmación r = 0 es muy amplio (0,95). Esto es lo que permite hablar de «significativo» cuando suspende. Por eso, entonces, hablamos de correlación significativa. Porque le hemos dado mucho margen a r = 0 y acabamos viendo que no es coherente mantener esta afirmación a la luz de lo que estamos viendo en la muestra que tenemos.

La significación tiene mucho que ver con el tamaño de muestra. Si ese tamaño es pequeño es difícil que la Estadística se fíe de ella. Las muestras de tamaño pequeño son muy imprevisibles porque las diferentes muestras posibles son muy diversas entre ellas. En muestras grandes hay mucha homogeneidad entre las diferentes muestras posibles. Por eso será más fiable lo que una de ellas diga.

Entender este razonamiento es fundamental en Estadística. Estamos abordando, con esto, en realidad, el núcleo básico de la Estadística.

En Estadística a todo esto que estamos viendo le denominamos «Contraste de hipótesis». Vamos a ver, ahora, la terminología que usamos. En Contraste de hipótesis se habla de Hipótesis nula: H0, y de Hipótesis alternativa: H1. Y de que hemos de decidirnos por una u otra. La decisión no es como cuando compramos una camisa poniendo una al lado de la otra para ver cuál nos gusta más. La H0 parte como cierta y sólo nos decantaremos por la H1 si la H0 es absurdo mantenerla viendo lo que vemos en la muestra. Por eso H1 se le denomina alternativa, porque es la alternativa de la nula cuando no es lógico mantenerla tras analizar la muestra. En todo lo visto con la correlación podemos ahora conectar: H0 es r = 0 y H1 es r distinta de 0. El p-valor es el criterio objetivo basado en el análisis de la muestra que nos permite decidirnos por mantener H0 o pasarnos a la alternativa, a H1.

Esta lógica de funcionamiento es el tema nuclear de casi todas las técnicas estadísticas.

Siempre digo que la estructura de la Estadística es como la del Bolero de Ravel: un mismo tema que va repitiéndose machaconamente. El tema machacón del Bolero de Ravel de la Estadística es esta noción de contraste de hipótesis y el p-valor como criterio de decisión.

Tanto en las técnicas de relación como en las técnicas de comparación las decisiones se acaban tomando planteando un Contraste de hipótesis y decidiéndose en base a un p-valor obtenido valorando la información que tenemos en la muestra. Son afirmaciones muy distintas las que se hacen en los diferentes contrastes de hipótesis pero el procedimiento de decisión se basa siempre en el mismo formalismo. Se analiza la muestra, o las muestras, y en base a una serie de criterios (tamaño muestral, dispersión y magnitud de una serie de cálculos) se mantiene la H0 o se pasa a aceptar la alternativa, la H1.

El paralelismo de la Estadística con el mundo judicial es sorprendente. En un juicio también hay dos hipótesis a contrastar: inocencia y culpabilidad. Y las dos no parten paralelas. Una parte como cierta: la inocencia («presunción de inocencia»), y sólo si durante el juicio, mediante las pruebas y testigos, se ve que la inocencia no se puede mantener se pasará a la culpabilidad.

En Estadística podemos decir que existe la presunción de no relación entre las variables. Presunción de r = 0, de a = 0, de b = 0. Y más tarde, cuando veamos las técnicas de comparación hablaremos de la presunción de igualdad de medias, de proporciones, de varianzas, etc. Únicamente si es incoherente mantener esas presunciones, a la luz de la muestra (nuestras pruebas y testigos), diremos que hay relación. Pero cuando lo hagamos, cuando digamos que hay relación, o que hay diferencias de medias o de proporciones, como lo habremos hecho tras darle mucho margen de confianza a la presunción de no relación, o a la de igualdad, podemos decir que aquella relación es significativa, es fiable, que existen pocas posibilidades de que no sea así.

En el fondo los estadísticos somos un poco como el Tribunal constitucional. El Tribunal constitucional tiene como objetivo básico analizar las leyes y acabar dictaminando si se adaptan o no a la constitución. Al final sus sentencias son, en esencia, decir «constitucional» o «no constitucional». Y lo que dice este tribunal es la última palabra. Con la Estadística sucede un poco lo mismo. Analiza unos datos y acaba dando un veredicto: «significativo» o «no significativo». Y la comunidad científica está muy pendiente de estos veredictos, por su fundamental trascendencia. Podemos decir algo así como que la Estadística es el Tribunal de la significación de la ciencia.

4 comentarios en “La significación estadística

  1. Pingback: CRO desde otro punto de vista | KPIsland.com

  2. Pingback: Cómo saber si dos fármacos, o técnicas, son igual de eficaces | Salud Musculoesquelética

  3. Erick

    Gracias por la publicación, estoy realizando un trabajo de la universidad y me resulta de gran ayuda.
    PD: en el trabajo me pide dar como resultado la «significación de la muestra» espero no equivocarme y que ambas se refieran a lo mismo.

    Responder

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s