Archivo de la categoría: HERBARIO

Test de Wald

El Test de Wald es un contraste de hipótesis donde se trata de ver la coherencia de afirmar un valor concreto de un parámetro de un modelo probabilístico una vez tenemos ya un modelo previamente seleccionado y ajustado.

Se trata de un Test generalista, aplicable en muchos ámbitos. Esta es su característica principal.

Se aplica siempre tras elegir un modelo (una distribución cualquiera, una regresión simple, una regresión logística, etc) y a continuación se hace algún contraste de hipótesis sobre uno o varios parámetros: Por ejemplo, la media de la normal es 5, la pendiente de la recta es 0, el coeficiente principal de una regresión logística es 0, etc.

La fórmula del contraste es muy sencilla:

IMG_5500

En realidad, si se mira con detalle se observa que no deja de ser un valorar la distancia entre Observado y Esperado. Esta idea de distancia entre Observado y Esperado es nuclear en Estadística. Siempre en un contraste de hipótesis estamos valorando si lo que vemos es o no muy distante de lo que esperamos, en el caso de ser cierta la hipótesis nula.

Es un contraste que se usa mucho en la mayor parte de softwares.

Suele usarse especialmente para contrastar si es cero o no un determinado coeficiente que multiplica a una variable independiente en una regresión. Si el p-valor, como siempre, es menor que 0.05, se rechaza esa hipótesis nula que afirma que ese coeficiente es cero, y se entiende entonces que ese coeficiente no es cero y que, por lo tanto, el modelo es útil para representar una determinada relación. Si, por el contrario, el p-valor es mayor que 0.05 eso significa que el valor del coeficiente podría ser perfectamente cero y estar viendo lo que vemos, por lo tanto, esa variable no influye a la hora de determinar la variable dependiente (o también denominada, a veces, variable respuesta) del modelo de regresión.

Test de Cochran-Mantel-Haenszel

El Test de Cochran-Mantel-Haenszel es un contraste de hipótesis para contrastar la igualdad de Odds ratio entre k tablas de contingencia 2×2. Es una forma de evaluar la posible influencia que pueda tener, sobre la relación entre esas variables cualitativas dicotómicas, una tercera variable también cualitativa con k valores posibles.

Es un Test usado para comprobar la posible confusión que puede generar una tercera variable en la relación entre dos variables.

El Test es el siguiente:

IMG_5246

Test de Scheffé

El Test de Scheffé es un test de comparaciones múltiples. Permite comparar, como los demás contrastes de este tipo, las medias de los t niveles de un factor después de haber rechazado la Hipótesis nula de igualdad de medias mediante la técnica ANOVA.

Todos los tests de comparaciones múltiples son tests que tratan de concretar una Hipótesis alternativa genérica como la de cualquiera de los Test ANOVA.

El Test de Scheffé crea también umbral, como las otras técnicas de comparaciones múltiples, y las diferencias que superen ese umbral serán, para el método, significativas, y las que no lo superen no lo serán.

IMG_5007

 

Para comparar las  diferentes técnicas de comparaciones múltiples es recomendable leer el articulo Comparación entre técnicas de comparaciones múltiples.

Test de Bonferroni

El Test de Bonferroni es un test de comparaciones múltiples. Permite comparar, como los demás contrastes de este tipo, las medias de los t niveles de un factor después de haber rechazado la Hipótesis nula de igualdad de medias mediante la técnica ANOVA.

Todos los tests de comparaciones múltiples son tests que tratan de concretar una Hipótesis alternativa genérica como la de cualquiera de los Test ANOVA.

El Test de Bonferroni hay que entenderlo en relación con el Test LSD de Fisher. Se basa en la creación de un umbral, el BSD (Bonferroni significant difference) por encima del cual, como el LSD en el Test LSD, la diferencia entre las dos medias será significativa y por debajo del cual esa diferencia no lo será de estadísticamente significativa.

Si se comparan ambos test (Ver Test LSD en Herbario de técnicas) se verá que el cambio está en el nivel de significación elegido. En el Test de Bonferroni el nivel de significación se modifica en función del número de comparaciones a hacer. Esto elimina el problema de hacer comparaciones múltiples. Reduce el nivel de significación en tal medida que elimine el error de aplicar el test tantas veces al mismo tiempo.

El BSD se calcula, pues, de la siguiente forma:

IMG_5006

La peculiaridad de esta técnica es la reducción del nivel de significación, la división del nivel alfa habitual por M, el número total de comparaciones posibles de dos en dos. De esta forma se compensa el posible error que puede cometerse al ir haciendo muchas comparaciones dos a dos, cada una de ellas con esa prefijada posibilidad de error alfa.

Para ver una visión comparada de las diferentes técnicas de comparación múltiples ver el artículo Comparación entre técnicas de comparaciones múltiples.

Test de Newman-Keuls

El Test  Newman-Keuls es un test de comparaciones múltiples. Permite comparar las medias de los t niveles de un factor después de haber rechazado la Hipótesis nula de igualdad de medias mediante la técnica ANOVA.

Todos los tests de comparaciones múltiples son tests que tratan de perfilar una Hipótesis alternativa genérica como la de cualquiera de los Test ANOVA.

Este Test es realmente paralelo al Test de Duncan (Ver Herbario de técnicas). Utiliza un umbral móvil, como esa técnica, basado en el número de medias están implicadas en el recorrido de la resta de medias comparada pero con una diferencia: aquí el nivel de significación no cambia, no se altera, se mantiene en el general, que suele ser, como siempre en Estadística, 0.05. No aumenta como sucede en el Test de Duncan. Esto le convierte en un Test más conservador, con menos potencia.

Veamos cuál es en este Test el umbral empleado:

IMG_5005

Para comparar las diferentes técnicas de comparaciones múltiples es recomendable leer el artículo Comparación entre técnicas de comparaciones múltiples.

Test de Duncan

El Test de Duncan es un test de comparaciones múltiples. Permite comparar las medias de los t niveles de un factor después de haber rechazado la Hipótesis nula de igualdad de medias mediante la técnica ANOVA. Todos los tests de comparaciones múltiples son tests que tratan de perfilar, tratan de especificar, tratan de concretar, una Hipótesis alternativa genérica como la de cualquiera de los Test ANOVA.

El Test de Duncan es muy similar al Test HSD de Tukey (Ver Herbario de técnicas), pero en lugar de trabajar con un umbral fijo trabaja con un umbral cambiante. Un umbral que dependerá del número de medias implicadas en la comparación.

Para saber el número de medias implicadas en la comparación se ordenan las medias muestrales de menor a mayor y así al hacer una comparación entre dos medias sabremos además de las dos medias comparadas cuantas medias quedan dentro. Este número de medias implicadas en cualquier comparación de medias es el parámetro p de este umbral.

Veamos este umbral y cómo se calcula:

IMG_5002

Se basa el procedimiento, también, en la distribución de los rangos estudentizados (Ver Test HSD de Tukey en el Herbario de técnicas).

Es interesante comparar el Test HSD y el Test de Duncan. Este cambio tanto en el número de medias implicada como en el nivel de significación genera un umbral más pequeño. Esto da una mayor capacidad de encontrar diferencias mediante el Test de Duncan porque los umbrales son más pequeños y, por lo tanto, es más fácil encontrar diferencias entre las medias comparadas. En estos casos, en Estadística, decimos que el Test de Tukey es más conservador que el Test de Duncan o que tiene menor potencia.

Si se quiere comparar las diferentes técnicas de comparaciones múltiples es recomendable leer el artículo Comparación entre técnicas de comparaciones múltiples.

Test HSD de Tukey

El Test HSD (Honestly-significant-difference) de Tukey es un test de comparaciones múltiples. Permite comparar las medias de los t niveles de un factor después de haber rechazado la Hipótesis nula de igualdad de medias mediante la técnica ANOVA. Es, por lo tanto, un test que trata de perfilar, trata de especificar, una Hipótesis alternativa genérica como la de cualquiera de los Test ANOVA.

Se basa en la distribución del rango estudentizado que es la distribución que sigue la diferencia del máximo y del mínimo de las diferencias entre la media muestral y la media poblacional de t variables normales N(0, 1) independientes e idénticamente distribuidas.

Se establece así un umbral, como en otros métodos, como el Test LSD (Ver Herbario de técnicas). Se calculan todas las diferencias de medias muestrales entre los t niveles del factor estudiado. Las diferencias que estén por encima de ese umbral se considerarán diferencias significativas, las que no lo estén se considerarán diferencias no significativas.

IMG_4998

Observemos que el test está diseñado para el mismo tamaño muestral por nivel, por esto aparece esta n común. Si tenemos tamaños muestrales distintos se toma entonces como n la media armónica de esas medias. La media armónica de dos medias es la siguiente:

IMG_5003

Para nuestro caso debería generalizarse a t medias simplemente sustituyendo el 2 por el número t.

Para ver cómo funciona la distribución del rango estudentizado veamos una tabla donde se buscarían estos valores:

IMG_4999

Observemos que en la tabla hay un valor de el número de medias, en la nomenclatura seguida por nosotros sería la t, los t niveles del factor. En la tabla le llama k. Los grados de libertad son el N-t nuestro. La tabla da umbrales para dos niveles de significación alfa: 0.05 y 0.01.

Finalmente, para poder comparar esta técnica de comparaciones múltiples con las otras que suelen utilizarse leer el artículo Comparación entre técnicas de comparaciones múltiples.

Test LSD de Fisher

El Test LSD (Least significant difference) de Fisher es un test de comparaciones múltiples. Permite comparar las medias de los t niveles de un factor después de haber rechazado la Hipótesis nula de igualdad de medias mediante la técnica ANOVA. Todos los tests de comparaciones múltiples son tests que tratan de perfilar, tratan de especificar, tratan de concretar, una Hipótesis alternativa genérica como la de cualquiera de los Test ANOVA.

El Test se basa en la creación de un valor común, un umbral, basado en un test de la t de Student. Se realizan todas las diferencias entre medias de los t niveles. Las diferencias que estén por encima de este umbral indicarán una diferencia de medias significativa y las diferencias que estén por debajo indicarán una diferencia no significativa:

IMG_4997

Los paquetes estadísticos calculan este valor de LSD y a partir de él, calculan todas las diferencias de medias posibles y valoran cuáles están por encima y cuáles están por debajo de este umbral. Así acaban diseñando cuál es el perfil de la Hipótesis alternativa elegida mediante el ANOVA previo.

Para comparar las diferentes técnicas de comparaciones múltiples es recomendable leer el artículo Comparación entre técnicas de comparaciones múltiples.

Test de McNemar

El objetivo es comparar dos proporciones en datos apareados, en datos que han sufrido dos tratamiento o dos condiciones que se quieren comparar. La situación es, pues, como la expresada en el siguiente gráfico, con el siguiente contraste de proporciones y con el estadístico de test siguiente:

IMG_4977

Para ver un ejemplo de su aplicación: Ejemplo