CURSO ELEMENTAL DE ANOVA

El ANOVA es un conjunto de técnicas estadísticas destinadas a tomar decisiones respecto a comparaciones entre diferentes poblaciones. Estas poblaciones pueden ser tanto observacionales o diseñadas experimentalmente; o sea, poblaciones que están en la naturaleza tal cual o poblaciones que suponen ensayos nuestros, que son, en realidad, preguntas que le hacemos a la naturaleza. La decisión sobre la comparación de esas poblaciones que, en realidad, no tenemos la tomamos a través de muestras tomadas en esas poblaciones.

El ANOVA es un conjunto de técnicas que se enmarcan en la Estadística y es necesario haber seguido previamente un curso de Estadística. Para quien tenga parcialmente olvidado ese curso previo combiene que haga un repaso antes de adentrarse en este curso de ANOVA. Aquí tenéis una síntesis, un repaso, de lo que es un curso general de Estadística: Curso 0 de Estadística.

Empecemos, ahora, pues, ya, con el curso de ANOVA. Hay una serie de importantes conceptos iniciales a tener en cuenta en el lenguaje ANOVA. Los podéis seguir en este enlace del blog: Viaje en autobús turístico por el mundo ANOVA. El siguiente vídeo comenta este fichero introductorio:

Una vez vistos estos conceptos globales que nos acompañarán durante todo el curso vamos a ir viendo los distintos modelos ANOVA que responden a las distintas situaciones en las que nos podemos encontrar y en las que nos interese tomar decisiones sobre comparaciones entre poblaciones; o, dicho más técnicamente, situaciones en las que nos interese determinar se hay efectos.

Antes de empezar con los modelos ANOVA veamos Una primera aproximación al ANOVA

El vídeo siguiente comenta este fichero:

Empezaremos ya a ver el ANOVA de un factor con todo su formalismo. Veamos los siguientes dos vídeos:

En este vídeo utilizamos el contenido de este fichero: La parametrización de un modelo ANOVA.

Veamos, ahora un tema muy importante: Cómo funciona el contraste de hipótesis. Es muy importante verlo bien en el caso del ANOVA más sencillo, el de un factor, porque después, cuando veamos modelos de ANOVA más complejos el funcionamiento será el mismo, aunque, como veremos, en esos modelos no habrá sólo un contraste sino muchos, y lo complejo será ver cómo realizamos los cocientes F. No adelantemos cosas, pero lo importante es que el funcionamiento de todos los contraste que hagamos será fundamentalmente el mismo. Cambiará qué cocientes hagamos y eso será complejo, como ya veremos, pero la operatividad del contraste siempre será la que veréis en el siguiente vídeo:

Veamos un ejemplo concreto de ANOVA de un factor con las diferentes etapas que envuelven su análisis:

Es muy importante tener claro todo lo visto hasta aquí antes de seguir adelante. Si es preciso es recomendable volver a escuchar el material visto hasta ahora, si hay dudas.

Veamos ahora un ejemplo de ANOVA de un factor a efectos aleatorios

Podéis seguirlo con el siguiente vídeo:

Vamos a empezar a ver los modelos ANOVA de dos factores. Primero veremos dos factores cruzados y luego los anidados.

Dos factores cruzados:

Poco a poco vamos viendo los dos momentos clave del ANOVA:

  1. Encontrar qué modelo ANOVA encaja con la situación experimental que tenemos.
  2. Cuáles son las esperanzas de los cuadrados medios que nos permitirán realizar los cocientes adecuados para decidir en los contrastes de hipótesis del modelo que evalúan si hay efectos estadísticamente significativos.

Vamos a ver, ahora, antes de continuar, las comparaciones múltiples. Siempre que tengamos un factor fijo en un ANOVA si ese factor es significativo; o sea, los niveles no son iguales, hay efectos, debemos hacer unas comparaciones múltiples para poder dibujar, concretar, cuáles son las diferencias entre esos niveles. A continuación tenéis un vídeo donde explico las diferencias técnicas de comparaciones múltiples que suelen ofrecer los software estadísticos:

Y, ahora, antes de continuar con más modelos de ANOVA, otro apunte general: las suposiciones utilizadas en ANOVA para que la distribución de referencia en las tomas de decisiontes (en los contrastes de hipótesis) sea la distribución F de Fisher. La explicación básica de este aspecto lo tenéis en el siguiente vídeo:

Veamos en el siguiente vídeo la descomposición de la variabilidad de los modelos de un factor y de dos factores cruzados:

Empecemos a ver el ANOVA de dos factores anidados. Para ello veamos, primero, este vídeo introductorio:

A continuación veamos los tres modelos posibles de ANOVA de dos factores anidados:

Veamos algunos ejemplos de problemas de ANOVA de dos factores:

Veamos más ejemplos prácticos de dos factores. Os planteo distintas situaciones experimentales y la discusión de cuál es el modelo ANOVA que encaja en él:

En el siguiente vídeo veréis distintas situaciones de ANOVA de uno y dos factores, evaluando los resultados que tendríamos en el análisis. Es muy importante que se miren los datos y que se pueda intuir, viendo los datos, cuál será el resultado del análisis: cuáles efectos serán significativos y cuáles no:

Es clave que se entienda muy bien que en ANOVA hay dos momentos decisivos:

  1. Estudiar bien el experimento realizado para ver qué modelo de ANOVA encaja con él: ANOVA de un factor fijo, ANOVA de un factor aleatorio, ANOVA de dos factores cruzados fijos, etc.
  2. Mediante un software calcular la denominada tabla ANOVA que genera unos Cuadrados Medios para todos los efectos posibles del modelo y para el residuo. Una vez se tiene esta tabla la clave es saber qué cocientes F hay que hacer para tomar una decisión sobre si cada uno de los efectos es o no significativo: si hay diferencias o no.

Estos son los dos puntos básicos que hay que aprender de ANOVA.

Nos centraremos, pues, en este curso especialmente en estos dos puntos: Saber encontrar el modelo que se adapta a un experimento, y saber construir los cocientes apropiados para tomar decisiones para cada uno de los efectos de ese modelo.

Para avanzar en modelos más sofisticados de ANOVA es imprescindible ver cómo podemos obtener las esperanzas de los cuadrados medios. Es fundamental. Porque dependiendo del modelo los cocientes serán unos u otros dependiendo de las esperanzas de los cuadrados medios. El algoritmo de Bennet-Franklin permite llegar a esas esperanzas de forma equivalente a cómo llegarías a través del análisis matemático.

Primero, para ver el mecanismo del algoritmo, veremos cómo a través de él llegamos a deducir las esperanzas de los cuadrados medios de los modelos ANOVA de dos factores vistos hasta ahora. Empezaremos viéndolo en un ejemplo de modelos de dos factores cruzados mixtos (un factor fijo y el otro aleatorio):

Más ejemplos de aplicación del algoritmo para encontrar las esperanzas de los cuadrados medios en modelos de dos factores cruzados o anidados:

Veamos ahora tres situaciones prácticas para introducir el ANOVA de tres factores:

Vamos a empezar a ver ahora una serie de vídeos que nos permitirán ver distintos ejemplos de modelos de ANOVA de tres factores:

Con esto hemos visto los principales conceptos de ANOVA. A partir de ahora sólo veremos ejemplos que permitan dar solidez a estos conceptos. Os pondré ejemplos de exámenes. Si queréis ir anticipandoos en el apartado de problemas y exámenes hay situaciones titulades “Examen de ANOVA”, allí encontraréis material para repasar estos conceptos.