Archivo del Autor: estadisticallopis

Situación 129: Problemas ANOVA

1.Tenemos que estudiar la calidad del producto de los operarios de una empresa. Cogemos tres operarios al azar para el estudio. Queremos ver, también, la influencia de las máquinas con las que se trabaja. Se eligen tres de las veinticinco que hay en la empresa. Cada trabajador opera con cada máquina para elaborar dos productos. Se estudia la calidad del 0 al 10 del producto final. La tabla ANOVA es la siguiente. Completarla:

A=Factor operario

B=Factor máquina

2.Tenemos el mismo caso que el estudio anterior pero ahora la diferencia es que sólo se cogen dos operarios y dos máquinas y el producto final que elaboran se estudia por parte de ocho evaluadores distintos. Cada evaluador estudia las dos réplicas de una única combinación de operador y máquina. Cada combinación de operador y máquina la estudian dos evaluadores. La tabla ANOVA es la siguiente. Completarla:

A=Factor operario

B=Factor máquina

C=Factor evaluador

3.Tenemos la intención de estudiar el nivel de limpieza de todas las playas en poblaciones superiores a 5.000 habitantes en el litoral catalán. Se eligen dos playas al azar para hacer el estudio. Se eligen, al mismo tiempo, tres subzonas en cada una de las playas porque se quiere evaluar, también, la heterogeneidad interna. Cada muestra se evalúa mediante dos sistemas de medida que se pretende comparar. Se hacen dos réplicas. La tabla ANOVA es la siguiente. Completarla:

A=Factor playa

B=Factor sistema de medida

C=Factor subzona de la playa

4. En un proceso industrial queremos evaluar dos clases de levadura, dos tipos de azúcar y dos temperaturas. Para ello se realizan todas las combinaciones posibles de los tres factores. Se realizan dos réplicas por cada condición experimental. La tabla ANOVA es la siguiente. Completarla.

A=Factor levadura

B=Factor azúcar

C=Factor temperatura

5. En un proceso industrial queremos evaluar la variabilidad introducida por los operarios y, al mismo tiempo, queremos ver cómo influyen dos clases distintas de levadura y dos temperaturas diferentes. Para ello se realizan todas las combinaciones posibles de los tres factores. Se realizan dos réplicas por cada condición experimental. La tabla ANOVA es la siguiente. Completarla.

A=Factor operario

B=Factor levadura

C=Factor temperatura

Situación 128: Trabajo Estadística Oceanografía

Se ha hecho un estudio en dos zonas marinas que se quieren comparar. Se han hecho 20 observaciones en cada zona. Se ha analizado la temperatura, la salinidad, la abundancia relativa de la Especie A (especie del fitoplancton siempre presente) y la presencia o ausencia (1ó 0, respectivamente), en la muestra, de la Especie B y de la especie C.

Los resultados obtenidos son los siguientes:

ZONA TEMP SAL EspA EspB EspC
1 12,4 35,6 1,31 1 0
1 13 35,8 1,30 0 1
1 12,3 34,7 1,25 0 1
1 12,8 34,7 1,30 0 1
1 12,9 35,9 1,37 0 1
1 13,1 34,6 1,37 0 0
1 13,2 35,7 1,40 0 0
1 13,1 34,7 1,38 1 0
1 12,8 34,7 1,32 1 0
1 12,9 35,9 1,31 1 0
1 13 34,6 1,30 1 1
1 12,3 34,7 1,30 0 1
1 12,8 34,7 1,34 0 1
1 12,9 35,9 1,38 0 1
1 13,1 34,6 1,36 0 0
1 13,2 35,9 1,33 1 0
1 14 34,6 1,42 1 0
1 13,1 34,7 1,35 0 0
1 12,8 34,7 1,34 0 0
1 12,9 35,9 1,38 0 1
1 13,1 34,7 1,38 1 0
1 12,8 34,7 1,32 1 0
1 12,9 35,9 1,31 1 0
1 13,1 34,6 1,36 0 0
1 13,2 35,9 1,33 1 0
1 14 34,6 1,42 1 0
1 13,1 34,7 1,35 0 0
1 12,8 34,7 1,34 0 0
1 12,9 35,9 1,38 0 1
1 13,1 34,7 1,38 1 0
1 12,8 34,7 1,32 1 0
1 12,9 35,9 1,31 1 0
1 13 34,6 1,30 1 1
1 12,3 34,7 1,30 0 1
1 12,8 34,7 1,34 0 1
1 12,8 34,7 1,30 0 1
1 12,9 35,9 1,37 0 1
1 13,1 34,6 1,37 0 0
1 13,2 35,7 1,40 0 0
1 13,1 34,7 1,38 1 0
2 14 35,8 1,50 0 1
2 14,3 34,7 1,46 1 1
2 14,4 34,7 1,49 0 1
2 13,9 35,9 1,43 1 0
2 13,8 34,6 1,38 0 1
2 14,6 35,7 1,49 1 0
2 14,4 34,7 1,45 1 0
2 13,9 35,8 1,44 1 0
2 13,8 34,7 1,43 1 0
2 13,9 34,7 1,44 1 0
2 13,8 35,9 1,45 1 1
2 14,6 34,6 1,53 0 1
2 13,9 35,7 1,40 0 1
2 13,8 34,7 1,44 1 1
2 13,9 34,7 1,41 0 1
2 13,8 35,9 1,39 0 0
2 14,6 34,6 1,50 1 0
2 14,4 34,7 1,52 0 1
2 13,9 34,7 1,44 1 0
2 14,6 35,9 1,50 1 0
2 14,4 34,7 1,49 0 1
2 13,9 35,9 1,43 1 0
2 13,8 34,6 1,38 0 1
2 14,6 35,7 1,49 1 0
2 14,4 34,7 1,45 1 0
2 13,9 35,8 1,44 1 0
2 14,4 34,7 1,49 0 1
2 13,9 35,9 1,43 1 0
2 14,4 34,7 1,49 0 1
2 13,9 35,9 1,43 1 0
2 13,8 34,6 1,38 0 1
2 14,6 35,7 1,49 1 0
2 14,4 34,7 1,45 1 0
2 13,9 35,8 1,44 1 0
2 14,4 34,7 1,49 0 1
2 14,6 34,6 1,53 0 1
2 13,9 35,7 1,40 0 1
2 14,4 34,7 1,52 0 1
2 13,9 34,7 1,44 1 0
2 14,6 35,9 1,50 1 0
  1. Hacer una descriptiva de la variable TEMPERATURA.
  2. Hacer una descriptiva de la variable Especie C.
  3. Analizar si es posible, y con qué calidad, pronosticar la abundancia de la Especie A a partir de la temperatura.
  4. Comprobar si hay relación entre la presencia o ausencia de las Especies B y C.
  5. Comprobar si hay diferencias estadísticamente significativas en las dos zonas en cuanto a la variable TEMPERATURA.

ANOVA de tres factores

Al tratar con tres factores las posibilidades de combinación se multiplican. Los factores pueden estar cruzados, anidados, pueden ser fijos aleatorios, en diferentes combinaciones, como ahora veremos.

Vamos a ver algunos posibles modelos de tres factores y su resolución en los cocientes de cuadrados medios para evaluar los posibles efectos del modelo en los correspondientes contrastes de hipótesis.

El primero es un modelo de tres factores cruzados fijos:

A partir de estas esperanzas de los cuadrados medios obtenidas mediante el Algoritmo de Bennet-Franklin podemos ver que en todos los contrastes de hipótesis de los siete efectos que se pueden evaluar el cociente de cuadrados medios será el del efecto a evaluar dividido por el residuo. Este es el caso más sencillo de todos los que veremos.

Veamos ahora una caso en el que los tres factores están cruzados pero uno es aleatorio y los otros dos fijos:

Ahora los cocientes a realizar, si observamos con atención las esperanzas de los cuadrados medios, son los siguientes:

Veamos ahora que son dos los factores aleatorios que están cruzados:

A la hora de hacer los contrastes de hipótesis no encontramos con un único problema. A la hora de contrastar el efecto del factor C, del fijo, vemos que en el denominador para poder dividir dos términos cuyas esperanzas, si es cierta la hipótesis nula, sean iguales, debemos hacer una combinación de cuadrados medios:

Veamos ahora el caso en que los tres factores cruzados son aleatorios:

 

En los contrastes en los efectos individuales de los tres factores debemos buscar combinaciones en el denominador:

Veamos ahora casos donde no están los tres cruzados. Veamos primero un caso donde un primer factor está cruzado con el segundo. Ambos fijos. Y un tercer factor aleatorio está anidado en el primero:

Veamos un caso como el anterior pero en el que los dos factores que están anidados,  jerarquizados, son, ambos, aleatorios:

Los cocientes son claros: Para el efecto A dividiremos MSA por MSC(A) porque si fuese cierta la hipótesis nula de que no hay Efecto de A entonces estaríamos dividiendo dos cuadrados medios con la misma esperanza. Y aquí está la clave: Se trata siempre de dividir dos cuadrados medios que si es cierta la hipótesis nula apunten en la misma dirección y, por lo tanto, el cociente será un valor pequeño, próximo a 1 y si, por el contrario, el cociente en grande será porque la hipótesis nula de que no hay efecto no es posible mantenerla. Esta es la clave, siempre, a la hora de resolver un modelo ANOVA.

Por lo mismo para el efecto B dividiremos MSB por MSAB, para el efecto C(A) dividiremos MSC(A) por MSE, para el efecto AB dividiremos MSAB por MSBC(A) y, finalmente, para el efecto BC(A) dividiremos MSBC(A) por MSE.

Veamos una versión como esta pero en la que los tres factores son aleatorios:

Los cocientes ahora serán los siguientes:

Observemos especialmente el primer cociente en el que en el denominador debe buscarse una combinación de cuadrados medios cuya esperanza sea la misma que en el numerador si la hipótesis nula fuese cierta.

Veamos ahora un caso de dos factores cruzados fijos y un tercer factor, aleatorio, anidado en los dos primeros, cosa que suele decirse que está anidado en la interacción:

Como puede verse al valorar tanto el efecto de A, como el de B, como el de la interacción AB deberemos dividir por MSC(A,B). El efecto de C(A,B) lo evaluaremos dividiendo por el residuo.

Veamos el mismo caso que el anterior pero en el que el tercer factor anidado es fijo:

Aquí todos los contrastes los realizaremos dividiendo por el residuo MSE.

Veamos el mismo caso que los dos anteriores pero en el que los tres factores fuesen aleatorios:

Par evaluar el efecto de A dividiremos por MSAB, el de B también por MSAB, el efecto de AB por MSC(A,B) y el efecto de C(A,B) dividiremos por el residuo MSE.

 

Veamos ahora el caso de un factor fijo, uno aleatorio anidado en él y un tercero, también aleatorio, anidado en el segundo y, por lo tanto, también en el primero:

Para evaluar el efecto de A dividiremos por  MSB(A), para evaluar el efecto de B(A) dividiremos por MSC(A,B) y para evaluar el efecto de C(A,B) dividiremos por MSE.

Un modelo más de forma rápida: Si en el modelo tenemos que los tres factores son aleatorios, el único cero que hay en la matriz sería un 1, pero se puede comprobar fácilmente que eso no cambiaría para nada las esperanzas de los cuadrados medios ni, por supuesto los cocientes a realizar.

 

Solución Situación 125

Estamos ante tres factores: Embalse, Subzona (ambos aleatorios) y Técnica (fijo).

Subzona está anidado en Embalse. Técnica está cruzado con los otros dos.

El modelo es el siguiente:

Son cinco los efectos a evaluar.

La clave son los cocientes a hacer.

Viendo los datos parece claro que lo que será claramente significativa es la variabilidad interna dentro de cada embalse del nivel del contaminante.

Situación 127: ANOVA

Supongamos que hemos tomado tres embalses españoles al azar con la voluntad de conocer la variabilidad que hay en ellos de un determinado contaminante. Tomamos tres subzonas en cada embalse para conocer la variabilidad interna dentro de los embalses. Queremos también conocer si las diferentes técnicas definidas para evaluar este contaminante presentan variación. Para ello elegimos dos de ellas al azar y las evaluamos por triplicado en cada muestra que tenemos. Los resultados son los siguientes:

¿Qué modelo tenemos?

¿Cuál es la solución? ¿Cuáles son los efectos significativos?

Situaciones de comparación de dos poblaciones en el mundo Pokémon

Todo lo preparado en este fichero lo ha hecho un alumno al que quisiera agradecer mucho el trabajo realizado. Su nombre es Manel Montblanch Berga.

1. Se ha pedido si se sabía cómo afectaba la pesca de arrastre a las poblaciones de Horsea a 50 estudiantes de Submarinismo y 50 Entrenadores Pokemon. La muestra se ha tomado en igualdad de edades y proporción de sexos. Entre los estudiantes de Submarinismo 14 de los 50 han sabido responder bien a la pregunta y, entre los entrenadores, sólo 5 de 50 lo han hecho correctamente. A partir de este estudio y de esta muestra, ¿se puede decir que hay diferencias, estadísticamente significativas, entre estas personas con diferente oficio/estudios en cuanto al efecto causado por la pesca de arrastre a las poblaciones de Horsea?

2. Se ha aplicado un tratamiento de Bayas Atania para relajar a unos Tentacruel salvajes machos y hembras adormilados en medio de la ruta 118 en Hoenn. En las Tentacruel hembras 5 de 20 respondían favorablemente al tratamiento, en los Tentacruel macho 3 de 20 eran los que respondían favorablemente. ¿Se puede decir que hay diferencias significativas entre sexos en cuanto a la respuesta a este tratamiento?

3. Un centro de investigación de energías naturales que pretende usar la electricidad de Chinchou bien cuidados en las mismas condiciones, decide hacer el siguiente estudio piloto. A un grupo de 100 Chinchou se les ha examinado mediante dos test de electricidad de distintos ataques eléctricos. En primer lugar, a 50 de ellos se les ha pedido que usen impactruenos en una diana con un voltímetro y a otros 50 que usen chispa en otras dianas con voltímetros. Una vez hecho el primer test, se les daban 4 horas de descanso a todos y, luego, cada Chinchou hacia el otro modelo de test. Cada test se evaluaba con un rango de 100 a 1000 voltios, pero, en realidad se quería ver si llegaban o no a los 500 voltios (>500 voltios= apto) con cada ataque porque lo que se quería ver era si el porcentaje de aptos sería el mismo o no usando diferentes ataques. Los resultados obtenidos fueron los siguientes: El ataque impactrueno el 60% fue apto y el ataque chispa el 48% lo fue, con este desglose por subgrupos de valores de la variable:

4. Se quiere comparar las velocidades que pueden alcanzar los Finneon y su evolución Lumineon. Para ello se han usado 9 Finneon de entrenadores y 9 Lumineon de otros entrenadores, todos ellos voluntarios. Mediante una serie de pruebas de natación se evalúan las velocidades de cada uno de estos Pokemon. Las velocidades se miden en metros/segundos y los valores obtenidos son los siguientes:

 

¿Podemos decir que hay diferencias estadísticamente significativas en cuanto a las velocidades de ambas evoluciones de Pokemon?

5. Estamos comparando la cantidad de Slowpoke atacados por la caza furtiva con el fin de comercializar sus colas como alimento que hubo en las regiones de Hoenn y Kalos. En Hoenn hubo 8 acontecimientos y en Kalos 7. Una vez completado los recuentos obtuvimos la siguiente tabla:

¿Podemos afirmar que las diferencias son estadísticamente significativas?

6.Hemos tomado 14 Spheals de entrenadores y entrenadoras al azar del club náutico de Alola (8 machos y 6 hembras) y hemos visto cuantas volteretas pueden dar seguidas. Los resultados obtenidos son los siguientes:

¿Podemos afirmar que las diferencias son estadísticamente significativas?

7. Se ha realizado un estudio sobre la producción de toxinas creadas por Mareanie en diversos puntos de las costas de la ruta 13 en Teselia, y al cabo de 4 años se ha repetido el mismo estudio en las mismas zonas. Se trataba de ver si la producción de toxinas había disminuido o serían estables. Los resultados fueron los siguientes:

¿Podemos afirmar que hay diferencias estadísticamente significativas entre los dos tiempos?

8. Estamos analizando el número de “blooms” bioluminiscentes causados por dinoflagelados que ha habido del día 1 al 9 de mayo, realizando una cuenta diferente cada día, y el número de “blooms” que ha habido los mismos días, pero en el mes de septiembre:

¿Podemos afirmar que hay diferencias significativas entre los dos meses?

Situaciones de comparación de dos poblaciones en Ciencias del Mar

Todo lo preparado en este fichero lo ha hecho un alumno al que quisiera agradecer mucho el trabajo realizado. Su nombre es Arnau Subías Baratau.

1.Se ha estudiado la presencia de microplásticos en dos poblaciones de 50 individuos de zooplancton. La primera población se encontraba en el Océano Índico y la segunda en el Océano Antártico. En la población del Índico, 14 de 50 presentaban microplásticos en su interior, en la del Antártico, sólo 5 de 50. ¿Se puede decir que hay diferencias, estadísticamente significativas, entre estos dos grupos de zooplancton, en cuanto a la presencia de microplásticos dependiendo de su localización?

2.Se ha preguntado a un grupo de mujeres y hombres si estaban de acuerdo con la aplicación de bolsas hidrosolubles para reducir la contaminación oceánica causada por los residuos plásticos. Entre las mujeres 5 de 20 personas estaban de acuerdo con la iniciativa, entre los hombres, sólo 3 de 20 estaban de acuerdo con la iniciativa. ¿Se puede decir que hay diferencias significativas entre sexos en cuanto a la opinión sobre tal iniciativa?

3.Se ha realizado un estudio para estudiar la acidificación en un grupo de 100 corales rojos. Cada coral se colocaba en dos medios con pH diferente. En primer lugar, a 50 de ellos se les colocaba en el medio A y a los otros 50 en el medio B, de pH un poco más ácido, durante un mes. Se dejaba entonces a todos ellos un mes en un medio de igual pH y, al mes siguiente, se colocaba a cada coral en el otro medio. La variable contemplada era si la tonalidad roja del coral (evaluada entre el 0 y el 10), durante el mes que vivía en el medio, era o no superior a 5. Los resultados obtenidos fueron los siguientes:

¿Se puede decir que el porcentaje de los que tienen igual o más de 5 de tonalidad de color rojo es distinto según el tratamiento A o el B?

4.Se quiere analizar la eficacia de un geolocalizador en una población de tiburón blanco. Para ello, se utilizan 18 individuos de tiburón y, a 9 de ellos se les aplica el geolocalizador A y a los 9 restantes el geolocalizador B. La eficacia de dicho localizador se valora del 0 al 10:

¿Podemos decir que hay diferencias estadísticamente significativas en cuanto a la eficacia de ambos geolocalizadores?

5.Estamos analizando la presencia de erizos de mar en las Islas Baleares y en las Islas Canarias. Para ello delimitamos 8 zonas costeras en las Baleares i 7 en las Canarias. Una vez hecho esto apuntamos la cantidad de erizos que observamos en cada zona:

¿Podemos afirmar que las diferencias entre Baleares y Canarias, en cuánto a la presencia de erizos, son estadísticamente significativas?

6.Estamos comparando la cantidad de huevos de tortuga que hay en dos playas diferentes de Costa Rica. En la primera playa se consigue observar la puesta de huevos de 8 tortugas y en la segunda, sólo de 6. En cada puesta se cuentan los huevos que hay:

¿Podemos afirmar que las diferencias son estadísticamente significativas?

7.Se ha analizado la concentración de fitoplancton (en alguna unidad característica) en una serie de zonas oceánicas alrededor del mundo. Dicho análisis se ha hecho dos veces en cada zona, uno en el mes de abril y otro en agosto:

¿Podemos decir que hay un descenso significativo de la concentración de fitoplancton dependiendo del mes en que nos encontremos?

8.Estamos analizando el número de “blooms” bioluminiscentes causados por dinoflagelados que ha habido del día 1 al 9 de mayo, realizando una cuenta diferente cada día, y el número de “blooms” que ha habido los mismos días, pero en el mes de septiembre:

¿Podemos afirmar que hay diferencias significativas entre los dos meses?

Situación 126: ANOVA

Se quiere estudiar los embalses españoles para conocer la variabilidad de un contaminante. Se quiere evaluar, también, la variabilidad entre un pool amplio de técnicas que se ofrecen para cuantificar ese contaminante. Para ello se toman tres embalses, al azar, para estudiar. Se eligen dos técnicas al azar también. En cada muestra de cada embalse se aplica cada una de las dos técnicas en un laboratorio de referencia de las tres universidades más próximas al embalse. Se decide que cada muestra la analicen dos operarios distintos. En total participan 12 operarios. Cada operario hace tres réplicas.

Los resultados son los siguientes:

Evaluar el modelo ANOVA y resolverlo.