Archivo del Autor: estadisticallopis

Situación 120: Examen (Tema 16)

Queremos determinar el tamaño de muestra en una comparación de medias. La variable es la reducción media del MiniMental de pacientes con Alzhéimer durante un año de tratamiento. Se pretende comparar dos tratamientos distintos a dos grupos de pacientes con las mismas características promedio.

En un estudio previo piloto hecho con estos tipos de tratamientos la desviación estándar de esa reducción durante un año era, aproximadamente, de 2.

La diferencia mínima a detectar entre las reducciones, entre ambos tratamientos, es 1.

Queremos tener una potencia del 95%.

¿Cuál es el tamaño que necesitamos por grupo?

Situación 119: Examen (Tema 23)

Construir a partir de los datos de los Box-Plot siguientes, una curva ROC y calcular la AUC que evalúe la capacidad del PSA total y de la Relación PSA libre/PSA total (FT Ratio) para distinguir entre Cáncer de próstata (CaP) e Hipertrofia benigna de próstata (BPH).

Es evidente que estas construcciones en base a este gráfico únicamente puede ser aproximada.

Situación 118: Examen (Temas 1-3)

1. El valor 5, en la muestra (1, 4, 6, 6, 7, 7, 11, 12, 16), es:

a. El primer cuartil.

b. La mediana.

c. El rango intercuartílico.

d. El percentil 30.

2. ¿Cuál de los siguientes Box-Plot es el correspondiente a la muestra (2,3,4,6,6,9,10,12,12)?

IMG_0073

3.Si en un estudio sobre la prevalencia de una enfermedad psiquiátrica tenemos una muestra de tamaño 100 de los cuales 8 tienen esa patología, un intervalo de confianza del 95% del porcentaje poblacional será:

a)(3.51, 12.49)

b)(2.57, 13.43)

c)(6.70, 9.30)

d)(4.00, 12.00)

4.En un estudio vemos que nos dan el siguiente intervalo de confianza del 95% de la media: (48, 52). Leemos que el tamaño de muestra ha sido 100. ¿Cuál es el intervalo de confianza del 95% descriptivo de la variable o, también denominado, intervalo de valores individuales de esa variable?

a)(40, 60)

b)(35, 65)

c)(30, 70)

d)(45, 55)

5.¿En cuál de las siguientes muestras el percentil 25 es 5?

a)(1, 5, 6, 10)

b)(1, 5, 5, 8, 12)

c)(1, 3, 5, 3, 7)

d)(1, 5, 5, 6)

6. El valor 4 en la muestra (1, 4, 6, 6, 7, 7, 10, 12) es:

a. El primer cuartil.

b. El percentil 14.28.

c. El rango intercuartílico.

d. El percentil 12.5.

7.¿En cuál de las siguientes muestras el percentil 20 es 5?

a)(1, 4, 5, 10,10, 10, 10, 10, 11, 12)

b)(1, 3, 5, 8, 12, 13, 14, 15, 16)

c)(1, 3, 5, 6, 7, 7, 8, 9, 9, 14, 17, 45)

d)(1, 3, 5, 6, 7, 7, 8, 11, 13, 14, 16)

8.Si en un estudio sobre la prevalencia de una enfermedad psiquiátrica tenemos una muestra de tamaño 100 de los cuales 12 tienen esa patología, un intervalo de confianza del 99.5% del porcentaje poblacional será:

a)(5.50, 18.50)

b)(10.50, 13.50)

c)(2.25, 21.75)

d)(3.75, 20.25)

9.En un estudio vemos que nos dan el siguiente intervalo de confianza descriptivo del 95%: (48, 52). Leemos que el tamaño de muestra ha sido 100. ¿Cuál es el intervalo de confianza de la media del 95%?

a)(40, 60)

b)(49.8, 50.2)

c)(30, 70)

d)(49, 51)

10.El siguiente Box-Plot

¿a qué muestra corresponde?

a)(2, 3, 6, 8, 12)

b)((2, 2, 3, 3, 6, 6, 8, 12)

c)(2, 4, 4, 6, 8, 8, 12, 12)

d)(2, 4, 6, 8, 12)

 

Situación 117: Base de datos de Alzhéimer

La siguiente base de datos de pacientes controles y pacientes con diagnóstico de Alzhéimer tiene las siguientes variables. Todos tienen entre 70-75 años:

P=Número de Paciente

G=Grupo (Control, Alzhéimer)

S=Sexo

E=Edad

D=Diabetes mellitus

H=Hipertensión

A=Antecedente familiar de Alzhéimer

MM0=Valor del Mini-Mental State Examination (MMSE) en el diagnóstico o en el momento del control

MM5=Valor del Mini-Mental a los 5 años

P G S D H A MM0 MM5
1 Control h No No No 29 29
2 Control h No No No 28 28
3 Control h Si Si No 27 27
4 Control h No No No 27 27
5 Control h No No No 28 23
6 Control m Si Si No 30 29
7 Control h Si No No 28 28
8 Control m No Si No 28 28
9 Control h No Si Si 28 28
10 Control m Si No Si 28 28
11 Control h Si No No 28 30
12 Control m No Si No 27 29
13 Control m No No No 29 27
14 Control h Si No Si 27 26
15 Control m No Si No 30 30
16 Control m No Si No 27 28
17 Control h Si No No 28 26
18 Control h No No No 29 28
19 Control h No Si No 29 28
20 Control m Si Si No 28 28
21 Control m Si No No 28 27
22 Control h No No Si 27 27
23 Control h No Si No 30 30
24 Control m Si Si No 28 28
25 Control m Si Si No 27 21
26 Control m No No No 28 28
27 Control m No No No 28 28
28 Control m No Si No 29 29
29 Control h No Si No 27 27
30 Control m No No No 29 22
31 Control m Si No No 29 29
32 Control h No No No 28 28
33 Control m Si Si No 27 27
34 Control m No No No 27 27
35 Control h No No No 27 27
36 Control h Si Si Si 30 29
37 Control h No No No 28 28
38 Control m No No No 28 28
39 Control m Si Si No 28 28
40 Control h Si No No 28 28
41 Control h No Si No 28 30
42 Control m No Si No 27 29
43 Control m Si No Si 29 27
44 Control m Si No No 27 26
45 Control m No Si No 30 30
46 Control m No No No 27 28
47 Control h Si No Si 26 26
48 Control h No Si No 29 28
49 Control h No Si No 29 28
50 Control m Si No No 28 28
51 Alzhéimer h No Si No 21 18
52 Alzhéimer m No Si No 21 16
53 Alzhéimer m Si No No 22 17
54 Alzhéimer m Si No Si 21 16
55 Alzhéimer m No Si Si 23 18
56 Alzhéimer h No No Si 22 16
57 Alzhéimer m Si No No 23 18
58 Alzhéimer m No Si Si 21 16
59 Alzhéimer m No No Si 23 18
60 Alzhéimer h Si No Si 22 16
61 Alzhéimer h No Si No 23 18
62 Alzhéimer m No Si Si 21 18
63 Alzhéimer m Si No Si 24 20
64 Alzhéimer m Si No Si 21 16
65 Alzhéimer m No No Si 22 15
66 Alzhéimer h No No Si 21 16
67 Alzhéimer m Si Si No 21 17
68 Alzhéimer m Si No No 22 17
69 Alzhéimer m No No Si 24 20
70 Alzhéimer m No Si No 24 19
71 Alzhéimer m No Si No 23 18
72 Alzhéimer h No No No 22 16
73 Alzhéimer m Si No No 23 18
74 Alzhéimer m No Si Si 21 16
75 Alzhéimer m No No No 23 18
76 Alzhéimer h Si No No 22 16
77 Alzhéimer h No Si No 23 18
78 Alzhéimer m No Si Si 21 18
79 Alzhéimer m Si No Si 24 20
80 Alzhéimer m Si No Si 21 16
81 Alzhéimer m No No Si 22 15
82 Alzhéimer h No No Si 21 16
83 Alzhéimer m Si Si Si 21 17
84 Alzhéimer h No Si Si 21 18
85 Alzhéimer m No Si No 21 16
86 Alzhéimer m Si No No 22 17
87 Alzhéimer m Si No Si 21 16
88 Alzhéimer m No Si No 23 18
89 Alzhéimer h No No No 22 16
90 Alzhéimer m Si No No 23 18
91 Alzhéimer m No Si Si 21 16
92 Alzhéimer m No No No 23 18
93 Alzhéimer h Si No No 22 16
94 Alzhéimer h No Si No 23 18
95 Alzhéimer m No Si Si 21 18
96 Alzhéimer m Si No Si 24 20
97 Alzhéimer m Si No No 21 16
98 Alzhéimer m No No No 22 15
99 Alzhéimer h No No Si 21 16
100 Alzhéimer m Si Si No 21 17

Preguntas:

Bloque 1:

  1. Hacer una estadística descriptiva numérica y gráfica de la variable MM0 del grupo control y del grupo de pacientes con Alzhéimer, por separado.
  2. Hacer una estadística descriptiva de la variable Antecedentes familiares de Alzhéimer del grupo control y del grupo de pacientes con Alzhéimer, por separado.
  3. Construir un intérvalo de confianza de la media del 95% de la variable MM de pacientes sin diagnóstico de Alzhéimer.

Bloque 2:

  1. Calcular la correlación entre las variables MM0 y MM5 en los pacientes con Alzhéimer.
  2. Construir una ecuación matemática para predecir la variable MM5 a partir de la variable MM0 en pacientes con Alzhéimer.
  3. ¿Hay relación entre el tener o no hipertensión  y tener o no Alzhéimer? Si la hay mide con algún índice la cantidad de relación que hay.
  4. Calcular la Odds ratio de la exposición “Tener antecedentes de Alzhéimer en la familia” con la enfermedad de Alzhéimer.

Bloque 3:

  1. Comparar si hay diferencia estadísticamente significativa en el MM a los cinco años de diagnóstico entre los que, teniendo Alzhéimer, tienen o no antecedentes de Alzhéimer en la familia.
  2. Comparar si hay diferencia estadísticamente significativa entre hombres y mujeres que tienen Alzhéimer en cuanto al nivel de MM a los cinco años del diagnóstico.

Situación 116: Examen (Temas 1-16)

1.En la muestra (1, 1, 3, 3, 5) y en la muestra (1, 3, 5, 5, 7) es cierto:

a.La medianas son iguales.

b.Los intervalos de confianza de la media son iguales.

c.Los rangos intercuartílicos son iguales.

d.Los rangos son los mismos.

2.En dos estudios distintos tenemos las siguientes correlaciones r=0.5 (p=0.1) y r=0.2 (p=0.03). ¿Cuál de las siguientes afirmaciones no es cierta?:

a.La correlación r=0.5 no es fiable porque tiene un p-valor superior a 0.05.

b.La correlación r=0.5 tiene suficiente capacidad predictiva, la correlación r=0.2 no la tiene.

c.El tamaño de muestra usado es muy superior en el de la correlación r=0.2.

d.La correlación r=0.5 puede considerarse superior a la correlación r=0.2 debido a los p-valores que se obtienen.

3.Estamos interesados en saber en cuántos lugares a lo largo de un río se supera un cierto nivel de un contaminante. Para ello se toman al azar 400 muestras a lo largo del río. En 200 de ellas se supera ese nivel. Un intervalo de confianza del 95% del porcentaje de puntos del río donde se supera dicho nivel es:

a.(40.0, 60.0).

b.(45.0, 55.0).

c.(49.0, 51.0).

d.(35.0, 65.0).

4.¿Cuál de las siguientes afirmaciones es cierta?

a.La ji-cuadrado evalúa si hay relación entre dos variables cuantitativas.

b.Un coeficiente de determinación superior al 90% lo consideraremos como buena capacidad predictiva si el p-valor de la pendiente es mayor de 0.05.

c.Si la V de Crámer es cero el p-valor también será uno.

d.Si la tabla de contingencias observada y la tabla de contingencias esperada son distintas el p-valor será menor de 0.05.

5.En cuál de las siguientes afirmaciones hay una incoherencia:

a)y=0.03x+20; p-valor de la pendiente de 0.03; IC del 95% de la correlación (0.3, 0.5).

b)y=-3x+3; p-valor de la pendiente de 0.001; IC del 95% de la correlación (0.5, 0.8)

c)y=13x-33; IC del 95% de la pendiente de 0.71; IC del 95% de la correlación (-0.2, 0.6)

d)y=5x+5; p-valor de la pendiente de 0.43; IC del 95% de la correlación (-0.1, 0.4).

6.Estamos tratando de asociar la presencia o la ausencia de una especie A con la presencia o ausencia de una especie B en muestras marinas de distintas zonas del mediterráneo. Hemos calculado la ji-cuadrado y nos da un valor de 4.41. Podemos afirmar:

a.Que hay una relación estadísticamente significativa entre esas dos variables.

b.Debemos calcular la correlación y ver su p-valor para poder afirmar que hay relación estadísticamente significativa.

c.Necesitamos saber el valor de V de Crámer para poder evaluar si hay o no relación.

d.Necesitamos saber el tamaño de muestra es superior a 100 para poder decir que es significativa esa relación.

7.¿Cuál de las siguientes afirmaciones no es cierta?:

a.En un test kappa podemos evaluar si hay concordancia entre un operador y él mismo.

b.El p-valor de una comparación puede ser superior a 0.05 y el estudio no tener valor por falta de potencia estadística.

c.Si queremos aumentar la potencia estadística de un test deberemos aumentar el tamaño de muestra.

d.Una V de Crámer menor del 50% indica que no hay buena capacidad predictiva.

8.En una Regresión lineal simple es cierto:

a.Si la R2 es superior al 50% tenemos una relación estadísticamente significativa.

b. La R2 es un valor que va de -1 hasta +1.

c.Si la pendiente es 0.3, la correlación también será 0.3, porque siguen la misma suerte.

d.Si la pendiente es negativa y significativa el intervalo del 95% de la correlación no pasará por el cero.

9.Estamos relacionando en cuatro zonas distintas la presencia de cuatro especies distintas del zooplancton. Hemos aplicado una ji-cuadrado y el valor es 12.12. Entonces:

a.Podemos decir que no hay relación porque 12.12 es menor que 26.29.

b.Podemos decir que hay relación porque 12.12 es menor que 26.29.

c.Podemos decir que no hay relación estadísticamente significativa porque no hemos superado el umbral.

d.Podemos decir que hay relación estadísticamente significativa porque 12.12 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 5 y tamaño muestral de 100 es:

a.(10, 30).

b.(19.5, 20.5).

c.(19, 21).

d.(18, 22).

11.¿Cuál de las siguientes afirmaciones no es cierta?

a.La potencia estadística requerida en un contraste de hipótesis es que sea igual o superior al 80%.

b.En una comparación de dos muestras relacionadas de variables dicotómicas la técnica adecuada al caso es el test de McNemar.

c.En una técnica de comparación de muestras independientes el tamaño muestral de ambas poblaciones no necesariamente debe ser el mismo.

d.Si en un ANOVA de dos factores la interacción es significativa (p-valor<0.05) como mínimo uno de los dos factores será también significativo (p-valor<0.05).

12.En un estudio donde se quiere comparar la cantidad de un contaminante en las playas de dos poblaciones distintas tenemos 100 observaciones en cada una de las dos playas. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor menor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a.Debemos aplicar el test de la t de Student para varianzas desiguales.

b.Debemos aplicar el test de la t de Student para varianzas iguales.

c.Debemos aplicar el test exacto de Fisher.

d.Debemos aplicar el test de Mann-Whitney.

13.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente aumentamos el tamaño de muestra de ambas poblaciones obteniendo la misma media y desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más alta de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más pequeña de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.51/0.27/0.15/0.01.

b.0.56/0.44/0.61/0.22.

c.0.02/0.07/0.001/0.15.

d.0.2/0.01/0.1/0.21.

14.Se analiza el porcentaje de una especie en el fitoplancton en 20 puntos del océano pacífico y 20 puntos del océano atlántico. En el pacífico en el 50% de puntos se ha superado un determinado umbral de contaminación y en el atlántico ha ocurrido sólo en el 30%. Queremos comparar si esa diferencia es estadísticamente significativa. Debemos aplicar:

a.El Test de proporciones.

b.El Test exacto de Fisher.

c.El Test de Wilcoxon.

d.El Test de McNemar.

15.Hemos analizado un contaminante en tres playas (Nivel 1, Nivel 2 y Nivel 3) de las que hemos elegido en cada una de ellas tres zonas al azar (SZ1, SZ2 y SZ3). Hemos evaluado la cantidad del contaminante por triplicado. Los resultados son los siguientes:

¿Cuál es la afirmación más razonable?:

a.Factor 1: p>0.05. Factor 2: p>0.05.

b.Factor 1: p>0.05. Factor 2: p<0.05.

c.Factor 1: p<0.05. Factor 2: p<0.05. Interacción: p>0.05.

d.Factor 1: p<0.05. Factor 2: p<0.05. Interacción: p>0.05.

16. En un estudio oceanográfico se han comparado tres zonas marítimas (Z1, Z2 y Z3) de las que se han tomado dos subzonas en cada una de ellas (SZ1 y SZ2). En cada subzona se ha tomado una muestra y se ha repartido en ocho recipientes. A doce estudiantes de oceanografía se les ha pedido que analizaran en cuatro de ellas, mediante una determinada técnica, la cantidad de una determina sustancia. Es cierto:

a.Tenemos dos factores: Zona y subzona. Subzona anidado en zona.

b.Tenemos tres factores. Subzona anidado en zona y estudiante cruzado con zona y subzona.

c.Tenemos tres factores. Subzona anidado en zona y estudiante anidado en subzona.

d.Tenemos tres factores: Zona, subzona y estudiante. Los tres cruzados dos a dos.

17.¿Qué error podríamos estar cometiendo si al comparar dos tratamientos tenemos una potencia del 95% y el p-valor que obtenemos es de 0.1?

a.No podemos cometer error porque la potencia estadística es superior al 80%.

b.El error de tipo I.

c.El error de tipo II.

d.Ambos errores: El error de tipo I y el error de tipo II.¡p

18.¿Cuál de las siguientes afirmaciones es cierta?

a.Una potencia del 80% se corresponde con un error de tipo I de 0.20.

b.En dos muestras independientes que no se ajustan a la normalidad y no hay igualdad de varianzas se aplica el Test de Mann-Whitney.

c.En un ANOVA de dos factores anidados la interacción entre ambos factores es siempre significativa.

d.Si se aplica en una comparación de dos poblaciones un test exacto de Fisher es que el tamaño de muestra es inferior a 30.

19.¿Cuál de las siguientes afirmaciones es cierta?:

a.En la predicción de un porcentaje para determinar el tamaño de muestra no necesitamos saber la desviación estándar.

b.En un ANOVA de tres factores siempre tenemos interacción.

c.En un contraste de hipótesis donde comparemos medianas la hipótesis nula es que hay diferencia entre medianas.

d.En una comparación de dos poblaciones cuanta mayor desviación tengamos más difícil será rechazar la hipótesis nula.

20.Se quiere hacer un pronóstico del porcentaje de peces de una especie que en el mediterráneo tienen un nivel de un contaminante por encima de un cierto umbral. ¿Qué tamaño muestral de peces necesitamos tomar para tener un intervalo del 95% con un radio de 10%?:

a.200.

b.400.

c.100.

d.500.

Situación 115: Un problema de ANOVA

1.Hemos elegido tres zonas que queremos expresamente estudiar. Hemos elegido dentro de cada una de ellas dos subzonas homogéneas y hemos aplicado en cada una de estas subzonas homogéneas una política medioambiental distinta entre dos que queremos expresamente comparar. Pasado un año en cada una de las zonas y en cada una de las políticas aplicadas hemos elegido tres subzonas y hemos tomado una muestra y hemos realizado el análisis de un contaminante por triplicado.

Los datos son los siguientes:

Zona Subzona Política Variable
a 1 1 3
a 1 1 4
a 1 1 2
a 1 2 6
a 1 2 7
a 1 2 8
a 2 1 3
a 2 1 4
a 2 1 3
a 2 2 6
a 2 2 7
a 2 2 7
a 3 1 3
a 3 1 4
a 3 1 1
a 3 2 6
a 3 2 7
a 3 2 9
b 1 1 3
b 1 1 4
b 1 1 3
b 1 2 6
b 1 2 7
b 1 2 7
b 2 1 3
b 2 1 4
b 2 1 3
b 2 2 6
b 2 2 7
b 2 2 7
b 3 1 3
b 3 1 4
b 3 1 3
b 3 2 6
b 3 2 7
b 3 2 7
c 1 1 3
c 1 1 4
c 1 1 2
c 1 2 6
c 1 2 7
c 1 2 9
c 2 1 3
c 2 1 4
c 2 1 3
c 2 2 6
c 2 2 7
c 2 2 7
c 3 1 3
c 3 1 4
c 3 1 3
c 3 2 6
c 3 2 7
c 3 2 8

¿Cuántas factores tenemos?

¿Fijos o aleatorios?

¿Dos a dos cómo están: cruzados o anidados?

¿Cuál es el modelo?

¿Qué factores te parecen significativos?

Situación 114: Problema práctico de Oceanografía

Tenemos la siguiente base de datos oceanográfica:

Z=Zona

BF=Biomasa del fitoplancton

BZ=Biomasa del zooplancton

P=Fósforo

N=Nitrógeno

D=Diversidad biológica

Z BF BZ P N D
1 34,0 32,2 36,7 33,7 1,8
1 34,4 34,1 46,4 37,3 1,9
1 35,2 34,5 46,5 36,6 2,7
1 44,6 43,6 45,1 47,4 2,3
1 45,6 44,6 48,2 44,9 2,3
1 46,1 44,1 65,7 46,4 2,7
1 46,6 46,3 57,9 53,9 2,6
1 39,8 37,7 52,3 40,1 2,2
1 40,3 38,6 48,0 47,7 2,0
1 41,3 38,8 60,3 45,2 2,1
1 42,2 40,8 58,3 47,2 2,3
1 42,8 40,8 53,5 41,5 2,4
1 43,3 40,9 43,4 47,7 2,6
1 43,7 41,2 45,5 43,2 2,6
1 43,8 43,4 44,2 48,0 2,7
1 44,6 41,9 47,8 44,4 2,5
1 45,6 42,8 53,9 52,2 2,4
1 46,1 43,6 46,3 45,8 3,3
1 46,6 43,6 54,7 53,0 3,0
1 47,1 44,4 53,5 44,9 2,8
2 47,9 46,5 50,7 54,1 3,3
2 47,9 45,4 51,7 49,2 3,2
2 48,4 46,7 64,3 54,5 2,8
2 52,5 49,9 69,9 56,7 3,6
2 53,0 50,7 57,2 57,2 3,4
2 53,0 52,5 65,3 61,7 3,6
2 53,5 51,8 66,7 52,8 3,5
2 53,9 51,1 61,3 60,4 3,5
2 54,7 52,9 56,3 59,0 2,8
2 51,5 50,2 58,0 55,0 3,5
2 52,3 51,6 61,4 58,2 3,1
2 52,5 52,0 72,0 57,2 2,7
2 53,0 52,3 69,8 61,2 3,4
2 53,0 51,1 53,1 59,2 2,7
2 55,6 53,1 61,7 60,1 3,4
2 53,9 51,5 54,0 56,6 2,8
2 54,7 53,0 67,8 58,5 3,1
2 55,1 52,9 75,2 62,4 3,4
2 55,6 54,2 59,2 61,9 3,5
2 56,0 54,2 60,1 61,7 2,8

Preguntas:

  1. Hacer un Box Plot de la Diversidad biológica de la Zona 1 y otro de la Zona 2.
  2. Comparar si hay diferencias estadísticamente significativas, en cuanto a la diversidad biológica, entre ambas zonas.
  3. Ver si hay relación estadísticamente significativa entre la biomasa del fitoplancton y la del zooplancton en todas las observaciones de la base de datos. Crear una ecuación que relacione ambas variables con la finalidad de hacer una predicción de la biomasa del zooplancton conociendo la biomasa del fitoplancton.
  4. Calcular la correlación entre la cantidad de fósforo y de nitrato en las aguas de la Zona 1.
  5. Ver si hay relación estadísticamente significativa entre que la cantidad de biomasa por fitoplanton sea mayor o no de 50 y que la diversidad biológica sea mayor o no de 3.