Archivo de la categoría: PROBLEMAS

Situación 116: Examen (Temas 1-16)

1.En la muestra (1, 1, 3, 3, 5) y en la muestra (1, 3, 5, 5, 7) es cierto:

a.La medianas son iguales.

b.Los intervalos de confianza de la media son iguales.

c.Los rangos intercuartílicos son iguales.

d.Los rangos son los mismos.

2.En dos estudios distintos tenemos las siguientes correlaciones r=0.5 (p=0.1) y r=0.2 (p=0.03). ¿Cuál de las siguientes afirmaciones no es cierta?:

a.La correlación r=0.5 no es fiable porque tiene un p-valor superior a 0.05.

b.La correlación r=0.5 tiene suficiente capacidad predictiva, la correlación r=0.2 no la tiene.

c.El tamaño de muestra usado es muy superior en el de la correlación r=0.2.

d.La correlación r=0.5 puede considerarse superior a la correlación r=0.2 debido a los p-valores que se obtienen.

3.Estamos interesados en saber en cuántos lugares a lo largo de un río se supera un cierto nivel de un contaminante. Para ello se toman al azar 400 muestras a lo largo del río. En 200 de ellas se supera ese nivel. Un intervalo de confianza del 95% del porcentaje de puntos del río donde se supera dicho nivel es:

a.(40.0, 60.0).

b.(45.0, 55.0).

c.(49.0, 51.0).

d.(35.0, 65.0).

4.¿Cuál de las siguientes afirmaciones es cierta?

a.La ji-cuadrado evalúa si hay relación entre dos variables cuantitativas.

b.Un coeficiente de determinación superior al 90% lo consideraremos como buena capacidad predictiva si el p-valor de la pendiente es mayor de 0.05.

c.Si la V de Crámer es cero el p-valor también será uno.

d.Si la tabla de contingencias observada y la tabla de contingencias esperada son distintas el p-valor será menor de 0.05.

5.En cuál de las siguientes afirmaciones hay una incoherencia:

a)y=0.03x+20; p-valor de la pendiente de 0.03; IC del 95% de la correlación (0.3, 0.5).

b)y=-3x+3; p-valor de la pendiente de 0.001; IC del 95% de la correlación (0.5, 0.8)

c)y=13x-33; IC del 95% de la pendiente de 0.71; IC del 95% de la correlación (-0.2, 0.6)

d)y=5x+5; p-valor de la pendiente de 0.43; IC del 95% de la correlación (-0.1, 0.4).

6.Estamos tratando de asociar la presencia o la ausencia de una especie A con la presencia o ausencia de una especie B en muestras marinas de distintas zonas del mediterráneo. Hemos calculado la ji-cuadrado y nos da un valor de 4.41. Podemos afirmar:

a.Que hay una relación estadísticamente significativa entre esas dos variables.

b.Debemos calcular la correlación y ver su p-valor para poder afirmar que hay relación estadísticamente significativa.

c.Necesitamos saber el valor de V de Crámer para poder evaluar si hay o no relación.

d.Necesitamos saber el tamaño de muestra es superior a 100 para poder decir que es significativa esa relación.

7.¿Cuál de las siguientes afirmaciones no es cierta?:

a.En un test kappa podemos evaluar si hay concordancia entre un operador y él mismo.

b.El p-valor de una comparación puede ser superior a 0.05 y el estudio no tener valor por falta de potencia estadística.

c.Si queremos aumentar la potencia estadística de un test deberemos aumentar el tamaño de muestra.

d.Una V de Crámer menor del 50% indica que no hay buena capacidad predictiva.

8.En una Regresión lineal simple es cierto:

a.Si la R2 es superior al 50% tenemos una relación estadísticamente significativa.

b. La R2 es un valor que va de -1 hasta +1.

c.Si la pendiente es 0.3, la correlación también será 0.3, porque siguen la misma suerte.

d.Si la pendiente es negativa y significativa el intervalo del 95% de la correlación no pasará por el cero.

9.Estamos relacionando en cuatro zonas distintas la presencia de cuatro especies distintas del zooplancton. Hemos aplicado una ji-cuadrado y el valor es 12.12. Entonces:

a.Podemos decir que no hay relación porque 12.12 es menor que 26.29.

b.Podemos decir que hay relación porque 12.12 es menor que 26.29.

c.Podemos decir que no hay relación estadísticamente significativa porque no hemos superado el umbral.

d.Podemos decir que hay relación estadísticamente significativa porque 12.12 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 5 y tamaño muestral de 100 es:

a.(10, 30).

b.(19.5, 20.5).

c.(19, 21).

d.(18, 22).

11.¿Cuál de las siguientes afirmaciones no es cierta?

a.La potencia estadística requerida en un contraste de hipótesis es que sea igual o superior al 80%.

b.En una comparación de dos muestras relacionadas de variables dicotómicas la técnica adecuada al caso es el test de McNemar.

c.En una técnica de comparación de muestras independientes el tamaño muestral de ambas poblaciones no necesariamente debe ser el mismo.

d.Si en un ANOVA de dos factores la interacción es significativa (p-valor<0.05) como mínimo uno de los dos factores será también significativo (p-valor<0.05).

12.En un estudio donde se quiere comparar la cantidad de un contaminante en las playas de dos poblaciones distintas tenemos 100 observaciones en cada una de las dos playas. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor menor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a.Debemos aplicar el test de la t de Student para varianzas desiguales.

b.Debemos aplicar el test de la t de Student para varianzas iguales.

c.Debemos aplicar el test exacto de Fisher.

d.Debemos aplicar el test de Mann-Whitney.

13.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente aumentamos el tamaño de muestra de ambas poblaciones obteniendo la misma media y desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más alta de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más pequeña de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.51/0.27/0.15/0.01.

b.0.56/0.44/0.61/0.22.

c.0.02/0.07/0.001/0.15.

d.0.2/0.01/0.1/0.21.

14.Se analiza el porcentaje de una especie en el fitoplancton en 20 puntos del océano pacífico y 20 puntos del océano atlántico. En el pacífico en el 50% de puntos se ha superado un determinado umbral de contaminación y en el atlántico ha ocurrido sólo en el 30%. Queremos comparar si esa diferencia es estadísticamente significativa. Debemos aplicar:

a.El Test de proporciones.

b.El Test exacto de Fisher.

c.El Test de Wilcoxon.

d.El Test de McNemar.

15.Hemos analizado un contaminante en tres playas (Nivel 1, Nivel 2 y Nivel 3) de las que hemos elegido en cada una de ellas tres zonas al azar (SZ1, SZ2 y SZ3). Hemos evaluado la cantidad del contaminante por triplicado. Los resultados son los siguientes:

¿Cuál es la afirmación más razonable?:

a.Factor 1: p>0.05. Factor 2: p>0.05.

b.Factor 1: p>0.05. Factor 2: p<0.05.

c.Factor 1: p<0.05. Factor 2: p<0.05. Interacción: p>0.05.

d.Factor 1: p<0.05. Factor 2: p<0.05. Interacción: p>0.05.

16. En un estudio oceanográfico se han comparado tres zonas marítimas (Z1, Z2 y Z3) de las que se han tomado dos subzonas en cada una de ellas (SZ1 y SZ2). En cada subzona se ha tomado una muestra y se ha repartido en ocho recipientes. A doce estudiantes de oceanografía se les ha pedido que analizaran en cuatro de ellas, mediante una determinada técnica, la cantidad de una determina sustancia. Es cierto:

a.Tenemos dos factores: Zona y subzona. Subzona anidado en zona.

b.Tenemos tres factores. Subzona anidado en zona y estudiante cruzado con zona y subzona.

c.Tenemos tres factores. Subzona anidado en zona y estudiante anidado en subzona.

d.Tenemos tres factores: Zona, subzona y estudiante. Los tres cruzados dos a dos.

17.¿Qué error podríamos estar cometiendo si al comparar dos tratamientos tenemos una potencia del 95% y el p-valor que obtenemos es de 0.1?

a.No podemos cometer error porque la potencia estadística es superior al 80%.

b.El error de tipo I.

c.El error de tipo II.

d.Ambos errores: El error de tipo I y el error de tipo II.¡p

18.¿Cuál de las siguientes afirmaciones es cierta?

a.Una potencia del 80% se corresponde con un error de tipo I de 0.20.

b.En dos muestras independientes que no se ajustan a la normalidad y no hay igualdad de varianzas se aplica el Test de Mann-Whitney.

c.En un ANOVA de dos factores anidados la interacción entre ambos factores es siempre significativa.

d.Si se aplica en una comparación de dos poblaciones un test exacto de Fisher es que el tamaño de muestra es inferior a 30.

19.¿Cuál de las siguientes afirmaciones es cierta?:

a.En la predicción de un porcentaje para determinar el tamaño de muestra no necesitamos saber la desviación estándar.

b.En un ANOVA de tres factores siempre tenemos interacción.

c.En un contraste de hipótesis donde comparemos medianas la hipótesis nula es que hay diferencia entre medianas.

d.En una comparación de dos poblaciones cuanta mayor desviación tengamos más difícil será rechazar la hipótesis nula.

20.Se quiere hacer un pronóstico del porcentaje de peces de una especie que en el mediterráneo tienen un nivel de un contaminante por encima de un cierto umbral. ¿Qué tamaño muestral de peces necesitamos tomar para tener un intervalo del 95% con un radio de 10%?:

a.200.

b.400.

c.100.

d.500.

Situación 115: Un problema de ANOVA

1.Hemos elegido tres zonas que queremos expresamente estudiar. Hemos elegido dentro de cada una de ellas dos subzonas homogéneas y hemos aplicado en cada una de estas subzonas homogéneas una política medioambiental distinta entre dos que queremos expresamente comparar. Pasado un año en cada una de las zonas y en cada una de las políticas aplicadas hemos elegido tres subzonas y hemos tomado una muestra y hemos realizado el análisis de un contaminante por triplicado.

Los datos son los siguientes:

Zona Subzona Política Variable
a 1 1 3
a 1 1 4
a 1 1 2
a 1 2 6
a 1 2 7
a 1 2 8
a 2 1 3
a 2 1 4
a 2 1 3
a 2 2 6
a 2 2 7
a 2 2 7
a 3 1 3
a 3 1 4
a 3 1 1
a 3 2 6
a 3 2 7
a 3 2 9
b 1 1 3
b 1 1 4
b 1 1 3
b 1 2 6
b 1 2 7
b 1 2 7
b 2 1 3
b 2 1 4
b 2 1 3
b 2 2 6
b 2 2 7
b 2 2 7
b 3 1 3
b 3 1 4
b 3 1 3
b 3 2 6
b 3 2 7
b 3 2 7
c 1 1 3
c 1 1 4
c 1 1 2
c 1 2 6
c 1 2 7
c 1 2 9
c 2 1 3
c 2 1 4
c 2 1 3
c 2 2 6
c 2 2 7
c 2 2 7
c 3 1 3
c 3 1 4
c 3 1 3
c 3 2 6
c 3 2 7
c 3 2 8

¿Cuántas factores tenemos?

¿Fijos o aleatorios?

¿Dos a dos cómo están: cruzados o anidados?

¿Cuál es el modelo?

¿Qué factores te parecen significativos?

Situación 114: Problema práctico de Oceanografía

Tenemos la siguiente base de datos oceanográfica:

Z=Zona

BF=Biomasa del fitoplancton

BZ=Biomasa del zooplancton

P=Fósforo

N=Nitrógeno

D=Diversidad biológica

Z BF BZ P N D
1 34,0 32,2 36,7 33,7 1,8
1 34,4 34,1 46,4 37,3 1,9
1 35,2 34,5 46,5 36,6 2,7
1 44,6 43,6 45,1 47,4 2,3
1 45,6 44,6 48,2 44,9 2,3
1 46,1 44,1 65,7 46,4 2,7
1 46,6 46,3 57,9 53,9 2,6
1 39,8 37,7 52,3 40,1 2,2
1 40,3 38,6 48,0 47,7 2,0
1 41,3 38,8 60,3 45,2 2,1
1 42,2 40,8 58,3 47,2 2,3
1 42,8 40,8 53,5 41,5 2,4
1 43,3 40,9 43,4 47,7 2,6
1 43,7 41,2 45,5 43,2 2,6
1 43,8 43,4 44,2 48,0 2,7
1 44,6 41,9 47,8 44,4 2,5
1 45,6 42,8 53,9 52,2 2,4
1 46,1 43,6 46,3 45,8 3,3
1 46,6 43,6 54,7 53,0 3,0
1 47,1 44,4 53,5 44,9 2,8
2 47,9 46,5 50,7 54,1 3,3
2 47,9 45,4 51,7 49,2 3,2
2 48,4 46,7 64,3 54,5 2,8
2 52,5 49,9 69,9 56,7 3,6
2 53,0 50,7 57,2 57,2 3,4
2 53,0 52,5 65,3 61,7 3,6
2 53,5 51,8 66,7 52,8 3,5
2 53,9 51,1 61,3 60,4 3,5
2 54,7 52,9 56,3 59,0 2,8
2 51,5 50,2 58,0 55,0 3,5
2 52,3 51,6 61,4 58,2 3,1
2 52,5 52,0 72,0 57,2 2,7
2 53,0 52,3 69,8 61,2 3,4
2 53,0 51,1 53,1 59,2 2,7
2 55,6 53,1 61,7 60,1 3,4
2 53,9 51,5 54,0 56,6 2,8
2 54,7 53,0 67,8 58,5 3,1
2 55,1 52,9 75,2 62,4 3,4
2 55,6 54,2 59,2 61,9 3,5
2 56,0 54,2 60,1 61,7 2,8

Preguntas:

  1. Hacer un Box Plot de la Diversidad biológica de la Zona 1 y otro de la Zona 2.
  2. Comparar si hay diferencias estadísticamente significativas, en cuanto a la diversidad biológica, entre ambas zonas.
  3. Ver si hay relación estadísticamente significativa entre la biomasa del fitoplancton y la del zooplancton en todas las observaciones de la base de datos. Crear una ecuación que relacione ambas variables con la finalidad de hacer una predicción de la biomasa del zooplancton conociendo la biomasa del fitoplancton.
  4. Calcular la correlación entre la cantidad de fósforo y de nitrato en las aguas de la Zona 1.
  5. Ver si hay relación estadísticamente significativa entre que la cantidad de biomasa por fitoplanton sea mayor o no de 50 y que la diversidad biológica sea mayor o no de 3.

Situación 113: Examen (Temas 1-9)

1.En la muestra (1, 3, 3, 6, 7) y la muestra (1, 2, 3, 3, 4, 5, 6, 8) es cierto:

a.Las medianas son iguales.

b.Los primeros cuartiles son iguales.

c.Los rangos intercuartílicos son iguales.

d.Los terceros cuartiles son iguales.

2. Del siguiente gráfico de clorofila y temperatura (con su intervalo de confianza de la media) en distintos meses (J, JL, A, S, O, N, D, E, F, M, A, M, J, JL y A) de los años 93 y 94, podemos decir lo siguiente:

a.Entre la clorofila y la temperatura parece haber una correlación negativa.

b.Si todas las muestras de temperatura en los distintos períodos son del mismo tamaño mostral podemos concluir que en invierno la desviación estándar es menor.

c.En verano las muestras de temperatura tiene menor error estándar.

d.En invierno la clorofila tiene menor desviación estándar.

3.En un estudio realizado en dos zonas marítimas (Zona 1 y Zona 2) se ha recontado el número de ejemplares de cada una de tres especies de organismos planctónicos. El resultado se expresa mediante la siguiente tabla:

a.A partir de estos datos podemos afirmar que habrá una relación significativa entre Zona y Especie.

b.A partir de estos datos podemos afirmar que no habrá una relación significativa entre Zona y Especie.

c.La tabla esperada construida a partir de la tabla observada es la siguiente:

d.Con la información que tenemos no se puede hacer una ji-cuadrado.

4.En cuál de las siguientes regresiones lineales simples podremos hacer mejores predicciones:

a) y=0.01x+30; IC del 95% de la correlación (0.1, 0.3).

b) y=-5x+3; IC del 95% de la correlación (-0.1, 0.4)

c) y=-10x-23; IC del 95% de la correlación (-0.4, -0.3)

d) y=25x+25; IC del 95% de la correlación (-0.6, 0.3).

5. Supongamos que tenemos los siguientes datos oceanográficos:

Supongamos que hemos calculado la correlación de Pearson entre las variables A y S y resulta ser r=0.6. ¿Cuál de las siguientes afirmaciones es cierta?

a.Si extraemos de la muestra los valores de la estación I4 la correlación bajará.

b.Si extraemos de la muestra los valores de la estación Z1 la correlación no cambiará.

c.Si extraemos de la muestra los valores de la estación J1 la correlación bajará.

d.Si cambiamos los valores de la estación Z4 y en lugar de ser 915 y 150 fueran 915 y 50, la correlación subirá.

6.Estamos interesados en saber en cuántos lugares del litoral español se superan los valores de un determinado contaminante. Para ello se toma al azar una muestra de 50 observaciones a lo largo del litoral. En 10 de ellas se supera ese nivel. Un intervalo de confianza del 95% del porcentaje de puntos del litoral donde se supera dicho nivel es:

a.(14.34, 25.66).

b.(8.69, 31.31).

c.(3.03, 36.97).

d.(11.51, 28.49).

 

Situación 112: Examen (Temas 1-17 y 19)

1.En la muestra (1, 1, 2, 3, 5, 5, 5, 6, 8), el rango intercuartílico es:

a.4

b.3

c.5

d.7

2.¿Cuál de las siguientes correlaciones es mayor?

a.r=0.71 IC 95%: (-0.25, 0.99)

b.r=-0.60 IC 95%: (-0.99, 0.15)

c.r=0.21 IC 95%: (0.11, 0.35)

d.r=0.15 IC 95%: (-0.12, 0.34)

3.Estamos interesados en predecir cuántas personas en España reciben tratamiento psicoterapéutico. Para ello se toma al azar una muestra de tamaño 1000. Observamos que 50 reciben ese tipo de tratamiento. Un intervalo de confianza del 99.5% del porcentaje poblacional es el siguiente:

a.(4.32, 5.69).

b.(3.62, 6.38).

c.(2.93, 7.07).

d.(2.24, 7.76).

4.¿Cuál de las siguientes afirmaciones es cierta en una regresión?

a.Una pendiente con un IC 95%: (0.3, 5) es compatible con una correlación con p-valor 0.22.

b.Una pendiente con una p=0.01 es compatible con una correlación con IC 95%: (-0.4, -0.26).

c.Una pendiente con un IC 95%: (-1.3, 6.8) es compatible con una correlación con p-valor igual a 0.008.

d.Una pendiente de 1.9 con p=0.001 es compatible con una correlación con un IC del 95%: (-1.2, -0.5)

5.Si tenemos una variable descrita de la siguiente forma: -1 (-1, 25) podemos afirmar:

a.Por debajo de -1 tenemos el 50% de valores.

b.Esto no es posible porque no podemos tener una muestra con esta descriptiva.

c.Tenemos un 25% de valores positivos.

d.Tenemos un 50% de valores negativos.

6.Hemos realizado el Test de la Ji-cuadrado en una tabla de contingencias 4×2, con p-valor de 0.05, podemos decir entonces que:

a.La V de Crámer nos dará 1.

b.El valor de la ji-cuadrado coincidirá exactamente con el valor umbral.

c.El valor de la ji-cuadrado es 0.

d.El valor de la ji-cuadrado es 3.84.

7.¿Cuál de las siguientes Odds ratio indica una mayor relación entre las variables estudiadas?

a.OR=4; IC 95%: (1.12, 8.92)

b.OR=3; IC 95%: (0.82, 7.78)

c.OR=0.3; IC 95%: (0.12, 0.45)

d.OR=0.68; IC 95%: (0.54, 0.88)

8.¿Cuál de las siguientes afirmaciones es cierta?:

a.En una regresión lineal simple una R2 superior al 5% indica que tenemos una relación con una suficiente capacidad predictiva.

b.Con una ji-cuadrado de 0.84 ya podemos decir que será estadísticamente significativa la relación, independientemente del número de filas y de columnas que tenga la tabla de contingencias.

c.Una V de Crámer 0.5 es estadísticamente significativa si el test de la ji-cuadrado calculado a la tabla de contingencias tiene un p-valor que es superior a 0.05.

d.Una Odds ratio de 0.5 es equivalente, como medida de factor de protección, a una Odds ratio de 2 como factor de riesgo.

9.Estamos relacionando los cuatro grupos sanguíneos en los dos sexos. Hemos aplicado una ji-cuadrado y el valor es 23.33. Entonces:

a.No podemos decir que hay relación significativa porque 23.33 es menor que 31.41.

b.Podemos decir que hay relación significativa porque 23.33 es mayor a 3.84.

c.Podemos decir que hay relación significativa porque 23.33 es mayor que 7.81.

d.Podemos decir que hay relación significativa porque 23.33 es mayor que 15.50.

10.Un intervalo de confianza del 99.5% de la media en una muestra con media muestral 20, desviación estándar 5 y tamaño muestral de 100 es:

a.(19, 21).

b.(19.5, 20.5).

c.(18.5, 21.5).

d.(18, 22).

11.En un estudio donde se quiere comparar dos psicoterapias tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo uno de los dos tratamientos a comparar. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.4. Es cierto lo siguiente:

a.Si el test de la t de Student para varianzas desiguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b.Si el test de la t de Student para varianzas desiguales da un p-valor superior a 0.05 debemos concluir que las medias son diferentes.

c.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

d.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que no podemos decir que las medias son diferentes.

12.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente introducimos nuevos valores de ambas muestras que no teníamos previamente aumentando, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más alta de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más pequeña de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.57/0.25/0.31.

b.0.56/0.24/0.81/0.12.

c.0.2/0.17/0.12/0.005.

d.0.02/0.001/0.09/0.1.

13.Hemos realizado un análisis clúster a una base de datos donde tenemos una única variable y el dendrograma obtenido es el siguiente:

¿Cuál es la base de datos que tenemos? Los individuos están por orden alfabético dentro del paréntesis.

a.(1, 2, 5, 15, 25)

b.(1, 2, 2, 7, 8)

c.(1, 2, 5, 18, 19)

d.(1, 5, 8, 9, 12)

14.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 200 pacientes. 100 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 2% consigue la rehabilitación psicológica. En el otro grupo un 1% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Mann-Whitney.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

15.¿Cuál de las siguientes afirmaciones no es cierta?

a. Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que las muestras son dependientes.

b. En un contraste de hipótesis para evaluar la igualdad de varianzas un p-valor de 0.67 indica que hay una igualdad de varianzas.

c. En un contraste de hipótesis cuanto más tamaño de muestra tengamos más posibilidades de rechazar la hipótesis nula.

d.Cuanto más potencia queramos tener en un contraste de hipótesis menor tamaño de muestra necesitaremos.

16.Hemos realizado un Análisis de componentes principales a una base de datos con cinco variables obteniendo dos componentes que explican un 85% de la información. La primera componente es Y1=0.5X1-0.5X2-0.5X3-0.5X4+0.5X5 y la segunda componente es Y2=0.01X1+0.5X2-0.01X3+0.5X4-0.01X5. En el siguiente gráfico de las dos primeras componentes principales, ¿cuál es el individuo 1?

a.(1, 2, 5, 2, 1)

b.(3, 3, 3, 4, 2)

c.(1, 4, 1, 4, 1)

d.(5, 2, 5, 3, 7)

17.¿Cuál de las siguientes afirmaciones es cierta?

a.En un ANOVA de dos factores si ninguno de los dos factores es significativo la interacción tampoco será significativa.

b.Si en las comparaciones múltiples de un ANOVA de un factor tenemos dos o más grupos homogéneos el p-valor del ANOVA será mayor de 0.05.

c.Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es superior a 0.05.

d. Si en un ANOVA de un factor con cinco niveles el p-valor es menor que 0.05 tendremos dos o más grupos homogéneos.

18.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 2 si la Desviación estándar que tenemos en una muestra piloto es de 10?:

a. 200.

b. 100.

c. 400.

d. 50.

19.En un Análisis de componentes principales la primera componente principal es 0.5X+0.45Y-0.45Z. Es cierto lo siguiente:

a.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X y valores grandes de Y y de  Z.

b.En la representación de la primera componente los individuos más a la izquierda del eje tendrán valores pequeños de X e Y y valores grandes de Z.

c.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X y valores grandes de Y y de Z.

d.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X, valores grandes de Y y valores pequeños de Z.

20.Tenemos los siguientes datos en un estudio donde se aplican tres tratamientos distintos de psicoterapia a mujeres y a hombres. Después del tratamiento se pide a cada uno de ellos la valoración del 0 al 10 del tratamiento al que han estado sometidos. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

 

a.Factor Tratramiento: p<0.05. Factor Sexo: p>0.05. Interacción: p<0.05.

b.Factor Tratramiento: p>0.05. Factor Sexo: p>0.05. Interacción: p<0.05.

c.Factor Tratramiento: p<0.05. Factor Sexo: p<0.05. Interacción: p<0.05.

d.Factor Tratramiento: p<0.05. Factor Sexo: p>0.05. Interacción: p>0.05.

 

Situación 111: Examen (Temas 1-17 y 19)

1.En la muestra (1, 2, 3, 5, 5, 5, 6, 8), ¿cuál es su Box-Plot?

2.¿Cuál de las siguientes correlaciones es mayor?

a.r=0.57 IC 95%: (-0.15, 0.99)

b.r=-0.60 IC 95%: (-0.95, -0.15)

c.r=0.25 IC 95%: (0.15, 0.41)

d.r=0.15 IC 95%: (0.11, 0.24)

3.Estamos interesados en predecir cuántas personas toman antidepresivos en España. Para ello se toma al azar una muestra de tamaño 1000. Observamos que 200 toman antidepresivo. Un intervalo de confianza del 99.5% del porcentaje poblacional es el siguiente:

a.(14.47, 22.53).

b.(16.21, 23.79).

c.(18.10, 21.90).

d.(18.74, 21.26).

4.¿Cuál de las siguientes afirmaciones es cierta en una regresión?

a.Una pendiente con un IC 95%: (0.3, 5) es incompatible con una correlación con p-valor 0.02.

b.Una pendiente con una p=0.01 es incompatible con una correlación con IC 95%: (-0.4, -0.26).

c.Una pendiente con un IC 68.5%: (5.3, 6.8) es incompatible con una correlación con p-valor igual a 0.008.

d.Una pendiente con un valor de 1.9 con p=0.001 es incompatible con una correlación con un IC del 68.5%: (0.1, 4).

5.Si tenemos una variable descrita de la siguiente forma: 2 (-1, 25) podemos afirmar:

a.La media muestral es 2.

b.La desviación estándar es 26.

c.Entre 2 y 25 tenemos el 25% de valores.

d.El rango es 26.

6. Tenemos una Ji-cuadrado en una tabla de contigencias 4×2, con un valor de Ji-cuadrado de 8.15, podemos decir entonces que:

a.La V de Crámer nos dará 1.

b.La Odds ratio será la que nos dará el nivel de relación.

c.La V de Crámer que tengamos será estadísticamente significativa porque 8.15 es superior a 3.84.

d.La V de Crámer que tengamos será estadísticamente significativa porque 8.15 es superior al umbral establecido en una tabla 4×2.

7.¿Cuál de las siguientes Odds ratio indica una menor relación entre las variables estudiadas?

a.OR=4; IC 95%: (1.12, 8.92)

b.OR=3; IC 95%: (0.82, 7.78)

c.OR=0.25; IC 95%: (0.12, 0.45)

d.OR=0.68; IC 95%: (0.54, 0.88)

8.¿Cuál de las siguientes afirmaciones no es cierta?:

a.En una regresión lineal simple una R2 superior al 50% indica que tenemos una relación con una suficiente capacidad predictiva.

b.Con una ji-cuadrado de 2.84 ya podemos decir que será estadísticamente significativa la relación, independientemente del número de filas y de columnas que tenga la tabla de contingencias.

c.Una V de Crámer 0.5 es estadísticamente significativa si el test de la ji-cuadrado calculado a la tabla de contingencias tiene un p-valor que es superior a 0.05.

d.Una Odds ratio de 0.25 es equivalente, como medida de factor de protección, a una Odds ratio de 4 como factor de riesgo.

9.Estamos relacionando los cuatro grupos sanguíneos con cinco zonas del mundo. Hemos aplicado una ji-cuadrado y el valor es 23.33. Entonces:

a.No podemos decir que hay relación significativa porque 23.33 es menor que 31.41.

b.No podemos decir que hay relación significativa porque 23.33 es mayor a 3.84.

c.Podemos decir que hay relación significativa porque 23.33 es mayor que 21.02.

d.Podemos decir que hay relación significativa porque 23.33 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 10 y tamaño muestral de 10000 es:

a.(10, 30).

b.(19.5, 20.5).

c.(19.8, 20.2).

d.(0, 40).

11.En un estudio donde se quiere comparar dos psicoterapias tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo uno de los dos tratamientos a comparar. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.004. Es cierto lo siguiente:

a.Si el test de la t de Student para varianzas desiguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b.Si el test de la t de Student para varianzas desiguales da un p-valor superior a 0.05 debemos concluir que las medias son diferentes.

c.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

d.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que no podemos decir que las medias son diferentes.

12.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente introducimos nuevos valores de ambas muestras que no teníamos previamente aumentando, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.57/0.25/0.31.

b.0.56/0.24/0.81/0.12.

c.0.2/0.17/0.12/0.005.

d.0.02/0.001/0.09/0.1.

13.Hemos realizado un análisis clúster a una base de datos donde tenemos dos variables y el dendrograma obtenido es el siguiente:

¿Cuál es la base de datos que tenemos? Los individuos están por orden alfabético y en cada paréntesis tenemos primero el valor de la variable X y segundo el valor de la variable Y.

a.(1,2), (2,1), (4,3), (12,13), (13,12)

b.(1,2), (1,2), (1,3), (12,13), (12,17)

c.(1,2), (2,1), (4,3), (12,13), (22,23)

d.(1,2), (2,1), (2,1), (19,20), (20,19)

14.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 200 pacientes. 100 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 8% consigue la rehabilitación psicológica. En el otro grupo un 4% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Mann-Whitney.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

15.¿Cuál de las siguientes afirmaciones es cierta?

a. Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que las muestras son independientes.

b. En un contraste de hipótesis para evaluar la igualdad de varianzas un p-valor de 0.67 indica que no hay una igualdad de varianzas.

c. En un contraste de hipótesis cuanto más tamaño de muestra tengamos más posibilidades de no rechazar la hipótesis nula.

d.Cuanto más potencia queramos tener en un contraste de hipótesis más tamaño de muestra necesitaremos.

16.Hemos realizado un Análisis de componentes principales a una base de datos con cinco variables obteniendo dos componentes que explican un 85% de la información. La primera componente es Y1=0.5X1-0.5X2+0.5X3-0.5X4+0.5X5 y la segunda componente es Y2=0.5X1-0.01X2-0.01X3+0.01X4-0.5X5. En el siguiente gráfico de las dos primeras componentes principales, ¿cuál es el individuo 5?

a.(7, 4, 3, 3, 3)

b.(7, 5, 5, 6, 6)

c.(7, 3, 6, 2, 5)

d.(5, 2, 5, 3, 7)

17.¿Cuál de las siguientes afirmaciones no es cierta?

a.En un ANOVA de dos factores si ninguno de los dos factores es significativo la interacción puede ser significativa.

b.Si en las comparaciones múltiples de un ANOVA de un factor tenemos dos o más grupos homogéneos el p-valor del ANOVA será menor de 0.05.

c.Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es inferior a 0.05.

d. Si en un ANOVA de un factor con cinco niveles el p-valor es menor que 0.05 tendremos cinco grupos homogéneos.

18.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 99.5% de radio 3 si la Desviación estándar que tenemos en una muestra piloto es de 20?:

a. 100.

b. 1000.

c. 400.

d. 25.

19.En un Análisis de componentes principales la primera componente principal es 0.5X-0.45Y-0.48Z. Es cierto lo siguiente:

a.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X e Y y valores pequeños de Z.

b.En la representación de la primera componente los individuos más a la izquierda del eje tendrán valores grandes de X, pequeños de Y y grandes de Z.

c.En la representación de la primera componente los individuos más a la izquierda del eje tendrán valores pequeños de X y valores grandes de Y y de Z.

d.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X y valores grandes de Y y pequeños de Z.

20.Tenemos los siguientes datos en un estudio donde se aplican dos sistemas de medir  la altura (Sistema fotoeléctrico y Cinta métrica). Tres alumnos repiten tres veces la medida de la altura de una misma persona, en milímetros, en cada uno de los dos sistemas de medir. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Sistema: p<0.05. Factor Alumno: p>0.05. Interacción: p<0.05.

b.Factor Sistema: p<0.05. Factor Alumno: p<0.05. Interacción: p>0.05.

c.Factor Sistema: p<0.05. Factor Alumno: p<0.05. Interacción: p<0.05.

d.Factor Sistema: p>0.05. Factor Alumno: p<0.05. Interacción: p<0.05.