Archivo del Autor: estadisticallopis

Ejemplos de ANOVA

A continuación se podrán seguir una serie de ejemplos de ANOVA. Hay de factores cruzados, anidados. Factores intersujetos (los que no se mencionan expresamente), factores intrasujetos. Pueden verse los valores y los resultados que se obtendrían en los contrastes de hipótesis de los diferentes efectos a buscar en cada análisis. Recordemos que si el p-valor es menor de 0.05 se entiende que hay efecto del factor, significativo, lo que quiere decir que hay diferencia entre los niveles estudiados (si el factor es fijo) o entre la población de niveles de los que los niveles estudiados son una muestra (si el factor es aleatorio). Si el p-valor es mayor de 0.05 no hay efecto significativo, lo que quiere decir que las posibles diferencias muestrales que podamos ver entre los diferentes niveles no son extrapolables a la población.

Situación 113: Examen (Temas 1-9)

2 respuestas

1.En la muestra (1, 3, 3, 6, 7) y la muestra (1, 2, 3, 3, 4, 5, 6, 8) es cierto:

a.Las medianas son iguales.

b.Los primeros cuartiles son iguales.

c.Los rangos intercuartílicos son iguales.

d.Los terceros cuartiles son iguales.

2. Del siguiente gráfico de clorofila y temperatura (con su intervalo de confianza de la media) en distintos meses (J, JL, A, S, O, N, D, E, F, M, A, M, J, JL y A) de los años 93 y 94, podemos decir lo siguiente:

a.Entre la clorofila y la temperatura parece haber una correlación negativa.

b.Si todas las muestras de temperatura en los distintos períodos son del mismo tamaño mostral podemos concluir que en invierno la desviación estándar es menor.

c.En verano las muestras de temperatura tiene menor error estándar.

d.En invierno la clorofila tiene menor desviación estándar.

3.En un estudio realizado en dos zonas marítimas (Zona 1 y Zona 2) se ha recontado el número de ejemplares de cada una de tres especies de organismos planctónicos. El resultado se expresa mediante la siguiente tabla:

a.A partir de estos datos podemos afirmar que habrá una relación significativa entre Zona y Especie.

b.A partir de estos datos podemos afirmar que no habrá una relación significativa entre Zona y Especie.

c.La tabla esperada construida a partir de la tabla observada es la siguiente:

d.Con la información que tenemos no se puede hacer una ji-cuadrado.

4.En cuál de las siguientes regresiones lineales simples podremos hacer mejores predicciones:

a) y=0.01x+30; IC del 95% de la correlación (0.1, 0.3).

b) y=-5x+3; IC del 95% de la correlación (-0.1, 0.4)

c) y=-10x-23; IC del 95% de la correlación (-0.4, -0.3)

d) y=25x+25; IC del 95% de la correlación (-0.6, 0.3).

5. Supongamos que tenemos los siguientes datos oceanográficos:

Supongamos que hemos calculado la correlación de Pearson entre las variables A y S y resulta ser r=0.6. ¿Cuál de las siguientes afirmaciones es cierta?

a.Si extraemos de la muestra los valores de la estación I4 la correlación bajará.

b.Si extraemos de la muestra los valores de la estación Z1 la correlación no cambiará.

c.Si extraemos de la muestra los valores de la estación J1 la correlación bajará.

d.Si cambiamos los valores de la estación Z4 y en lugar de ser 915 y 150 fueran 915 y 50, la correlación subirá.

6.Estamos interesados en saber en cuántos lugares del litoral español se superan los valores de un determinado contaminante. Para ello se toma al azar una muestra de 50 observaciones a lo largo del litoral. En 10 de ellas se supera ese nivel. Un intervalo de confianza del 95% del porcentaje de puntos del litoral donde se supera dicho nivel es:

a.(14.34, 25.66).

b.(8.69, 31.31).

c.(3.03, 36.97).

d.(11.51, 28.49).

Solución Situación 112

Deja un comentario

10c

11c

12d

13c

14c

15d

16c

17d

18b

19b

20a

Situación 112: Examen (Temas 1-17 y 19)

Deja un comentario

1.En la muestra (1, 1, 2, 3, 5, 5, 5, 6, 8), el rango intercuartílico es:

a.4

b.3

c.5

d.7

2.¿Cuál de las siguientes correlaciones es mayor?

a.r=0.71 IC 95%: (-0.25, 0.99)

b.r=-0.60 IC 95%: (-0.99, 0.15)

c.r=0.21 IC 95%: (0.11, 0.35)

d.r=0.15 IC 95%: (-0.12, 0.34)

3.Estamos interesados en predecir cuántas personas en España reciben tratamiento psicoterapéutico. Para ello se toma al azar una muestra de tamaño 1000. Observamos que 50 reciben ese tipo de tratamiento. Un intervalo de confianza del 99.5% del porcentaje poblacional es el siguiente:

a.(4.32, 5.69).

b.(3.62, 6.38).

c.(2.93, 7.07).

d.(2.24, 7.76).

4.¿Cuál de las siguientes afirmaciones es cierta en una regresión?

a.Una pendiente con un IC 95%: (0.3, 5) es compatible con una correlación con p-valor 0.22.

b.Una pendiente con una p=0.01 es compatible con una correlación con IC 95%: (-0.4, -0.26).

c.Una pendiente con un IC 95%: (-1.3, 6.8) es compatible con una correlación con p-valor igual a 0.008.

d.Una pendiente de 1.9 con p=0.001 es compatible con una correlación con un IC del 95%: (-1.2, -0.5)

5.Si tenemos una variable descrita de la siguiente forma: -1 (-1, 25) podemos afirmar:

a.Por debajo de -1 tenemos el 50% de valores.

b.Esto no es posible porque no podemos tener una muestra con esta descriptiva.

c.Tenemos un 25% de valores positivos.

d.Tenemos un 50% de valores negativos.

6.Hemos realizado el Test de la Ji-cuadrado en una tabla de contingencias 4×2, con p-valor de 0.05, podemos decir entonces que:

a.La V de Crámer nos dará 1.

b.El valor de la ji-cuadrado coincidirá exactamente con el valor umbral.

c.El valor de la ji-cuadrado es 0.

d.El valor de la ji-cuadrado es 3.84.

7.¿Cuál de las siguientes Odds ratio indica una mayor relación entre las variables estudiadas?

a.OR=4; IC 95%: (1.12, 8.92)

b.OR=3; IC 95%: (0.82, 7.78)

c.OR=0.3; IC 95%: (0.12, 0.45)

d.OR=0.68; IC 95%: (0.54, 0.88)

8.¿Cuál de las siguientes afirmaciones es cierta?:

a.En una regresión lineal simple una R² superior al 5% indica que tenemos una relación con una suficiente capacidad predictiva.

b.Con una ji-cuadrado de 0.84 ya podemos decir que será estadísticamente significativa la relación, independientemente del número de filas y de columnas que tenga la tabla de contingencias.

c.Una V de Crámer 0.5 es estadísticamente significativa si el test de la ji-cuadrado calculado a la tabla de contingencias tiene un p-valor que es superior a 0.05.

d.Una Odds ratio de 0.5 es equivalente, como medida de factor de protección, a una Odds ratio de 2 como factor de riesgo.

9.Estamos relacionando los cuatro grupos sanguíneos en los dos sexos. Hemos aplicado una ji-cuadrado y el valor es 23.33. Entonces:

a.No podemos decir que hay relación significativa porque 23.33 es menor que 31.41.

b.Podemos decir que hay relación significativa porque 23.33 es mayor a 3.84.

c.Podemos decir que hay relación significativa porque 23.33 es mayor que 7.81.

d.Podemos decir que hay relación significativa porque 23.33 es mayor que 15.50.

10.Un intervalo de confianza del 99.5% de la media en una muestra con media muestral 20, desviación estándar 5 y tamaño muestral de 100 es:

a.(19, 21).

b.(19.5, 20.5).

c.(18.5, 21.5).

d.(18, 22).

11.En un estudio donde se quiere comparar dos psicoterapias tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo uno de los dos tratamientos a comparar. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.4. Es cierto lo siguiente:

a.Si el test de la t de Student para varianzas desiguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b.Si el test de la t de Student para varianzas desiguales da un p-valor superior a 0.05 debemos concluir que las medias son diferentes.

c.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

d.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que no podemos decir que las medias son diferentes.

12.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente introducimos nuevos valores de ambas muestras que no teníamos previamente aumentando, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más alta de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más pequeña de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.57/0.25/0.31.

b.0.56/0.24/0.81/0.12.

c.0.2/0.17/0.12/0.005.

d.0.02/0.001/0.09/0.1.

13.Hemos realizado un análisis clúster a una base de datos donde tenemos una única variable y el dendrograma obtenido es el siguiente:

¿Cuál es la base de datos que tenemos? Los individuos están por orden alfabético dentro del paréntesis.

a.(1, 2, 5, 15, 25)

b.(1, 2, 2, 7, 8)

c.(1, 2, 5, 18, 19)

d.(1, 5, 8, 9, 12)

14.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 200 pacientes. 100 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 2% consigue la rehabilitación psicológica. En el otro grupo un 1% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Mann-Whitney.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

15.¿Cuál de las siguientes afirmaciones no es cierta?

a. Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que las muestras son dependientes.

b. En un contraste de hipótesis para evaluar la igualdad de varianzas un p-valor de 0.67 indica que hay una igualdad de varianzas.

c. En un contraste de hipótesis cuanto más tamaño de muestra tengamos más posibilidades de rechazar la hipótesis nula.

d.Cuanto más potencia queramos tener en un contraste de hipótesis menor tamaño de muestra necesitaremos.

16.Hemos realizado un Análisis de componentes principales a una base de datos con cinco variables obteniendo dos componentes que explican un 85% de la información. La primera componente es Y1=0.5X1-0.5X2-0.5X3-0.5X4+0.5X5 y la segunda componente es Y2=0.01X1+0.5X2-0.01X3+0.5X4-0.01X5. En el siguiente gráfico de las dos primeras componentes principales, ¿cuál es el individuo 1?

a.(1, 2, 5, 2, 1)

b.(3, 3, 3, 4, 2)

c.(1, 4, 1, 4, 1)

d.(5, 2, 5, 3, 7)

17.¿Cuál de las siguientes afirmaciones es cierta?

a.En un ANOVA de dos factores si ninguno de los dos factores es significativo la interacción tampoco será significativa.

b.Si en las comparaciones múltiples de un ANOVA de un factor tenemos dos o más grupos homogéneos el p-valor del ANOVA será mayor de 0.05.

c.Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es superior a 0.05.

d. Si en un ANOVA de un factor con cinco niveles el p-valor es menor que 0.05 tendremos dos o más grupos homogéneos.

18.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 2 si la Desviación estándar que tenemos en una muestra piloto es de 10?:

a. 200.

b. 100.

c. 400.

d. 50.

19.En un Análisis de componentes principales la primera componente principal es 0.5X+0.45Y-0.45Z. Es cierto lo siguiente:

a.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X y valores grandes de Y y de Z.

b.En la representación de la primera componente los individuos más a la izquierda del eje tendrán valores pequeños de X e Y y valores grandes de Z.

c.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X y valores grandes de Y y de Z.

d.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X, valores grandes de Y y valores pequeños de Z.

20.Tenemos los siguientes datos en un estudio donde se aplican tres tratamientos distintos de psicoterapia a mujeres y a hombres. Después del tratamiento se pide a cada uno de ellos la valoración del 0 al 10 del tratamiento al que han estado sometidos. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Tratramiento: p<0.05. Factor Sexo: p>0.05. Interacción: p<0.05.

b.Factor Tratramiento: p>0.05. Factor Sexo: p>0.05. Interacción: p<0.05.

c.Factor Tratramiento: p<0.05. Factor Sexo: p<0.05. Interacción: p<0.05.

d.Factor Tratramiento: p<0.05. Factor Sexo: p>0.05. Interacción: p>0.05.

Solución Situación 111

Deja un comentario

8b y c: Había dos incorrectas que debían seleccionarme. Al percatarme del error ya habían entregado algunos alumnos. He preferido dejarlo así y dar como buena cualquiera de las dos respuestas, evidentemente.

10c

11a

12c

13a

14b

15d

16d

17d

18c

19c

20b

Solución Situación 109

Deja un comentario

10b

Situación 111: Examen (Temas 1-17 y 19)

Deja un comentario

1.En la muestra (1, 2, 3, 5, 5, 5, 6, 8), ¿cuál es su Box-Plot?

2.¿Cuál de las siguientes correlaciones es mayor?

a.r=0.57 IC 95%: (-0.15, 0.99)

b.r=-0.60 IC 95%: (-0.95, -0.15)

c.r=0.25 IC 95%: (0.15, 0.41)

d.r=0.15 IC 95%: (0.11, 0.24)

3.Estamos interesados en predecir cuántas personas toman antidepresivos en España. Para ello se toma al azar una muestra de tamaño 1000. Observamos que 200 toman antidepresivo. Un intervalo de confianza del 99.5% del porcentaje poblacional es el siguiente:

a.(14.47, 22.53).

b.(16.21, 23.79).

c.(18.10, 21.90).

d.(18.74, 21.26).

4.¿Cuál de las siguientes afirmaciones es cierta en una regresión?

a.Una pendiente con un IC 95%: (0.3, 5) es incompatible con una correlación con p-valor 0.02.

b.Una pendiente con una p=0.01 es incompatible con una correlación con IC 95%: (-0.4, -0.26).

c.Una pendiente con un IC 68.5%: (5.3, 6.8) es incompatible con una correlación con p-valor igual a 0.008.

d.Una pendiente con un valor de 1.9 con p=0.001 es incompatible con una correlación con un IC del 68.5%: (0.1, 4).

5.Si tenemos una variable descrita de la siguiente forma: 2 (-1, 25) podemos afirmar:

a.La media muestral es 2.

b.La desviación estándar es 26.

c.Entre 2 y 25 tenemos el 25% de valores.

d.El rango es 26.

6. Tenemos una Ji-cuadrado en una tabla de contigencias 4×2, con un valor de Ji-cuadrado de 8.15, podemos decir entonces que:

a.La V de Crámer nos dará 1.

b.La Odds ratio será la que nos dará el nivel de relación.

c.La V de Crámer que tengamos será estadísticamente significativa porque 8.15 es superior a 3.84.

d.La V de Crámer que tengamos será estadísticamente significativa porque 8.15 es superior al umbral establecido en una tabla 4×2.

7.¿Cuál de las siguientes Odds ratio indica una menor relación entre las variables estudiadas?

a.OR=4; IC 95%: (1.12, 8.92)

b.OR=3; IC 95%: (0.82, 7.78)

c.OR=0.25; IC 95%: (0.12, 0.45)

d.OR=0.68; IC 95%: (0.54, 0.88)

8.¿Cuál de las siguientes afirmaciones no es cierta?:

a.En una regresión lineal simple una R² superior al 50% indica que tenemos una relación con una suficiente capacidad predictiva.

b.Con una ji-cuadrado de 2.84 ya podemos decir que será estadísticamente significativa la relación, independientemente del número de filas y de columnas que tenga la tabla de contingencias.

c.Una V de Crámer 0.5 es estadísticamente significativa si el test de la ji-cuadrado calculado a la tabla de contingencias tiene un p-valor que es superior a 0.05.

d.Una Odds ratio de 0.25 es equivalente, como medida de factor de protección, a una Odds ratio de 4 como factor de riesgo.

9.Estamos relacionando los cuatro grupos sanguíneos con cinco zonas del mundo. Hemos aplicado una ji-cuadrado y el valor es 23.33. Entonces:

a.No podemos decir que hay relación significativa porque 23.33 es menor que 31.41.

b.No podemos decir que hay relación significativa porque 23.33 es mayor a 3.84.

c.Podemos decir que hay relación significativa porque 23.33 es mayor que 21.02.

d.Podemos decir que hay relación significativa porque 23.33 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 10 y tamaño muestral de 10000 es:

a.(10, 30).

b.(19.5, 20.5).

c.(19.8, 20.2).

d.(0, 40).

a.Si el test de la t de Student para varianzas desiguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b.Si el test de la t de Student para varianzas desiguales da un p-valor superior a 0.05 debemos concluir que las medias son diferentes.

c.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

d.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que no podemos decir que las medias son diferentes.

12.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente introducimos nuevos valores de ambas muestras que no teníamos previamente aumentando, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.57/0.25/0.31.

b.0.56/0.24/0.81/0.12.

c.0.2/0.17/0.12/0.005.

d.0.02/0.001/0.09/0.1.

13.Hemos realizado un análisis clúster a una base de datos donde tenemos dos variables y el dendrograma obtenido es el siguiente:

¿Cuál es la base de datos que tenemos? Los individuos están por orden alfabético y en cada paréntesis tenemos primero el valor de la variable X y segundo el valor de la variable Y.

a.(1,2), (2,1), (4,3), (12,13), (13,12)

b.(1,2), (1,2), (1,3), (12,13), (12,17)

c.(1,2), (2,1), (4,3), (12,13), (22,23)

d.(1,2), (2,1), (2,1), (19,20), (20,19)

14.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 200 pacientes. 100 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 8% consigue la rehabilitación psicológica. En el otro grupo un 4% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Mann-Whitney.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

15.¿Cuál de las siguientes afirmaciones es cierta?

a. Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que las muestras son independientes.

b. En un contraste de hipótesis para evaluar la igualdad de varianzas un p-valor de 0.67 indica que no hay una igualdad de varianzas.

c. En un contraste de hipótesis cuanto más tamaño de muestra tengamos más posibilidades de no rechazar la hipótesis nula.

d.Cuanto más potencia queramos tener en un contraste de hipótesis más tamaño de muestra necesitaremos.

16.Hemos realizado un Análisis de componentes principales a una base de datos con cinco variables obteniendo dos componentes que explican un 85% de la información. La primera componente es Y1=0.5X1-0.5X2+0.5X3-0.5X4+0.5X5 y la segunda componente es Y2=0.5X1-0.01X2-0.01X3+0.01X4-0.5X5. En el siguiente gráfico de las dos primeras componentes principales, ¿cuál es el individuo 5?

a.(7, 4, 3, 3, 3)

b.(7, 5, 5, 6, 6)

c.(7, 3, 6, 2, 5)

d.(5, 2, 5, 3, 7)

17.¿Cuál de las siguientes afirmaciones no es cierta?

a.En un ANOVA de dos factores si ninguno de los dos factores es significativo la interacción puede ser significativa.

b.Si en las comparaciones múltiples de un ANOVA de un factor tenemos dos o más grupos homogéneos el p-valor del ANOVA será menor de 0.05.

c.Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es inferior a 0.05.

d. Si en un ANOVA de un factor con cinco niveles el p-valor es menor que 0.05 tendremos cinco grupos homogéneos.

18.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 99.5% de radio 3 si la Desviación estándar que tenemos en una muestra piloto es de 20?:

a. 100.

b. 1000.

c. 400.

d. 25.

19.En un Análisis de componentes principales la primera componente principal es 0.5X-0.45Y-0.48Z. Es cierto lo siguiente:

a.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X e Y y valores pequeños de Z.

b.En la representación de la primera componente los individuos más a la izquierda del eje tendrán valores grandes de X, pequeños de Y y grandes de Z.

c.En la representación de la primera componente los individuos más a la izquierda del eje tendrán valores pequeños de X y valores grandes de Y y de Z.

d.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X y valores grandes de Y y pequeños de Z.

20.Tenemos los siguientes datos en un estudio donde se aplican dos sistemas de medir la altura (Sistema fotoeléctrico y Cinta métrica). Tres alumnos repiten tres veces la medida de la altura de una misma persona, en milímetros, en cada uno de los dos sistemas de medir. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Sistema: p<0.05. Factor Alumno: p>0.05. Interacción: p<0.05.

b.Factor Sistema: p<0.05. Factor Alumno: p<0.05. Interacción: p>0.05.

c.Factor Sistema: p<0.05. Factor Alumno: p<0.05. Interacción: p<0.05.

d.Factor Sistema: p>0.05. Factor Alumno: p<0.05. Interacción: p<0.05.

Solución Situación 110

2 respuestas

1c: Es una variable continua, las muestras son independientes y hay normalidad. Por lo tanto, hay que aplicar el test de la t de Student de varianzas iguales. Si el p-valor es 0.34 debemos mantener la hipótesis nula de igualdad de medias.

2c: En los tres pasos se producen los siguientes tránsitos: Al disminuir el tamaño de muestra el p-valor subirá. Al disminuir la desviación estándar el p-valor bajará. Al aumentar la diferencia de medias el p-valor bajará. La respuesta c es la única que produce estos cambios desde el primer p-valor que tenemos.

3c: Estamos ante una variable continua y tenemos muestras independientes. Como no hay normalidad debemos aplicar el test de Mann-Whitney.

4c: Variables dicotómicas. Muestras independientes. Tamaño muestral superior a 30. Valor esperado por grupo igual a 3, que es menor que 5. El 3 sale de que el 8% de 50 es 4 y el 4% de 50 es 2. El promedio de 4 y 2 es 3. Por lo tanto, hay que aplicar el test exacto de Fisher.

5c: Desviaciones estándar pequeñas hacen más fácil encontrar diferencias significativas entre los grupos comparados. La d no es correcta porque dice que «hay diferencias entre las cinco poblaciones» y esto, en general, no es cierto. De hecho, afirma que habrá cinco grupos homogéneos y esto es, obviamente, incorrecto.

6d: Para estar a la derecha debemos tener valores grandes de las cinco variables porque los cinco coeficientes son grandes y positivos. Para estar abajo hay que tener relativamente un valor mayor de la variables 4 que de la 1 que son las que pesan en la segunda componente.

7d: Si el ANOVA tiene un p-valor menor que 0.05 es que hay diferencias y, por lo tanto, como mínimo tendremos dos grupos homogéneos.

8a: Si se aplica la fórmula n=(4*20*20)/(4*4)=100.

9a: Como el coeficiente de X es positivo y los coeficientes de Y y de Z son negativos para estar más a la derecha en la primera componente debemos tener valores grandes de la primera variable y pequeños de las otras dos variables.

10c: Viendo los datos se observa que no hay diferencias entre tratamientos, sí entre sexos y no hay interacción.

Situación 110: Examen (Temas 13-17 y 19)

Deja un comentario

1.En un estudio donde se quiere comparar dos psicoterapias tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo uno de los dos tratamientos a comparar. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.34. Es cierto lo siguiente:

a.Si el test de la t de Student para varianzas desiguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b.Si el test de la t de Student para varianzas desiguales da un p-valor superior a 0.05 debemos concluir que las medias son diferentes.

c.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

d.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que no podemos decir que las medias son diferentes.

2.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente eliminamos valores de ambas muestras que eran incorrectos disminuyendo, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.97/0.25/0.31.

b.0.56/0.74/0.81/0.12.

c.0.2/0.37/0.12/0.005.

d.0.02/0.001/0.09/0.0001.

3.Hemos de comparar dos procedimientos distintos de tratamiento para pacientes con demencia. Tomamos 80 pacientes y los repartimos al azar en dos grupos de 40 cada uno. La variable elegida para evaluar ambos tratamientos es el Mini-Mental. El Test de Shapiro-Wilk nos da, en ambas muestras, un p-valor de 0.005. Debemos:

a.Aplicar el Test de Fisher- Snedecor y si tenemos un p-valor inferior a 0.05 aplicar el test de la t de Student de varianzas iguales.

b.Aplicar el Test de Fisher- Snedecor y si tenemos un p-valor inferior a 0.05 aplicar el test de la t de Student de varianzas iguales.

c.Aplicar el Test de Mann-Whitney.

d Aplicar el Test de la t de Student de datos apareados.

4.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 100 pacientes. 50 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 8% consigue la rehabilitación psicológica. En el otro grupo un 4% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Mann-Whitney.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

5.¿Cuál de las siguientes afirmaciones es cierta?

a. Si en una comparación de dos poblaciones aplicamos un Test de Mann-Whitney es que la variable no se ajusta a la distribución normal en ninguna de las dos muestras.

b. En un contraste de hipótesis para evaluar el ajuste a la distribución normal un p-valor inferior a 0.05 indica que hay suficiente ajuste de los datos a la distribución normal.

c. Cuanto menor desviación estándar tengamos en dos muestras de dos poblaciones a comparar más posible será rechazar la hipótesis nula de igualdad de medias.

d. En un ANOVA de un factor fijo con cinco niveles un p-valor menor de 0.05 indica que hay diferencias significativas entre las cinco poblaciones que estamos comparando.

6.Hemos realizado un Análisis de componentes principales a una base de datos con cinco variables obteniendo dos componentes que explican un 85% de la información. La primera componente es Y1=0.5X1+0.5X2+0.5X3+0.5X4+0.5X5 y la segunda componente es Y2=0.5X1-0.01X2-0.01X3-0.5X4+0.01X5. En el siguiente gráfico de las dos primeras componentes principales, ¿cuál es el individuo 5?

a.(3, 4, 2, 3, 2)

b.(1, 1, 2, 0, 1)

c.(7, 7, 6, 5, 7)

d.(5, 8, 5, 7, 7)

7.¿Cuál de las siguientes afirmaciones es cierta?

a.En un ANOVA de dos factores si ninguno de los dos factores es significativo la interacción tampoco puede ser significativa.

b.Si en las comparaciones múltiples de un ANOVA de un factor tenemos dos o más grupos homogéneos el p-valor del ANOVA será mayor de 0.05.

c.Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es superior a 0.05.

d. Si en un ANOVA de un factor con cinco niveles el p-valor es menor que 0.05 tendremos como mínimo dos grupos homogéneos.

8.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 4 si la Desviación estándar que tenemos en una muestra piloto es de 20?:

a. 100.

b. 1000.

c. 400.

d. 25.

9.En un Análisis de componentes principales la primera componente principal es 0.5X-0.45Y-0.48Z. Es cierto lo siguiente:

a. En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X, valores pequeños de Y y valores pequeños de Z.

b. En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X, de Y y de Z.

c. En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X e Y y valores pequeños de Z.

d. En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X e Y y valores grandes de Z.

10.Tenemos los siguientes datos en un ensayo clínico donde se aplican tres tratamientos a personas de dos sexos. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Tratamiento: p>0.05. Factor Sexo: p>0.05. Interacción: p<0.05.

b.Factor Tratamiento: p>0.05. Factor Sexo: p<0.05. Interacción: p<0.05.

c.Factor Tratamiento: p>0.05. Factor Sexo: p<0.05. Interacción: p>0.05.

d.Factor Tratamiento: p<0.05. Factor Sexo: p<0.05. Interacción: p>0.05.

Situación 109: Examen (Temas 1-9)

Deja un comentario

1. ¿Qué valor refleja un mayor nivel de relación entre dos variables?

a. r= 0.6 (p<0.05)

b. OR=2 (IC 95%: (0.87, 13.32))

c. V=0.85 (p>0.05)

d. Kappa= -1

2. ¿Qué Odds ratio indica mayor relación entre dos variables dicotómicas?

a. 0.1 (p<0.05)

b. 7 (p<0.05)

c. 10 (p>0.05)

d. 0.05 (p>0.05)

3. Tenemos un individuo con un valor de IMC de 27 y nos dicen que, respecto a una muestra, este valor representa un percentil 70. ¿Cuál de las siguientes es la muestra referente?:

a. (19, 21, 21, 22, 23, 24, 24, 24, 27, 31, 33)

b. (19, 21, 21, 22, 24, 24, 25, 27, 28, 31, 31)

c. (20, 21, 21, 22, 24, 24, 24, 25, 26, 27, 30)

d. (18, 21, 21, 22, 24, 24, 27, 29, 31, 38, 38)

4. ¿Qué afirmación entre las siguientes es cierta?

a. Una Odds ratio mayor que 1 siempre es significativa.

b. Una Odds ratio de 4, significativa, es una medida que indica menor asociación que una Odds ratio de 0.5 que también sea significativa.

c. La V de Crámer toma el valor de 1 si el observado y el esperado son diferentes.

d. El p-valor de la ji-cuadrado es el que marca la significación de la V de Crámer.

5. En una muestra como la siguiente: (4, 5, 5, 6, 6, 15, 16, 16, 17, 17, 800), la asimetría estandarizada y la curtosis estandarizada:

a. Deben de ser valores que caen fuera del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

b. Deben de ser valores que caen fuera del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

c. Deben de ser valores que caen dentro del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

d. Deben de ser valores que caen dentro del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

6. ¿Cuál de las siguientes afirmaciones no es cierta?

a. Un intervalo de confianza del 95% de una pendiente en una Regresión lineal simple que sea (0.75, 1.34) nos indica una pendiente no significativa porque el intervalo incluye al 1.

b. Una Odds ratio con un intervalo de confianza del 95% que sea (3.23, 7.67) indica una asociación significativa.

c. Una correlación r=0.23 (p=0.001) indica que estamos ante una correlación significativa.

d. Un índice kappa de -0.9 indica una muy débil concordancia entre dos observadores.

7. Sea la muestra (1, 2, 5, 7, 9). Podemos afirmar:

a. El rango es 9.

b. El primer cuartil es 1.5.

c. No tiene tercer cuartil.

d. El rango intercuartílico es 5.

8. ¿Cuál de las siguientes afirmaciones es cierta?

a. En una Regresión lineal simple la variable dependiente es cualitativa.

b. En un Test de la ji-cuadrado si el p-valor es mayor que 0.05 indica que la tabla de contingencias observada y la esperada son iguales.

c. Un intervalo de confianza de la media del 95% que sea (8, 12) indica que el Error estándar es igual a 1.

d. Una correlación de Pearson de -0.6 entre dos variables nos indica que si hacemos una Regresión lineal simple entre ambas variables tendremos un coeficiente de determinación del 60%.

9. ¿Cuál de las siguientes afirmaciones es cierta?

a. Un modelo de Regresión lineal simple que sea y=3x+4 tiene una pendiente positiva y significativa.

b. Una V de Crámer de -1 indica que la relación entre las variables cualitativas es de tipo inverso.

c. La ji-cuadrado es una técnica que cuantifica el grado de relación que hay entre dos variables cualitativas.

d. Una Odds ratio de 0.1, significativa, nos indica que la exposición estudiada es un factor que nos protege 10 veces más que la no exposición.

10. Estamos relacionando los cuatro grupos sanguíneos entre los que tienen o no tienen una determinada enfermedad. Hemos aplicado una ji-cuadrado y el valor es 5.28. Entonces:

a. Podemos decir que hay relación significativa porque 5.28 es mayor que 3.84.

b. No podemos decir que hay relación significativa porque 5.28 es menor que el valor de referencia.

c. Podemos decir que hay relación significativa porque 5.28 es menor que 15.50.

d. No podemos decir que hay relación significativa porque 5.28 es menor que 15.50.

LA MATEMÁTICA Y LA ESTADÍSTICA: UNA ORQUESTA HECHA INSTRUMENTO

Unas gramáticas de la Gramática de la Matemática y de la Estadística. Jaume Llopis Pérez.

Archivo del Autor: estadisticallopis

Ejemplos de ANOVA

Situación 113: Examen (Temas 1-9)

Solución Situación 112

Situación 112: Examen (Temas 1-17 y 19)

Solución Situación 111

Solución Situación 109

Situación 111: Examen (Temas 1-17 y 19)

Solución Situación 110

Situación 110: Examen (Temas 13-17 y 19)

Situación 109: Examen (Temas 1-9)