Archivo del Autor: estadisticallopis

Solución Situación 100

1c:Debe aplicarse la fórmula de la construcción de un intervalo de confianza del 95%. Aquí tenemos las dos fórmulas. La primera para una variable cuantitativa y la segunda para una variable dicotómica. En nuestro caso debemos aplicar la segunda:

IMG_8047

El cálculo es:

0,1±2x(Raíz(0,1×0,9))/Raíz(10000))

en tanto por uno, que da este intervalo de (9.4, 10.6), en tanto por ciento.

2c:El error estándar es 0.5 porque el radio del intervalo es 1 (porque la distancia que hay desde la media, que es 50 a cualquiera de los dos extremos del intervalo es 1) y como para construir  un intervalo del 95% de la media siempre se coge dos veces el valor de error estándar, éste error debe ser 0.5, porque dos veces 0.5 da 1.

Entonces aplicamos la fórmula del error estándar vista en el tema 3: EE=DE/Raíz(n); o sea, en nuestro caso: 0.5=DE/Raíz(400). Por lo tanto, la DE es 10.

Si ahora construimos un intervalo de valores individuales del 95% debemos coger dos veces esa DE y nos da el intervalo (30, 70). No olvidemos que los intervalos de confianza descriptivos, individuales (que significa individuo a individuo), se construyen con la DE y, en cambio, los intervalos de confianza de la media se construyen con el error estándar (EE).

3c:Con los valores (1, 2) la muestra es la que tendrá un índice de Gini mayor; o sea, será cuando tendremos un muestra con más desigualdad económica. Pensemos que se nos pide con qué dos valores aumentará el índice de Gini; o sea, con qué dos valores habrá más diferencia entre los ricos y los pobres. Añadiendo el 1 y el 2 estamos añadiendo dos personas con ganancias muy bajas. En este momento el individuo que gana 10 unidades monetarias es aún más rico respecto al resto de la muestra. Se crea más desigualdad. Esto se reflejará en un aumento del valor del índice de Gini. Evidentemente se puede calcular para comprobarlo. Pero intuitivamente debe comprenderse qué supone que se añadan dos individuos nuevos con ganancias bajas o, por el contrario, con ganancias altas.

4b: Este caso es el única en el que es coherente lo dicho en de la correlación y de la pendiente. En ambos casos se está diciendo que no hay significación.

5c: De las cuatro respuestas únicamente una presenta una relación significativa y, por lo tanto, es la única predicción posible y, por lo tanto, la mejor. Es la única que tiene un intervalo de confianza o de la pendiente o de la correlación que no tiene al 0 en su interior.

6c: Este es el único caso en el que las dos afirmaciones van en la misma dirección de la respuesta generada. En este caso si disminuimos la diferencia de medias y aumentamos la desviación estándar el p-valor subirá por las dos causas. Si disminuimos la diferencia de medias es evidente que el p-valor subirá, porque habrá más igualdad y si aumentamos la desviación estándar lo que estamos haciendo es mezclar más las muestras y esto se reflejará también en un mayor aumento del p-valor porque será aún más razonable la hipótesis nula.

En los otros casos no sucede así. O en ambos casos no se cumple el resultado dicho o en un caso sí y en otro no, lo que implica que no puede decirse en general que se obtenga en resultado argumentado. Por ejemplo, cojamos la respuesta d: Es verdad que si aumentamos la diferencia de medias el p-valor bajará, porque será más razonable rechazar la hipótesis nula, pero si disminuimos el tamaño de muestra sucederá justo lo contrario: el p-valor subirá porque será más razonable mantener la hipótesis nula. Esta contradicción entre ambas afirmaciones es lo que impide que podamos seleccionar esta opción d.

7c:Debemos aplicar la fórmula:

img_3388

pero con una variación: con un 9 en lugar de un 4 porque es un intervalo del 99.5%, lo que implica que hay que construir un intervalo con 3 veces el error estándar. El 9 viene de hacer el cuadrado de 3. Podemos deducirlo de las fórmula del inicio del Tema 16.

Si aplicamos esta fórmula con una p=0.2 y un radio r=0.01 porque se trabaja siempre en tanto por uno, obtenemos n=14400.

8c:El valor de referencia es 12.59 en una tabla 4×3. Como el valor de la ji-cuadrado es mayor que ese valor de referencia el p-valor será menor que 0.05.

9d:Variable dicotómica, muestras relacionadas, la técnica a aplicar es el Test de McNemar.

10a: Zona es un factor significativo. Claramente hay tres grupos homogéneos. El sexo no es significativo. Se observa claramente que en promedio no hay diferencias entre ambos sexos. Y hay interacción porque claramente dependiendo de la zona los valores de los sexos cambian.

 

Situación 100: Examen (Temas 1-16)

1.Si en un estudio sobre la estimación poblacional de posibles consumidores de un nuevo producto tenemos una muestra de tamaño 10000 de los cuales 1000 serían consumidores de ese producto, un intervalo de confianza del 95% del porcentaje poblacional será:

a)(9.2, 10.8)

b)(9.5, 10.5)

c)(9.4, 10.6)

d)(9.0, 11.0)

2.En un estudio vemos que nos dan el siguiente intervalo de confianza del 95% de la media: (49, 51). Leemos que el tamaño de muestra ha sido 400. ¿Cuál es el intervalo de confianza del 95% descriptivo de la variable o, también denominado, intervalo de valores individuales de esa variable?

a)(40, 60)

b)(35, 65)

c)(30, 70)

d)(45, 55)

3)Tenemos un grupo con los siguientes sueldos en unidades monetarias: (1, 5, 6, 7, 10). Si llegan al grupo dos nuevos individuos, con cuáles aumentará más el índice de Gini:

a)(1, 10)

b)(10, 12)

c)(1, 2)

d)(5, 7)

4.De las siguientes afirmaciones cuál es cierta:

a) En una Regresión es compatible una pendiente con p=0.34 con un IC de confianza del 95% de la correlación de (-0.5, -0.2)

b) En una Regresión es compatible un intervalo de confianza del 95% de la pendiente (-2.8, 5.7) con una correlación con p=0.21

c) En una Regresión es compatible una pendiente con un p-valor de 0.001 con una de la correlación  con un intervalo de confianza del 95% (-0.3, 0.5)

d) En una Regresión es compatible un intervalo de confianza del 95% de la pendiente (2.7, 5.7) con uno de la correlación de (-0.4, -0.1)

5.En cuál de las siguientes regresiones lineales simples podremos hacer mejores predicciones:

a) y=3x-2; IC del 95% de la pendiente (-1, 7).

b) y=2x-3; IC del 95% de la correlación (-0.1, 0.99)

c) y=x-2; IC del 95% de la pendiente (0.3, 2)

d) y= -4x+2; IC del 95% de la correlación (-0.7, 0.1).

6.Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.01 es cierto lo siguiente:

a)Si aumentamos el tamaño de muestra y disminuimos la desviación estándar el p-valor subirá.

b)Si aumentamos la desviación estándar y aumentamos la diferencia de medias el p-valor bajará.

c)Si disminuimos la diferencias de medias y aumentamos la desviación estándar el p-valor subirá.

d)Si disminuimos el tamaño de muestra y aumentamos la diferencia de medias el p-valor bajará.

7.Se quiere hacer un pronóstico del porcentaje de consumidores que tendría un producto y se quiere tener una muy buena precisión: que el radio del intervalo sea del 1% en un intervalo del 99.5%. Sabemos que un producto similar en países muy parecidos al nuestro tiene un porcentaje de consumo alrededor del 20%. ¿Cuál es el tamaño de muestra recomendable en base a esta información:

a)6400.

b)11500.

c)14400.

d)8800.

8.Si en una tabla de contingencias 4×3 en la que relacionamos dos variables cualitativas tenemos que el valor de la ji-cuadrado es 14.55 podemos afirmar:

a)Que el p-valor es superior a 0.05 porque 14.55 es menor que el umbral que es 21.02.

b)Que el p-valor es inferior a 0.05 porque 14.55 es mayor que el umbral que es 3.84.

c)Que el p-valor es inferior a 0.05 porque 14.55 es mayor que el umbral que es 12.59.

d)Que el p-valor es superior a 0.05 porque 14.55 es menor que el umbral que es 24.99.

9.Se comparan dos productos distintos y para ello se toma un grupo de 40 personas. Todos degustan los dos productos. La variable estudiada es si se consumiría el producto o no. Un producto lo consumiría un 10% y el otro un 5%. Para ver si esa diferencia es estadísticamente significativa debemos aplicar:

a)El Test de proporciones.

b)El Test exacto de Fisher.

c)El Test de Mann-Whitney.

d)El Test de McNemar.

10.Se ha hecho un estudio de valoración de un producto entre el 1 y el 10 en cinco zonas y en los dos sexos. Los resultados obtenidos son los siguientes:

IMG_3467

a)Zona: p<0.05 con tres grupos homogéneos. Sexo: p>0.05. Interacción: p<0.05.

b)Zona: p<0.05 con tres grupos homogéneos. Sexo: p<0.05. Interacción: p<0.05.

c)Zona: p>0.05. Sexo: p>0.05. Interacción: p<0.05.

d)Zona: p<0.05 con dos grupos homogéneos. Sexo: p<0.05. Interacción: p>0.05.

Solución Situación 99

1d: Variable continua, muestras relacionadas. La resta se ajusta a la distribución normal (Test de Shapiro-Wilk con p>0.05), por lo que debemos aplicar un test de la t de Student de datos apareados.

2a: Si disminuimos el tamaño de muestra nos fiaremos menos aún de las diferencias de medias que tengamos, por lo que el p-valor subirá. En este caso es más incoherente, aún, rechazar la hipótesis nula de igualdad de medias.

3b: Variable dicotómica, muestras independientes, tamaño de muestra superior a 30 pero valor esperado por grupo inferior a 5 porque en una muestra tenemos 6 (el 12% de 50) y en la otra 2 (el 4% de 50). Esto no proporciona un valor esperado por grupo, bajo la hipótesis nula, de 4, que es inferior a 5. Debemos aplicar, pues, un test exacto de Fisher.

4d: Si en ambas muestras tenemos los mismos individuos las muestras son relacionadas y, por lo tanto, nunca aplicaríamos un test exacto de Fisher.

5b: En un test de ajuste a la normal la hipótesis nula es que hay normalidad por lo que si el p-valor es inferior a 0.05 debemos rechazarla y admitir que no hay ajuste a la normal.

6d: Si un factor no es significativa en un ANOVA evidentemente las comparaciones múltiples nos mostrarían un único grupo homogéneo.

7b: Claramente el ANOVA nos dará un p-valor inferior a 0.05. Y claramente también se observan tres grupos homogéneos: El 1 y 2, por un lado, el 3, por otro, y el 4 y 5 por otro.

8c: Basta aplicar la fórmula n=(4*100*100)/(10*10)=400

9c: Mirando la tabla para determinar el tamaño de muestra en poblaciones finitas se observa claramente que para ese nivel de error y para ese tamaño poblacional el tamaño de muestra es 385.

10a: Los dos factores no son significativos. No hay diferencias en las medias de las dos columnas o entre las dos filas. Sin embargo, hay claramente interacción: dependiendo de la combinación de niveles de un factor con otro los resultados son muy diferentes.

 

Situación 99: Examen (Temas 13-16)

1.En un estudio donde se quiere comparar dos productos distintos tenemos 100 voluntarios. A cada voluntario le hacemos probar los dos productos. La variable respuesta analizada es una escala del 0 al 100. El test de Shapiro-Wilk de la variable resta nos da un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias no son diferentes.

c)Debemos aplicar el Test de Wilcoxon.

d)Debemos aplicar el Test de la t de Student de datos apareados.

2.Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.3 es cierto lo siguiente:

a)Si disminuimos el tamaño de muestra el p-valor subirá.

b)Si aumentamos la desviación estándar de ambas muestras el p-valor bajará.

c)Si disminuimos la diferencias de medias entre ambas muestras el p-valor bajará.

d)Ninguna de las respuestas anteriores es cierta.

3.Se comparan dos zonas distintas para ver el nivel de consumo de un producto. Tomamos 50 personas en cada zona. La variable estudiada es si se consume el producto o no. En una zona el consumo es del 12% y en la otra es del 4%. Para ver si esa diferencia es estadísticamente significativa debemos aplicar:

a)El Test de proporciones.

b)El Test exacto de Fisher.

c)El Test de Mann-Whitney.

d)El Test de McNemar.

4.Si se ha aplicado en Test exacto de Fisher no puede ser cierto:

a) El tamaño de muestra es de 100 por muestra.

b)Las muestras son independientes.

c)La variable respuesta es una variable cuantitativa dicotomizada.

d) Los individuos que tenemos son los mismos en ambas muestras.

5.¿Cuál de las siguientes afirmaciones es cierta?

a)Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que la variable estudiada no se ajusta bien a una distribución normal.

b)En un contraste de hipótesis para evaluar el ajuste a la distribución normal un p-valor inferior a 0.05 indica que no hay suficiente ajuste de los datos a la distribución normal.

c)Con una potencia inferior al 80% nos podemos fiar del p-valor que tengamos.

d)En un ANOVA de dos factores con interacción sólo miraremos el p-valor de la interacción si el p-valor de alguno de los dos factores es significativo.

6.¿Cuál de las siguientes afirmaciones es cierta?

a)Una potencia superior al 50% indica que tenemos buena capacidad predictiva.

b)Si se aplica un Test de McNemar es que las muestras no son apareadas.

c)En un ANOVA de un factor si el p-valor es menor que 0.05 ya hemos acabado el análisis.

d)Si realizamos en un ANOVA unas comparaciones múltiples en un factor no significativo encontraremos una única población homogénea.

7.En una ANOVA de un factor como el siguiente:

img_3461

a)El p-valor será menor que 0.05 y tenemos dos grupos homogéneos.

b)El p-valor será menor que 0.05 y tenemos tres grupos homogéneos.

c)El p-valor será mayor que 0.05 y tenemos dos grupos homogéneos.

d)El p-valor será menor que 0.05 y tenemos cuatro grupos homogéneos.

8.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 10 si la Desviación estándar que tenemos en una muestra piloto es de 100?:

a)250.

b)1000.

c)400.

d)25.

9.Queremos saber cuánto tamaño de muestra necesitamos para estimar el porcentaje de consumo que hay en una población de 10000 habitantes sin poder realizar una muestra piloto. Y queremos hacerlo con un radio del intervalo del 5%. El tamaño será:

a)222

b)1000

c)385

d)400

10.Tenemos los siguientes datos en un estudio donde vamos a aplicar un ANOVA de dos factores:

img_3460

¿Cuál es la afirmación más razonable?:

a)Factor A: p>0.05. Factor B: p>0.05. Interacción: p<0.05.

b)Factor A: p<0.05. Factor B: p<0.05. Interacción: p<0.05.

c)Factor A: p<0.05. Factor B: p<0.05. Interacción: p>0.05.

d)Factor A: p<0.05. Factor B: p>0.05. Interacción: p>0.05.

Solución Situación 98

1d: Los tres p-valores de un ANOVA de dos factores son independientes. Puede darse cualquiera de las posibles combinaciones en ellos. Ninguno depende de ningún otro.

2a: Variables continuas, muestras independientes, normalidad porque ambas muestras nos dan un p-valor en el Shapiro-Wilk superior a 0.05. El test de Fisher-Snedecor nos da un p-valor inferior a 0.05 por lo que son diferentes las varianzas. Habrá que aplicar un test de la t de Student de varianzas desiguales. El p-valor de este último test es inferior a 0.05 por lo tanto debemos concluir que las medias son diferentes.

3d: Ninguna de las tres primeras opciones es cierta. Por lo tanto, la cierta es la cuarta.

4a: Variable dicotómica, muestras independientes. Tamaño de muestras mayor que 30 y el valor esperado por grupo es superior a 5, por lo tanto debemos aplicar el test de proporciones.

5a: Ni el factor A ni el B son significativas. Pero, claramente hay interacción.

6c: Con unos datos como los que se dan claramente la distribución no es normal. Por lo tanto, debe aplicarse el test de Mann-Whitney.

7d: Hagamos los cálculos de la primera componente para cada individuo:

x y z w
3 4 4 -2,22
1 2 5 -2,8
4 5 1 -0,73
5 1 1 1,57

El valor superior es el del tercer individuo, el d. Es el que estará más a la derecha.

8b: El test de McNemar es claramente un test para datos apareados que es sinónimo de muestras relacionadas.

9c: Podemos aplicar un ANOVA de un factor con estos datos. Más en concreto: un factor con cinco niveles.

10c: Basta aplicar la fórmula n=(4*20*20)/(4*4)=100

 

Situación 98: Examen (Temas 13-17 y 19)

1.¿Cuál de las siguientes afirmaciones es cierta?

a)Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que las muestras son independientes.

b)En un contraste de hipótesis para evaluar el ajuste a la distribución normal un p-valor inferior a 0.05 indica que hay suficiente ajuste de los datos a la distribución normal.

c)Con una potencia superior al 50% nos podemos fiar del p-valor que tengamos.

d)En un ANOVA de dos factores con interacción el p-valor de la interacción no depende de cuál sea el p-valor de los dos factores.

2.En un estudio donde se quiere comparar dos psicoterapias distintas tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos uno de los dos tratamientos a comparar. La variable respuesta analizada es una escala del 0 al 100. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias no son diferentes.

c)Debemos aplicar el Test de Mann-Whitney.

d)Debemos aplicar el Test de la t de Student de datos apareados.

3.Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.8 es cierto lo siguiente:

a)Si aumentamos el tamaño de muestra el p-valor subirá.

b)Si aumentamos la desviación estándar de ambas muestras el p-valor bajará.

c)Si disminuimos la diferencias de medias entre ambas muestras el p-valor bajará.

d)Ninguna de las respuestas anteriores es cierta.

4.Se comparan dos tratamientos distintos para pacientes con demencia. Tomamos 200 pacientes y los repartimos al azar en dos grupos de 100 cada uno. A cada grupo le aplicamos únicamente un tratamiento. La variable elegida para evaluar ambos tratamientos es si el Mini-Mental ha bajado después de un año más de dos puntos o no, respecto al valor basal. En un grupo baja más de dos puntos el valor del Mini-Mental en un 10% de pacientes y en el otro en un 6% de pacientes. Para ver si esa diferencia es estadísticamente significativa debemos aplicar:

a)El Test de proporciones.

b)El Test exacto de Fisher.

c)El Test de Wilcoxon.

d)El Test de McNemar.

5.Tenemos los siguientes datos en un estudio clínico donde se va a aplicar un ANOVA de dos factores:

img_3460

¿Cuál es la afirmación más razonable?:

a)Factor A: p>0.05. Factor B: p>0.05. Interacción: p<0.05.

b)Factor A: p<0.05. Factor B: p<0.05. Interacción: p<0.05.

c)Factor A: p<0.05. Factor B: p<0.05. Interacción: p>0.05.

d)Factor A: p<0.05. Factor B: p>0.05. Interacción: p>0.05.

6.Hemos comparado dos tratamientos antidepresivos. La variable analizada es, después de un año, el número de los 14 efectos secundarios que pueden generar ese tipo de tratamiento. Se ha trabajado con 400 pacientes. 200 en cada grupo. Cada paciente recibe un único tratamiento. La primera muestra tiene una media muestral de 1 y una desviación estándar de 5. La segunda muestra tiene una media de 2 y una desviación estándar de 6. En base a estos datos, ¿cuál es la técnica más adecuada al caso para realizar la comparación estadística?:

a)El Test de la t de Student de varianzas iguales.

b)El Test de la t de Student de varianzas diferentes.

c)El Test de Mann-Whitney.

d)El Test de la t de Student de datos apareados.

7.En un Análisis de componentes principales la primera componente principal es W=0.5X-0.45Y-0.48Z. ¿Cuál de los siguientes puntos es el que está en la posición del 4?:

img_3462

a)(3, 4, 4)

b)(1, 2, 5)

c)(4, 5, 1)

d)(5, 1, 1)

8.¿Cuál de las siguientes afirmaciones es cierta?

a)Una potencia del 85% se corresponden con un error de tipo II del 0.25.

b)En un Test de McNemar es un test para datos apareados.

c)En un ANOVA la variable respuesta estudiada debe ser dicotómica.

d)Después de un Test de la t de Student de varianzas distintas significativo debemos aplicar unas Comparaciones múltiples para ver cuántos grupos homogéneos tenemos.

9.En unos datos como los siguientes:

img_3461

a)Podemos aplicar un ANOVA con cinco factores.

b)Podemos aplicar un test de la t de Student.

c)Podemos aplicar un ANOVA de un factor.

d)Podemos aplicar un test de la t de Student de datos apareados.

10.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 4 si la Desviación estándar que tenemos en una muestra piloto es de 20?:

a)20.

b)50.

c)100.

d)200.

Solución Situación 97

1c: Si el test de Shapiro-Wilk nos da un p-valor inferior a 0.05 es que no hay normalidad. Hay que hacer, entonces, un test de Mann-Whitney. El test de Fisher-Snedecor no es necesario.

2b: Si aumentamos la desviación estándar las muestras estarán más solapadas aún y, por lo tanto, el p-valor subirá. Será más incoherente rechazar la hipótesis nula.

3b: Variable dicotómica. Muestras independientes. Tamaño de muestra superior a 30 pero valor esperado por grupo menor que 5 porque en una muestra tenemos 5 casos (un 10% de 50) y en la otra 3 casos (un 6% de 50). El valor esperado por grupo, bajo la hipótesis nula, es 4. Por lo tanto, hemos de aplicar un test exacto de Fisher.

4b: Variable dicotómica. Muestras independientes. Tamaño de muestra superior a 30 y el valor esperado por grupo mayor que 5 porque en una muestra tenemos 4 casos (un 2% de 200) y en la otra 10 casos (un 5% de 200). El valor esperado por grupo, bajo la hipótesis nula, es 7. Por lo tanto, hemos de aplicar un test de proporciones.

5b: En un test de ajuste a la normal la hipótesis nula es que hay normalidad. Por lo que si el p-valor es menor que 0.05 debemos rechazarla.

6c: Un ANOVA se aplica únicamente a variables cuantitativas y, más en concreto, que se ajusten a la distribución normal.

7b: Claramente hay diferencias significativas entre los cinco niveles. Por lo tanto, el p-valor del ANOVA será menor que 0.05. Y se ve claramente que hay tres grupos homogéneos: El formado por los niveles 1 y 2, el formado por el nivel 3 y el formado por los niveles 4 y 5.

8d: Si aplicamos la fórmula nos da n=(4*100*100)/(40*40)=25.

9c: Hagamos los cálculos de la primera componente W para cada uno de los valores:

x y z w
3 4 4 1,38
1 2 5 -1
4 5 1 3,77
1 5 4 0,83

Por lo tanto, el que está más a la derecha es el tercer valor, el c, porque tiene el valor mayor de la primera componente.

10a: Los dos factores no son significativos. No hay diferencias en las medias de las dos columnas o entre las dos filas. Sin embargo, hay claramente interacción: dependiendo de la combinación de niveles de un factor con otro los resultados son muy diferentes.

 

Situación 97: Examen (Temas 13-17 y 19)

1.En un estudio donde se quiere comparar dos psicoterapias distintas tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos uno de los dos tratamientos a comparar. La variable respuesta analizada es una escala del 0 al 100. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor menor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias no son diferentes.

c)Debemos aplicar el Test de Mann-Whitney.

d)Debemos aplicar el Test de la t de Student de datos apareados.

2.Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.8 es cierto lo siguiente:

a)Si aumentamos el tamaño de muestra el p-valor subirá.

b)Si aumentamos la desviación estándar de ambas muestras el p-valor subirá.

c)Si disminuimos la diferencias de medias entre ambas muestras el p-valor bajará.

d)Ninguna de las respuestas anteriores es cierta.

3.Se comparan dos tratamientos distintos para pacientes con demencia. Tomamos 100 pacientes y los repartimos al azar en dos grupos de 50 cada uno. A cada grupo le aplicamos únicamente un tratamiento. La variable elegida para evaluar ambos tratamientos es si el Mini-Mental ha bajado después de un año más de dos puntos o no, respecto al valor basal. En un grupo baja más de dos puntos el valor del Mini-Mental en un 10% de pacientes y en el otro en un 6% de pacientes. Para ver si esa diferencia es estadísticamente significativa debemos aplicar:

a)El Test de proporciones.

b)El Test exacto de Fisher.

c)El Test de Wilcoxon.

d)El Test de McNemar.

4.Hemos comparado dos tratamientos antidepresivos. La variable analizada es si después de un año el paciente tiene uno de los efectos secundarios que pueden generar ese tipo de tratamiento. Se ha trabajado con 400 pacientes. 200 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 2% tienen ese efecto secundario. En el otro grupo lo tiene un 5%. Debemos aplicar:

a)El Test de Mann-Whitney.

b)El Test de proporciones.

c)El Test exacto de Fisher.

d)El Test de McNemar.

5.¿Cuál de las siguientes afirmaciones es cierta?

a)Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que la variable estudiada se ajusta bien a una distribución normal.

b)En un contraste de hipótesis para evaluar el ajuste a la distribución normal un p-valor inferior a 0.05 indica que no hay suficiente ajuste de los datos a la distribución normal.

c)Con una potencia inferior al 80% nos podemos fiar del p-valor que tengamos.

d)En un ANOVA de dos factores con interacción sólo miraremos el p-valor de la interacción si el p-valor de alguno de los dos factores es significativo.

6.¿Cuál de las siguientes afirmaciones es cierta?

a)Una potencia del 85% se corresponden con un error de tipo I del 0.15.

b)En un Test de McNemar se proporcionan dos p-valores.

c)En un ANOVA la variable respuesta estudiada debe ser cuantitativa.

d)Después de un Test de la t de Student de varianzas distintas significativo debemos aplicar unas Comparaciones múltiples para ver cuántos grupos homogéneos tenemos.

7.En una ANOVA de un factor como el siguiente:

img_3461

a)El p-valor será menor que 0.05 y tenemos dos grupos homogéneos.

b)El p-valor será menor que 0.05 y tenemos tres grupos homogéneos.

c)El p-valor será mayor que 0.05 y tenemos dos grupos homogéneos.

d)El p-valor será menor que 0.05 y tenemos cuatro grupos homogéneos.

8.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 40 si la Desviación estándar que tenemos en una muestra piloto es de 100?:

a)250.

b)50.

c)400.

d)25.

9.En un Análisis de componentes principales la primera componente principal es W=0.5X+0.45Y-0.48Z. ¿Cuál de los siguientes puntos es el que está en la posición del 4?:

img_3462

a)(3, 4, 4)

b)(1, 2, 5)

c)(4, 5, 1)

d)(1, 5, 4)

10.Tenemos los siguientes datos en un estudio clínico:

img_3460

¿Cuál es la afirmación más razonable?:

a)Factor A: p>0.05. Factor B: p>0.05. Interacción: p<0.05.

b)Factor A: p<0.05. Factor B: p<0.05. Interacción: p<0.05.

c)Factor A: p<0.05. Factor B: p<0.05. Interacción: p>0.05.

d)Factor A: p<0.05. Factor B: p>0.05. Interacción: p>0.05.

Un esquema de las principales técnicas estadística que suelen usarse en Medicina es el siguiente:

Captura de pantalla 2016-05-05 a las 14.43.17

Como puede verse hay tres tipos de técnicas estadística: las descriptivas, las de relación y las de comparación. Cada familia de estas técnicas hace justo lo que dice su nombre: describir, relacionar y comparar. En los temas del curso pueden encontrarse los detalles de cada una de estas técnicas.

La determinación del tamaño de muestra es algo común a todo estudio. Siempre debemos determinar el tamaño de muestra. Ni poca muestra ni demasiado muestra. El tamaño justo. También el tema 16 y otros artículos del apartado de complementos y del apartado de Estadística y Medicina explican la complejidad de esta determinación.

Solución Situación 96

1b: Si se hace el cálculo siguiente la fórmula vista en el Tema 3 para construir un intervalo de confianza para una variable dicotómica vemos que el resultado correcto es el b.

2c: Como la DE es 10, la media más tres veces 10 y la media menos tres veces 10 nos da este intervalo.

3d: Es el único caso donde la pendiente y la correlación siguen la misma suerte.

4b: Por debajo del primer cuartil, 14, tenemos el 25% de la muestra.

5c: Si el intervalo de confianza del 95% no incluye al cero se trata de una pendiente significativa y, por lo tanto, la correlación será necesariamente significativa.

6d: La información que nos aportan los perceptiles no depende de la normalidad o no normalidad de la muestra. Es siempre cierto.

7a: Como 3.84 es el valor umbral más pequeño de cualquier tabla de contingencias si en cualquiera de esas tablas el valor de la ji-cuadrado es menor que ese valor podemos asegurar que el p-valor será mayor que 0.05. En cambio, en general no podemos decir que si el p-valor en una tabla de contingencias es mayor de 0.05 el valor de la ji-cuadrado es mayor que 3.84. Por ejemplo, podríamos tener en una tabla, por ejemplo, 3×2 un valor de la ji-cuadrado de 5 que nos daría un p-valor mayor que 0.05 porque 5 es mayor que el valor umbral para esas tablas (5.99) y, sin embargo, no es un valor menor que 3.84.

8a: El valor umbral en una tabla 3×2 es 5.99. Como 10.35 es mayor que 5.99 se trata de una relación significativa.

9c: En una tabla 6×6 el valor de umbral es 37.65. Como 37 es menor que ese valor umbral no se trata de una relación estadísticamente significativa.

10d: En una tabla 4×3 el valor de referencia es 12.59. Como 5.84 es menor que ese valor umbral el p-valor será mayor que 0.05.