Archivos Mensuales: junio 2019

Solución Situación 140

1c. Usando la fórmula del tema 3 se obtiene este resultado.

2d. El intervalo de confianza incluye al 0, por lo tanto hay igualdad.

3a. Mínimo 0. Primer cuartil 3. Mediana 4. Tercer cuartil 5. Máximo 7.

4a. De las correlaciones significativas es la que tiene un valor absoluto de la correlación mayor.

5c. La OR y su intervalo de confianza indican que hay significación. Sin embargo, la ji-cuadrado no supera el umbral, lo que indica que, según ella, no habría relación. Esto es contradictorio.

6ac. Hay dos soluciones correctas, por error. En ambos casos se está  dando un intervalo de confianza que no incluye al 0 y un p-valor inferior a 0.05.

A quien haya contestado a una de las dos opciones le contaré como buena. Quien no haya contestado a esta pregunta el examen le contaré sobre 19 preguntas, para no penalizar a quien haya podido despistarle la situación.

7b. Como el intervalo no contiene al cero rechazamos la igualdad de proporciones. Por lo tanto, se trata de una diferencia significativa.

8b. En una tabla 3×3 el umbral es 9.48. Como 7.89 es menor que el umbral no hay relación significativa.

9d. La correlación de Pearson no tiene aplicación en variables cualitativas.

10a. Hay normalidad en las dos muestras. Hay diferencia de desviaciones estándar. Por lo tanto, debe aplicarse una t de Student de variantes desiguales.

11c. Son muestras independientes. El tamaño de muestra es mayor que 30 pero el valor esperado por grupo es 3, que es menor que 5. Debemos aplicar el test exacto de Fisher.

12c. Medicamente es significativo. Sexo no. Y hay claramente interacción.

13c. No zona, ni tratamiento es significativo. Por lo tanto, sólo hay un grupo homogéneo.

14c. Para estar a la derecha hay que tener valores grandes de la primera y cuarta variable y pequeños de la segunda y tercera. Esto sucede en b y c. Pero para estar arriba debe ser grande la segunda variable y pequeña la tercera, cosa que sucede en c.

15c. El individuo a y b son los que están más cerca. Los valores son muy iguales. Luego d y e. Finalmente c está más cerca de d y e que de a y b.

16c. Si las medias son más distantes aumentaremos la potencia del estudio.

17d. Si aumentamos el tamaño de muestra y la OR no se modifica el intervalo de confianza se hará más estrecho por lo dos lados del intervalo, no sólo por uno.

18c. Si aplicamos la fórmula de la determinación del tamaño de muestra en una proporción, con 9 en el numerador, por ser un intervalo del 99.5% y con un valor de 0.5 como p prevista, el resultado es 900.

19c. DJ y LP están a la derecha. Deben tener ambos valores bastantes grandes de las cuatro variables originales. Esto sucede tanto en a como en b. Sin embargo como DJ está arriba y LP está abajo, viendo la segunda componente DJ debe tener valores grandes de la segunda variable y pequeños de la tercera y LP lo contrario. Esto sucede en c y no en a. La b es incorrecta porque MM estaría a la derecha de LP y la d no es correcta porque aunque MM estaría a la izquierda y LP a la derecha, LP estaría muy arriba no abajo.

20d. En un ANOVA de dos factores cruzados, hay interacción y por lo tanto hay tres p-valores a evaluar.

Situación 140: Examen (Temas 1-16, 17 y 19)

1.Estamos interesados en predecir cuántas personas tienen trastornos de la alimentación en España. Para ello se toma al azar una muestra de tamaño 1000. Observamos que 150 tienen algún tipo de estos trastornos. Un intervalo de confianza del 95% del porcentaje poblacional es el siguiente:

a.(11.61, 18.39).

b.(12.50, 17.50).

c.(12.74, 17.26).

d.(13.25, 16.75).

2.¿Cuál de estas afirmaciones hay incompatibilidad?

a.En un contrate de hipótesis de igualdad de medias una p=0.44 y un IC del 95% de la diferencia de medias entre ambas poblaciones de (-0.9, 1.39).

b.En una Odds ratio una p=0.03 y un IC del 95% de (0.22, 0.91).

c.En una correlación de Pearson una p=0.12 y un IC del 95% de (-0.38, 0.22).

d.En una comparación de proporciones un p-valor: p=0.02 y un IC del 95% de la diferencia de proporciones entre ambas poblaciones de  (-0.12, 0.34).

3.¿A cuál de las siguientes cuatro muestras tiene el siguiente Box-Plot?

a.(0, 3, 4, 5, 7))

b.(0, 3, 5, 7)

c.(0, 4, 5, 7)

d.(0, 3, 3, 5, 7)

4.¿Cuál de las siguientes correlaciones corresponde a una regresión con una mayor capacidad predictiva?

a.r=-0.71 IC 95%: (-0.99, -0.12)

b.r=0.8 IC 95%: (-0.08, 0.99)

c.r=0.55 IC 95%: (0.25, 0.90)

d.r=-0.34; p=0.001

5.¿En cuál de las siguientes Odds ratio hay una incompatibilidad?

a.OR=2; IC 95%: (1.00, 3.33); Ji-cuadrado=3.84.

b.OR=1.45; IC 95%: (0.82, 2.82); Ji-cuadrado=0.84.

c.OR=0.25; IC 95%: (0.13, 0.54); Ji-cuadrado=2.84.

d.OR=0.78; IC 95%: (0.69, 0.88); Ji-cuadrado=8.34.

6.¿Cuál de las siguientes afirmaciones es cierta?

a.Una pendiente con un IC 95%: (0.85, 5.45) es compatible con una correlación con p-valor 0.02.

b.Una OR de 1.34 con p=0.04 es compatible con un IC del 95% de la OR de (0.97, 1.99).

c.Una correlación con un IC 95%: (0.23, 0.43) es compatible con una p=0.001.

d.Una diferencia de medias significativa (p=0.11) es compatible con unos IC del 95% de las ambas medias de las dos poblaciones como los siguientes: (23, 34) y (36, 47).

7.¿Cuál de las siguientes afirmaciones es cierta?

a.Si la potencia de un estudio de comparación de dos poblaciones es del 50% si el p-valor es superior a 0.05 podemos decir que no hay diferencias significativas.

b.Si un Intervalo de confianza del 95% de la diferencia entre dos proporciones poblacionales es (0.08, 0.23) podemos decir que hay diferencias estadísticamente significativas entre ambas proporciones poblacionales.

c.Una OR de 10 será estadísticamente significativa porque es muy grande.

d.En un ANOVA con un factor con siete niveles como mínimo encontraremos que uno de los niveles es distinto a los demás.

8.Estamos relacionando tres niveles distintos de depresión con tres niveles de afectación de un determinado trastorno psiquiátrico. El valor de la ji-cuadrado es 7.89. Entonces:

a.Podemos decir que hay relación significativa porque 7.89 es menor que 9.48.

b.Podemos decir que no hay relación significativa porque 7.89 es menor que 9.48.

c.Podemos decir que hay relación significativa porque 7.89 es menor que 16.91.

d.Podemos decir que no hay relación significativa porque 7.89 es menor que 16.91.

9.Estamos relacionando tener o no una determinada enfermedad autoinmunitaria con tener o no un determinado trastorno psiquiátrico. Entonces, ¿cuál de las siguientes afirmaciones no es cierta?:

a.Podremos aplicar una ji-cuadrado para ver si hay relación entre ambos trastornos.

b.Podremos calcular una Odds ratio para evaluar qué tipo de relación hay, si es que la hay.

c.Podremos calcular una V de Crámer para medir la relación entre ambas variables.

d.Podremos calcular una correlación de Pearson para evaluar la cantidad de relación y para evaluar si la relación es directa o inversa.

10.En un estudio donde se quiere comparar dos psicoterapias tenemos 400 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo uno de los dos tratamientos a comparar. El test de Shapiro-Wilk de la primera muestra tiene una p=0.23 y el de la segunda muestra tiene una p=0.34. El test de Fisher-Snedecor nos proporciona una p=0.01. Es cierto lo siguiente:

a.Debemos aplicar el test de la t de Student para varianzas desiguales.

b.Debemos aplicar el test de Mann-Whitney.

c.Debemos aplicar el test de la t de Student para varianzas iguales.

d.Debemos aplicar el test de la t de Student de datos apareados.

11.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 100 pacientes. 50 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 8% consigue la rehabilitación psicológica. En el otro grupo un 4% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Wilcoxon.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

12.Tenemos los siguientes datos en un estudio donde se aplican tres medicamentos distintos (A, B y C) a un grupo de pacientes que tienen una determinada patología y que se han diferenciado en hombres y mujeres.  Con los datos obtenidos se pretende ver la diferencia entre tratamientos, entre sexos y si hay o no interacción. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Medicamento: p<0.05. Factor Sexo: p<0.05. Interacción: p<0.05.

b.Factor Medicamento: p<0.05. Factor Sexo: p<0.05. Interacción: p>0.05.

c.Factor Medicamento: p<0.05. Factor Sexo: p>0.05. Interacción: p<0.05.

d.Factor Medicamento: p<0.05. Factor Sexo: p>0.05. Interacción: p>0.05.

13.Tenemos los siguientes datos en un estudio donde se aplican tres tratamientos psicoterapéuticos (P1, P2, P3) en pacientes con la misma patología de tres zonas del mundo muy distintas (Z1, Z2, Z3).  Con los datos obtenidos se pretende ver la diferencia entre tratamientos, entre zonas y ver, finalmente, si hay o no interacción. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Tratamiento: p<0.05. Con tres grupos homogéneos.

b.Factor Tratamiento: p>0.05. Con dos grupos homogéneos.

c.Factor Zona: p>0.05. Con un grupo homogéneo.

d.Factor Zona: p<0.05. Con dos grupos homogéneos.

14.¿Cuál es el punto d en un Análisis de Componentes Principales con las dos siguientes primeras componentes principales: Y1=0.5X1-0.5X2-0.5X3+0.5X4 e Y2=0.01X1+0.5X2-0.5X3-0.01X4?

a.(2, 5, 5, 1)

b.(5, 1, 3, 5)

c.(5, 3, 1, 5)

d.(1, 5, 4, 2)

15.¿Cuál de los siguientes repertorios de puntos, de un espacio de cinco dimensiones, va asociado al siguiente dendrograma?

a.(4, 4, 4, 4, 1), (4, 4, 7, 7, 3), (4, 4, 6, 6, 2), (1, 3, 5, 5, 6), (1, 3, 5, 6, 5)

b.(1, 3, 5, 6, 5), (4, 4, 4, 4, 1), (4, 4, 7, 7, 3), (4, 4, 6, 6, 2), (1, 3, 5, 5, 6)

c.(1, 3, 5, 5, 6), (1, 3, 5, 6, 5), (4, 4, 4, 4, 1), (4, 4, 7, 7, 3), (4, 4, 6, 6, 2)

d.(1, 3, 5, 6, 5), (4, 4, 4, 4, 1), (4, 4, 7, 7, 3), (1, 3, 5, 5, 6), (4, 4, 6, 6, 2)

16. Tenemos el siguiente análisis de potencia en una comparación de dos poblaciones:

¿Qué afirmación es cierta?

a.La potencia es suficiente porque es superior al 50%.

b.Si la desviación estándar común la cambiamos de 3 a 2 la potencia disminuirá.

c.Si las medias muestras en lugar de ser 6 y 8 fueran 6 y 9 la potencia subiría.

d.Si el tamaño de muestra por grupo pasa a ser de 30 la potencia disminuirá.

17.En un estudio para ver si había relación entre un determinado comportamiento y una determinada enfermedad teníamos una OR=2.15, con un intervalo de confianza del 95%: (0.65, 8.35). ¿Qué afirmación es cierta?

a.Si aumentamos el tamaño de muestra y la OR no se modifica un intervalo del 95% factible sería (1.12, 9.85).

b.Si aumentamos el tamaño de muestra y la OR no se modifica un intervalo del 95% podría ser perfectamente el mismo: (0.65, 8.35)..

c.Si aumentamos el tamaño de muestra y la OR no se modifica un intervalo del 95% factible sería (0.3, 6.1).

d.Si aumentamos el tamaño de muestra y la OR no se modifica un intervalo del 95% factible sería (1.3, 6.5).

18.Se quiere hacer un pronóstico del porcentaje de personas que tienen un determinado trastorno psiquiátrico en España. Es un tipo de trastorno que sabemos que es muy abundante y que en estudios similares en otros países similares se ha visto que la mitad de la población lo tenían. ¿Qué tamaño muestral necesitamos tomar para tener un intervalo del 99.5% con un radio de 5%?:

a.100.

b.450.

c.900.

d.400.

19.Hemos realizado un Análisis de componentes principales de un test que consta de cuatro ítems. Hemos hecho una representación de los pacientes con sus iniciales en las dos primeras componentes principales:

Las componentes son:

Y1=0.5X1+0.5X2+0.5X3+0.5X4

Y2=0.01X1+0.5X2-0.5X3+0.01X4

¿Cuál de las cuatro respuestas es la más razonable?

a.DJ es (5, 6, 7, 5) y LP es (4, 5, 6, 7).

b.MM es (5, 6, 7, 5) y LP es (2, 2, 3, 4).

c.DJ es (5, 7, 4, 5) y LP es (4, 4, 7, 7).

d.MM es (2, 1, 5, 5) y LP es (4, 5, 2, 7).

20.¿Cuál de las siguientes afirmaciones es cierta?

a.Una potencia del 90% se corresponden con un error de tipo II del 0.9.

b.Un Test de McNemar es un test para muestras independientes de variables cuantitativas.

c.Una Odds ratio de 10 se corresponde, como intensidad de relación, con una Odds ratio de 0.5.

d.En un ANOVA de dos factores cruzados tendremos tres p-valores a valorar.