Archivo del Autor: estadisticallopis

Situación 192: Examen (Temas 1-17 y 19)

1.Si en un estudio sobre la prevalencia de una enfermedad psiquiátrica tenemos una muestra de tamaño 10000 de los cuales 800 tienen esa patología, un intervalo de confianza del 99.5% del porcentaje poblacional será:

a)(7.19, 8.81)

b)(7.46, 8.54)

c)(7.01, 8.99)

d)(7.50, 8.50)

2.En un estudio vemos que nos dan el siguiente intervalo de confianza del 95% de la media: (49.8, 50.2). Leemos que el tamaño de muestra ha sido 10000. ¿Cuál es el intervalo de confianza del 95% descriptivo de la variable o, también denominado, intervalo de valores individuales de esa variable?

a)(40, 60)

b)(30, 70)

c)(35, 65)

d)(45, 55)

3.¿En cuál de las siguientes muestras el rango intercuartílico mayor?

a)(1, 3, 6, 10)

b)(1, 5, 5, 8, 12)

c)(1, 3, 3, 3, 7)

d)(1, 1, 3, 6)

4.De las siguientes afirmaciones cuál es cierta:

a)En una Regresión lineal simple es compatible una pendiente con p=0.85 con un IC de confianza del 95% de la correlación de (-0.7, -0.1)

b) En una Regresión logística es compatible un intervalo de confianza del 95% del coeficiente B (-0.6, -0.2) con un intervalo de confianza de la Odds ratio de (-2.1, -0.3).

c) En una comparación de medias es compatible un p-valor de 0.01 con un intervalo de confianza de la diferencia de medias del 95% (-2.1, -1.1)

d) En una comparación de proporciones es compatible un intervalo de confianza del 95% de la diferencia de proporciones de (0.1, 0.5) con un p-valor de 0.27.

5.En el artículo titulado «Efectos del género y la educación en la felicidad en adultos argentinos» donde se realiza un ANOVA con los factores Género (G) y Nivel educativo (NE) se tiene la siguiente tabla:

¿Qué afirmación es cierta?

a)Hay efectos de género por ser el p-valor 0.000.

b)Hay efecto interacción.

c)El Nivel educativo no es significativo.

d)No hay efecto interacción, hay efecto educativo y no hay efecto género.

6.En el artículo de la pregunta anterior tenemos el siguiente gráfico de interacción:

¿Cuál de las siguientes afirmaciones es la más coherente?

a)Hay claras diferencias significativas en el factor Género.

b)Hay un efecto interacción debido al cruce entre ambos géneros en los niveles educativos 1 y 2.

c)No hay efectos en el factor Nivel educativo.

d)Ninguna de las respuestas anteriores es cierta.

7.Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.1 es cierto lo siguiente:

a)Si aumentamos el tamaño de muestra y aumentamos la desviación estándar el p-valor subirá.

b)Si aumentamos la desviación estándar y disminuimos la diferencia de medias el p-valor bajará.

c)Si disminuimos las diferencias de medias y aumentamos el tamaño de muestra el p-valor bajará.

d)Si disminuimos el tamaño de muestra y disminuimos la diferencia de medias el p-valor subirá.

8.Si en una tabla de contingencias 4×5 en la que relacionamos dos variables cualitativas tenemos que el valor de la ji-cuadrado es 14.55 podemos afirmar:

a)Que el p-valor es superior a 0.05 porque 14.55 es menor que el umbral que es 21.02.

b)Que el p-valor es inferior a 0.05 porque 14.55 es mayor que el umbral que es 3.84.

c)Que el p-valor es inferior a 0.05 porque 14.55 es mayor que el umbral que es 12.59.

d)Que el p-valor es superior a 0.05 porque 14.55 es menor que el umbral que es 24.99.

9.Se ensayan dos medicamentos (A y B) en 100 pacientes con Alzhéimer, en dos épocas distintas. Cada paciente recibe, pues, ambos tratamientos en épocas diferentes. La variable estudiada es el cambio en el valor del Minimental durante el período. Se realiza la resta de los valores, individuo a individuo, de ese descenso, y se aplica el test de Shapiro-Wilk. El p-valor es 0.87. ¿Qué técnica estadística debemos aplicar?

a)El Test t de Student de varianzas iguales.

b)El Test t de Student de datos apareados.

c)El Test de Mann-Whitney.

d)El Test de Wilcoxon o el test de los signos. Cualquiera de los dos.

10.Se aplica un test de comparación de proporciones y resulta que nos dicen que el intervalo de confianza del 95% de la diferencia de proporciones poblacionales es (0.15, 0.25). ¿Qué respuesta es cierta?

a)No hay diferencia estadísticamente significativa.

b)El p-valor es 0.11.

c)El error estándar es 0.025.

d)Un intervalo de confianza del 99.5% sería (0.10, 0.30)

11.En un estudio de comparación de dos poblaciones tenemos el siguiente cálculo de potencia estadística:

¿Cuál de las siguientes afirmaciones es cierta?

a)Si aumentamos los dos tamaños de muestra la potencia disminuirá.

b)Si la medias pasan a ser 3 y 4, la potencia aumentará.

c)Si la desviación estándar pasa a ser 3, la potencia aumentará.

d)Ninguna de las tres afirmaciones anteriores es cierta.

12.Se quiere hacer un pronóstico del porcentaje de personas que en España se medican con antidepresivos. Se quiere tener una muy buena precisión: que el radio del intervalo sea del 1% en un intervalo del 99.5%. No tenemos información en un país similar al nuestro de las personas que consumen este tipo de medicamentos. ¿Cuál es el tamaño de muestra recomendable en base a esta información?:

a)6400.

b)22500.

c)14400.

d)12800.

13.¿Cuál de estas cuatro informaciones es coherente?

a)OR=3.1; IC 95% (0.2, 0.45); p=0.001

b)d de Cohen=0,03; Diferencia de medias=3; Desviación estándar promedio=10.

c)B=1 y OR=2,71828, en una Regresión logística.

d)r=0.5 con IC 95% (0.2, 0.8) y Pendiente de la Regresión con IC 95% (-2.3, -0.85)

14.¿Qué Odds ratio indica una mayor relación?

a)OR=2; IC 95% (0.8, 2.1)

b)OR=-3.5; IC 95% (-4.2, -1.2)

c)OR=0.5; IC 95% (0.25, 0.87)

d)OR=2.5; IC 95% (1.2, 3.9)

15.En un Análisis de componentes principales la primera componente principal es V=0.5X+0.5Y+0.5Z y la segunda es W=0.5X-0.01Y-0.5Z ¿Cuál de los siguientes puntos es el que está en la posición del 1?:

a)(1, 0, 1)

b)(5, 2, 2)

c)(2, 2, 5)

d)(0, 1, 1)

16.¿Cuál de las siguientes afirmaciones es cierta?

a)Una Odds ratio de 0.5 con un intervalo de confianza del 95% que contenga al cero no es estadísticamente significativa.

b)En una Regresión logística que relacione la edad con sufrir o no una determinada patología, si la OR nos proporciona un IC 95% (1.23, 1.56) la edad representa un factor de riesgo significativo.

c)En un ANOVA de dos factores es imposible que los dos factores no nos proporcionen efectos y la interacción sí.

d)Un estudio con una kappa de 0.01 entre dos operadores indica muy buena concordancia entre ellos porque el valor está por debajo de 0.05.

17. Hemos de comparar dos tratamientos psicoterapéuticos a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 100 pacientes. 50 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 8% consigue la rehabilitación psicológica. En el otro grupo un 4% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Mann-Whitney.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

18.¿Cuál de las siguientes afirmaciones es cierta?

a)La d de Cohen evalúa si hay diferencias estadísticamente significativas entre las medias de dos poblaciones.

b)El Kappa evalúa el grado de relación entre dos variables cuantitativas.

c)La Regresión lineal simple evalúa la relación entre una variable cuantitativa y una variable dicotómica.

d)La V de Crámer evalúa la cantidad de relación que hay entre dos variables cualitativas.

19. En un estudio donde se quiere comparar la eficacia de dos tareas distintas para elevar el nivel de escritura de unos alumnos tenemos 100 adolescentes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo una de las dos tareas a comparar. Después del ensayo se les pasa a todos el PROESC. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a.Si el test de la t de Student para varianzas desiguales da un p-valor inferior a 0.05 debemos concluir que las medias poblacionales son diferentes.

b.Si el test de la t de Student para varianzas desiguales da un p-valor superior a 0.05 debemos concluir que las medias poblacionales son diferentes.

c.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que las medias poblacionales son diferentes.

d.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que no podemos decir que las medias poblacionales son diferentes.

20.Estamos relacionado tres tipos de trastornos del sueño con los cuatro grupos sanguíneos. Hemos construido para ello una tabla de contingencias. Hemos hecho la ji-cuadrado y nos da una ji-cuadrado de 16.81. El p-valor es:

a.0.01

b.0.0001

c.0.005

d.0.025

Solución Situación 191

Grupo 1

1d. En un ANOVA de dos factores los tres p-valores pueden aparecer en cualquier disposición. Una clara posibilidad es que ninguno sea inferior a 0.05 y, por lo tanto, ninguno significativo. La a no es cierta porque en una regresión logística no existe ninguna pendiente de la recta. Existe un coeficiente B que denominamos también el coeficiente que multiplica a la variable independiente, pero no es la pendiente de ninguna recta. La b no es cierta porque que se haya aplicado el test exacto de Fisher no es garantía de que el tamaño de muestra por grupo era menor de 30. Podría ser mayor de 30 y que el valor esperado por grupo fuera mayor que 5. Si es el tamaño de muestra menor de 30 se aplica el test exacto de Fisher pero que se aplique este test no es garantía de que el tamaño de muestra es menor que 30. La c no es correcta porque la d de Cohen mide el tamaño del efecto, no la significación. Puedes tener una d de Cohen muy alta, pero si no tiene significación no sirve para nada.

2c

3c

4a

5d

Grupo 2

1d

2b

3b

4d

5b

Grupo 3

1d

2b

3b

4b

5c

Situación 191: Examen (Temas 8-17)

Grupo 1

1.¿Cuál de las siguientes afirmaciones es cierta?

a.Si en una regresión logística la pendiente de la recta tiene un IC 95% (-3.45, 4.56) no es significativa porque incluye el IC al cero.

b.Si se aplica un test exacto de Fisher es que el tamaño de muestra por grupo es menor de 30.

c.La d de Cohen sirve para evaluar la diferencia significativa entre dos poblaciones.

d.En un ANOVA de dos factores podemos tener los tres p-valores no significativos.

2.Si tenemos que predecir el número de personas que padecen Trastorno bipolar en España y no tenemos ninguna información previa y queremos tener un IC del 95% con un radio del 2%, el tamaño de muestra que necesitamos es:

a.3000

b.5625

c.2500

d.1250

3. Hemos de comparar dos tratamientos psicoterapéuticos a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 100 pacientes. 50 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 8% consigue la rehabilitación psicológica. En el otro grupo un 4% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a)Aplicar un Test de Mann-Whitney.

b)Aplicar un Test de proporciones.

c)Aplicar un Test exacto de Fisher.

d)Aplicar un Test de McNemar.

4.Estamos relacionado tres tipos de trastornos del sueño con los cuatro grupos sanguíneos. Hemos construido para ello una tabla de contingencias. Hemos hecho la ji-cuadrado y nos da una ji-cuadrado de 16.81. El p-valor es:

a.0.01

b.0.0001

c.0.005

d.0.025

5.¿Cuál de las siguientes afirmaciones es cierta?

a)Una Odds ratio de 1.56 con un intervalo de confianza del 95% (0.78, 2.38) es estadísticamente significativa porque el IC no contiene al 0.

b)En un Análisis de componentes principales si la primera componente tiene la forma Y=0.5X1+0.5X2+0.5X3 el individuo con valores (1, 2, 3) está más a la derecha que el individuo con valores (3, 2, 1).

c)Si en un estudio elevamos el tamaño de muestra la potencia estadística disminuirá.

d)Al aumentar la diferencia de medias y disminuir la desviación estándar desciende el p-valor de un estudio de comparación de dos poblaciones.

Grupo 2

1.¿Cuál de las siguientes afirmaciones es cierta?

a.Si en una regresión logística el coeficiente B tiene un IC 95% (0.45, 1.56) no es significativo porque el IC incluye al 1.

b.Si se aplica un test exacto de Fisher es que el tamaño de muestra por grupo es mayor de 30.

c.La d de Cohen sirve para evaluar la diferencia significativa entre dos poblaciones.

d.En un test de la t de Student si las medias muestrales son iguales el p-valor valdrá 1.

2.Si tenemos que predecir el número de personas que padecen Trastorno bipolar en España y no tenemos ninguna información previa y queremos tener un IC del 95% con un radio del 4%, el tamaño de muestra que necesitamos es:

a.300

b.625

c.250

d.125

3. Hemos de comparar dos tratamientos psicoterapéuticos a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 400 pacientes. 200 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 3% consigue la rehabilitación psicológica. En el otro grupo un 5% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a)Aplicar un Test de Mann-Whitney.

b)Aplicar un Test de proporciones.

c)Aplicar un Test exacto de Fisher.

d)Aplicar un Test de McNemar.

4.Estamos relacionado seis tipos de trastornos del sueño con los cuatro grupos sanguíneos. Hemos construido para ello una tabla de contingencias. Hemos hecho la ji-cuadrado y nos da una ji-cuadrado de 22.30. El p-valor es:

a.0.01

b.0.001

c.0.5

d.0.1

5.¿Cuál de las siguientes afirmaciones es cierta?

a)Una Odds ratio de 1.56 con un intervalo de confianza del 95% que contenga (0.78, 2.38) es estadísticamente significativa porque el IC contiene al 1.

b)En un Análisis de componentes principales si la primera componente tiene la forma Y=0.5X1+0.01X2-0.5X3 el individuo con valores (1, 2, 3) está más a la izquierda que el individuo con valores (3, 2, 1).

c)Si en un estudio elevamos el tamaño de muestra la potencia estadística no cambiará.

d)Al aumentar la diferencia de medias y aumentar la desviación estándar desciende el p-valor de un estudio de comparación de poblaciones.

Grupo 3

1.¿Cuál de las siguientes afirmaciones es cierta?

a.Si en una regresión logística la Odds ratio tiene un IC 95% (0.45, 1.56) es significativa porque  el IC no incluye al cero.

b.Si se aplica un test de McNemar es que el tamaño de muestra por grupo es menor de 30.

c.El kappa sirve para evaluar la diferencia significativa entre dos poblaciones.

d.Un IC del 95% (0.34, 0.55) sobre la diferencia de proporciones poblacionales es compatible con una p=0.001.

2.Si tenemos que predecir el número de personas que padecen Trastorno bipolar en España y no tenemos ninguna información previa y queremos tener un IC del 95% con un radio del 5%, el tamaño de muestra que necesitamos es:

a.300

b.400

c.1500

d.250

3. Hemos de comparar dos tratamientos psicoterapéuticos a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 1000 pacientes. 500 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 2% consigue la rehabilitación psicológica. En el otro grupo un 1% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a)Aplicar un Test de Mann-Whitney.

b)Aplicar un Test de proporciones.

c)Aplicar un Test exacto de Fisher.

d)Aplicar un Test de McNemar.

4.Estamos relacionado dos tipos de trastornos del sueño con los cuatro grupos sanguíneos. Hemos construido para ello una tabla de contingencias. Hemos hecho la ji-cuadrado y nos da una ji-cuadrado de 6.25. El p-valor es:

a.0.01

b.0.1

c.0.001

d.0.025

5.¿Cuál de las siguientes afirmaciones es cierta?

a)Una Odds ratio de 4 significativa indica más relación que una de 0.5 también significativa porque el valor está más alejado del 1.

b)En un Análisis de componentes principales si la primera componente tiene la forma Y=0.5X1-0.5X2+0.5X3 el individuo con valores (1, 5, 1) está más a la derecha que el individuo con valores (1, 2, 1).

c)Si en un estudio disminuimos la desviación estándar la potencia estadística aumentará.

d)Al aumentar la diferencia de medias y disminuir el tamaño de muestra el p-valor de un estudio de comparación de poblaciones no cambiará.

Situación 190 (Examen práctico)

Entre los test diagnósticos de TDAH más utilizados se encuentra el EDAH. Es una escala que va de 0 a 60.

Entre los test para detectar trastornos en la escritura el más utilizado actualmente es el test PROESC, un test compuesto de las siguientes dimensiones:

DS: Dictado de sílabas: Un máximo de 25 puntos

P_OA: Palabras con ortografía arbitraria: Un máximo de 25 puntos

P_OR: Palabras con ortografía reglada: Un máximo de 25 puntos

PSP_T: Dictado pseudopalabras-total: Un máximo de 25 puntos

PSP_RO: Dictado pseudopalabras-reglas-ortográficas: Un máximo de 15 puntos

F_A: Dictado de frases. Acentos: Un máximo de 15 puntos

F_M: Dictado de frases. Mayúsculas: Un máximo de 15 puntos

F_SP: Dictado de frases. Signos de puntuación: Un máximo de 8 puntos

C: Escribir un cuento: Un máximo de 10 puntos

R: Escribir una redacción: Un máximo de 10 puntos

TOTAL: Un máximo de 173 puntos

Se ha realizado un estudio donde se compara un grupo Control, sin diagnóstico de TDAH, con un grupo de pacientes de TDAH. Todos los niños y niñas incluidos en el estudio tenían entre 15-16 años.

Los resultados obtenidos son los siguientes:

1.Hacer una descriptiva básica de la variable EDAH y de la variable TOTAL del test PROESC por grupo (Control y TDAH por separado), incluyendo un Box-Plot de cada caso.

2.Estudiar qué variables entre todas las estudiadas (EDHA y todos los ítems del test PROESC) tienen una correlación estadísticamente significativa. ¿Existe relación entre la variable EDHA>15 y la variable PROESCtotal>150 en los controles?

3.Estudiar la posibilidad de hacer una regresión lineal simple que pronostique el resultado del test PROESC total a partir del valor del test EDHA en pacientes con diagnóstico de TDAH.

4.Estudiar la posibilidad de hacer una Regresión logística que permita pronosticar la probabilidad de que un niño o niña tenga TDAH a partir del test PROESC.

5.Estudiar qué variables, entre las contempladas en el test PROESC, tienen una diferencia de medias, estadísticamente significativa, entre los dos grupos comparados. Evaluar, también, el tamaño del efecto de esa diferencia.

El test EDHA lo podéis consultar en el siguiente enlace:

EDHA

El test PROESC lo podéis consultar en el siguiente enlace:

PROESC

Situación 188: Examen (Temas 1-7)

1.En la muestra (8, 9, 5, 3, 6, 1, 2, 10, 123), ¿qué afirmación es cierta?

a)El primer cuartil es 2.5.

b)El tercer cuartil es 9.

c)El tercer cuartil es 8.

d) El rango intercuartílico es 5.

2.Indicar dónde hay una incoherencia:

a)IC 95% de la r: (0.23, 0.56) y p-valor de la correlación de 0.001

b)IC 95% de la r: (-0.31, 0.12) y p-valor de la pendiente de 0.34

c)IC 95% de la r: (0.23, 0.56) e IC 95% de la pendiente de la recta: (-0.34, -0.12)

d)P-valor de la r de 0.23 y p-valor de la constante de la recta de 0.001

3. ¿Qué afirmación entre las siguientes es cierta?

a)Podemos tener un primer cuartil de 8 y un tercer cuartil de 8.

b)Podemos tener una mediana de 10 y un tercer cuartil de 5.

c)Podemos tener un primer cuartil de 2, y un rango intercuartílico de -3.

d)Podemos tener un tercer cuartil de 3, una mediana de 10 y un rango intercuartílico de 6.

4. ¿Qué afirmación no es cierta?

a)Sin más información adicional una r=0.9 es una correlación con igual capacidad predictiva que una correlación r=-0.6.

b) r=0.4; IC 95%: (-0.1, 0.9) es una correlación mayor que r= – 0.3 (asociada a una pendiente de la recta construida con IC95%: (-12.3, -7.4)).

c) r=0.6 (p=0.03) es una correlación mayor que la correlación que se tiene de una regresión con IC 95% de la pendiente de (-12.3, 18.7).

d) r=0.3 (p=0.23) es una correlación igual que una r=0.8 (p=0.53)

5. Tenemos una muestra de tamaño 400 de una variable que se ajusta bien a una distribución normal. El IC de la media del 99.5% es (48.5, 51.5). La media muestral es 50. ¿Qué afirmación es cierta?

a) Un Intervalo de confianza del 95% de la media sería: (49.0, 51.0).

b) Un intervalo de confianza del 95% de valores individuales de la variable sería: (37.5, 62.5).

c) Un intervalo de confianza del 68.5% de la media sería: (42.5, 57.5).

d) Un intervalo de confianza del 99.5% de valores individuales de la variable sería: (10.5, 89.5).