Archivo de la categoría: PROBLEMAS

Solución Situación 138

1b: El Intervalo de una OR nunca puede tener valores negativos. En todo caso, el intervalo no contiene al 1, por lo tanto es incompatible con un p-valor superior a 0.05

2d: El Tratamiento no es significativo, el Grupo sanguíneo es significativo es significativo. No hay interacción significativa, porque los valores por cada población son paralelos.

3b: Como una de las dos muestras no se ajusta a la normal debe aplicarse el test de Mann-Withney.

4c: Obsérvese el cálculo de los valores de las dos componentes para los cuatro puntos:

Los puntos c y el d son los que están más a la derecha porque son los que tienen un valor mayor para la componente 1. El c es el que está más arriba, mirando los valores que tienen el c y el d en la componente 2.

5d: Al aumentar el tamaño de muestra el p-valor bajará, al disminuir la desviación estándar el p-valor bajará y al disminuir la diferencia de medias el p-valor subirá. El único perfil que supone: bajada, bajada y subida es el d.

6b: Si la OR no es significativa, porque la p es superior a 0.05, es que no hay relación. Como se trata de una tabla 2×2 el valor de la ji-cuadrado tiene que ser menor que el umbral (3.84), no mayor.

7b: Los dos factores son significativos y hay interacción. En otoño todos los fármacos van igual, cosa que no sucede en otras estaciones. Esto representa que el comportamiento de los fármacos depende de la estación en la que se apliquen: esto es lo que es la interacción.

8c: El valor esperado por grupo es 3 que, como es menor que 5 nos lleva seguro al Test exacto de Fisher.

9b: Obsérvese el cálculo de los valores de las dos componentes para los cuatro puntos:

Los puntos a y el b son los que están más a la izquierda porque son los que tienen un valor menor para la componente 1. El b es el que está más abajo, mirando los valores que tienen el a y el b en la componente 2.

10b. Al aumentar el tamaño de muestra el p-valor bajará, al aumento la desviación estándar el p-valor subirá y al aumentar la diferencia de medias el p-valor bajará. El único perfil que supone: bajada, subida y bajada es el b.

 

Situación 138: Examen (Temas 8-17 y 19)

1.¿En cuál de estas afirmaciones no hay compatibilidad?

a.En un contrate de hipótesis de igualdad de medias una p=0.01 y un IC del 95% de la diferencia de medias entre ambas poblaciones de (0.15, 0.44).

b.En una Odds ratio una p=0.22 y un IC del 95% de (-0.13, 0.56).

c.En una tabla de contingencias 3×2 un valor de ji-cuadrado de 4.3 y un p-valor superior a 0.05.

d. En una ANOVA de un factor una p=0.67 y tener un único grupo homogéneo entre los cinco niveles que estamos comparando.

2.Tenemos los siguientes datos en un estudio donde se aplican dos tratamientos distintos (1 y 2) a un grupo de pacientes que tienen una determinada patología y que se han diferenciado según su grupo sanguíneo.  Con los datos obtenidos se pretende ver la diferencia entre tratamientos, entre grupos sanguíneos y si hay o no interacción. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Tratamiento: p<0.05. Factor Grupo sanguíneo: p>0.05. Interacción: p>0.05.

b.Factor Tratamiento: p<0.05. Factor Grupo sanguíneo: p<0.05. Interacción: p<0.05.

c.Factor Tratamiento: p>0.05. Factor Grupo sanguíneo: p<0.05. Interacción: p<0.05.

d.Factor Tratamiento: p>0.05. Factor Grupo sanguíneo: p<0.05. Interacción: p>0.05.

3.En un estudio donde se quiere comparar dos psicoterapias tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo uno de los dos tratamientos a comparar. Evaluamos una variable cuantitativa. El test de Shapiro-Wilk de la primera muestra tiene una p=0.22 y el de la segunda muestra tiene una p=0.03. El test de Fisher-Snedecor nos proporciona una p=0.01. Es cierto lo siguiente:

a.Debemos aplicar el test de la t de Student para varianzas desiguales.

b.Debemos aplicar el test de Mann-Whitney.

c.Debemos aplicar el test de la t de Student para varianzas iguales.

d.Debemos aplicar el test de la t de Student de datos apareados.

4.¿Cuál es el punto 4 en un Análisis de Componentes Principales con las dos siguientes primeras componentes principales:

a.(2, 1, 0, 4, 2, 4)

b.(1, 4, 4, 1, 2, 0)

c.(5, 3, 3, 5, 4, 5)

d.(3, 5, 5, 3, 5, 3)

5.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente introducimos nuevos valores de ambas muestras que no teníamos previamente aumentando, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más pequeña de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.23/0.13/0.21/0.16.

b.0.52/0.14/0.77/0.62.

c.0.12/0.03/0.01/0.001.

d.0.12/0.01/0.001/0.01.

6.¿En cuál de las siguientes afirmaciones no hay compatibilidad?

a.En una diferencia de medias con un IC 95%: (0.85, 5.45) y un p-valor de 0.02.

b.En una OR de 1.34 con p=0.34 y una ji-cuadrado de 4.32.

c.En un ANOVA de dos factores una p=0.23 del primer factor, una p=0.89 del segundo factor y una p=0.00001 de la interacción.

d.Una V de Crámer con un valor de 0 y una ji-cuadrado con una  p=1.

7.Tenemos los siguientes datos en un estudio donde se aplican tres fármacos (A, B, C) en pacientes con la misma patología de las cuatro estaciones del años.  Con los datos obtenidos se pretende ver la diferencia entre fármacos, entre estaciones y ver, finalmente, si hay o no interacción. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Fármaco: p<0.05. Factor Estación: p>0.05. Interacción: p<0.05.

b.Factor Fármaco: p<0.05. Factor Estación: p<0.05. Interacción: p<0.05.

c.Factor Fármaco: p<0.05. Factor Estación: p<0.05. Interacción: p>0.05.

d.Factor Fármaco: p>0.05. Factor Estación: p<0.05. Interacción: p>0.05.

8.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 100 pacientes. 50 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 7% consigue la rehabilitación psicológica. En el otro grupo un 5% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Wilcoxon.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

9.¿Cuál es el punto 2 en un Análisis de Componentes Principales con las dos siguientes primeras componentes principales:

a.(2, 1, 0, 4, 2, 4)

b.(1, 4, 4, 1, 2, 0)

c.(5, 3, 3, 5, 4, 5)

d.(3, 5, 5, 3, 5, 3)

10.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente introducimos nuevos valores de ambas muestras que no teníamos previamente aumentando, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más alta de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.23/0.13/0.21/0.36.

b.0.52/0.14/0.77/0.62.

c.0.12/0.03/0.01/0.001.

d.0.12/0.01/0.001/0.01.

 

Situación 137: Tema 16

Estamos interesados en determinar el tamaño de muestra en un estudio de comparación de dos tratamientos farmacológicos: el tratamiento estándar y una nueva opción creada recientemente. La variable respuesta es curación sin recidiva a los 5 años. El tratamiento estándar tiene un nivel de curación sin recidiva del 35%. Queremos comprobar si con el nuevo preparado conseguimos una mejora de, como mínimo, 10 puntos porcentuales. ¿Cuál es el tamaño de muestra necesario si queremos tener una potencia del 80% y creemos que tendremos una pérdida de seguimiento de un 20%?

Situación 136: Examen (Temas 1-7)

1.¿Cuál de las siguientes afirmaciones es cierta en una regresión?

a.Una pendiente con un IC 95%: (-0.3, -0.05) es compatible con una correlación con p-valor -0.002.

b.Una pendiente con una p=0.001 es compatible con una correlación con IC 95%: (-0.4, 0.6).

c.Una pendiente con un IC 95%: (-1.5, 0.6) es compatible con una correlación con p-valor igual a 0.2.

d.Una pendiente de -0.3 con p=0.95 es compatible con una correlación con un IC del 95%: (-0.6, -0.2)

2.¿Qué valor refleja un mayor nivel de relación entre dos variables?

a.r= 0.6 (p=0.5)

b.r=-0.7 (IC 95%: (-1, 0.08))

c.r=0.5 (p=0.01)

d.r=0.4 (IC 95%: (0.39, 0.41))

3.Nos dicen que un intervalo de confianza de la media del 95% de la cantidad de un neurotransmisor en unos pacientes es (89, 91). El estudio se ha hecho con una muestra de 400 pacientes. ¿Cuál es el intervalo de confianza del 99.5% descriptivo de esa variable?

a.(30, 150)

b.(50, 130)

c.(60, 120)

d.(80, 100)

4.En una muestra como la siguiente: (4, 5, 5, 55, 55, 56), los resultados más previsibles de la asimetría estandarizada (AE) y de la curtosis estandarizada (CE) son:

a.AE=0 y CE=0

b.AE=5 y CE=5

c.AE=0 y CE=5

d.AE=5 y CE=0

5.Sea la muestra (1, 2, 5, 6, 9, 11). Podemos afirmar:

a.La mediana es 6.

b.El percentil 40 es 5.

c.El percentil 83.3 es 9.

d.El percentil 16.6 es 2.

6.¿Cuál de las siguientes afirmaciones no es cierta en una regresión?

a.Una pendiente con un IC 95%: (-0.3, -0.05) es compatible con una correlación con p-valor 0.02.

b.Una pendiente con una p=0.1 es compatible con una correlación con IC 95%: (-0.4, 0.6).

c.Una pendiente con un IC 95%: (-1.5, 0.6) es compatible con una correlación con p-valor igual a 0.22.

d.Una pendiente de -0.3 con p=0.01 es compatible con una correlación con un IC del 95%: (-0.6, 0.2)

7.¿Qué valor refleja un mayor nivel de relación entre dos variables?

a.r= 0.6 (p=0.01)

b.r=-0.7 (IC 95%: (-1, -0.28))

c.r=0.5 (p=0.01)

d.r=0.4 (IC 95%: (0.39, 0.41))

8.Nos dicen que un intervalo de confianza de la media del 95% de la cantidad de un neurotransmisor en unos pacientes es (88, 92). El estudio se ha hecho con una muestra de 100 pacientes. ¿Cuál es el intervalo de confianza del 68.5% descriptivo de esa variable?

a.(80, 100)

b.(85, 95)

c.(60, 120)

d.(75, 105)

9.En una muestra como la siguiente: (3.3, 4.2, 5, 5.2, 5.5, 5.7, 6.3, 7.2), los resultados más previsibles de la asimetría estandarizada (AE) y la curtosis estandarizada (CE) son:

a.AE=0 y CE=0

b.AE=15 y CE=15

c.AE=0 y CE=15

d.AE=15 y CE=0

  1. Sea la muestra (1, 2, 3, 7, 9, 11, 14). ¿Cuál es la afirmación incorrecta?:

a.La mediana es 7.

b.5 es el percentil 40.

c.9 es el percentil 66.6.

d.2 es el percentil 16.6.

Solución Situación 135

1d: A la izquierda de 5 hay 5 valores, a la derecha 3. 5 de 8 supone un 62.5%.

2a: Si se aplica la fórmula vista en el tema 3 con una contante de 1 porque se trata de un intervalo de confianza del 68.5%, tenemos este resultado.

3d: Si las dos tablas, la observada y la esperada fueran iguales, el p-valor sería 1. Todo lo que no suponga esta igualdad va asociado, entonces, de un p-valor inferior a 1.

4c: El error estándar es 1, porque al tratarse de un intervalo de confianza de la media el radio del intervalo es dos veces el error estándar. Como el radio es 2 (la distancia desde el centro del intervalo, 20, hasta cualquiera de los dos extremos), el error estándar es, pues, 1. Por la ecuación fundamental vista en el tema 3 tenemos que 1=DE/Raíz(25), luego la DE tiene que ser 5. De esta forma el radio del intervalo descriptivo del 95% será dos veces la DE; o sea: 10. Por lo tanto, el intervalo será (10, 30)

5c: Las operaciones que hacemos son: 1) Disminuimos el tamaño de muestra de ambas poblaciones. 2) Detectamos que la desviación estándar era más alta de la que habíamos calculado. 3)  Detectamos que la diferencia de medias es más grande de la que habíamos calculado. Esto supone subir el p-valor, primero, subirlo también, en el segundo paso y bajarlo en el tercer paso. El único perfil que se adapta a esos cambios es el c.

6d: Intervalo de la pendiente y de la correlación no tienen el mismo signo.

7b: Si el intervalo de confianza del 95% de la diferencia de medias incluye al 0 entonces el contraste de hipótesis sobre la igualdad de medias nos dará un p-valor superior a 0.05, de no diferencia de medias estadísticamente significativa.

8d: Si no es significativa la igualdad de proporciones el intervalo de confianza del 95% de la diferencia de proporciones incluirá al cero, como sucede en el que tenemos.

9b: Si hay diferencia de medias significativa, los intervalos de la media del 95% no se solaparán pero eso no tiene nada que ver con el solapamiento o no de los intervalos descriptivos. En los intervalos de la media interviene el tamaño de muestra, en los descriptivos no. Aquí está la clave.

10c: Todo es significativo. Tratamiento, operario e interacción.

Situación 135: Examen (Temas 1-16)

1.En la muestra (1, 1, 2, 2, 2, 5, 6, 6, 7):

a.1.5 es el percentil 28.5.

b.El percentil 90 es 6.5.

c. El rango intercuartílico es 6.

d.5 es el percentil 62.5.

2.Estamos interesados en saber en cuántos puntos de una playa se supera un cierto nivel de un contaminante. Para ello se toman al azar 4000 muestras a lo largo del río. En 200 de ellas se supera ese nivel. Un intervalo de confianza del 68.5% del porcentaje de puntos del río donde se supera dicho nivel es:

a.(4.66, 5.34).

b.(4.31, 5.69).

c.(3.97, 6.03).

d.(3.62, 6.38).

3.¿Cuál de las siguientes afirmaciones es cierta?

a.La ji-cuadrado evalúa si hay relación entre una variable cualitativa y una cuantitativa.

b.El coeficiente de determinación superior al 50% indica buena capacidad predictiva sólo si el p-valor de la correlación es superior a 0.05.

c.Una V de Crámer es significativa si es mayor de 0.5.

d.Si la tabla de contingencias observada y la tabla de contingencias esperada no son iguales el p-valor será menor que 1.

4.Tenemos un intervalo de la media del 95% de una variable que se distribuye ajustándose a una normal que es (18, 22). La muestra era de tamaño 25. ¿Cuál sería un intervalo del 95% descriptivo de esa variable?

a.(18, 22), igualmente.

b.(15, 25).

c.(10, 30).

d.(0, 40).

5.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente disminuimos el tamaño de muestra de ambas poblaciones obteniendo la misma media y desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más alta de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.54/0.23/0.25/0.12.

b.0.66/0.86/0.44/0.22.

c.0.23/0.25/0.34/0.23.

d.0.23/0.31/0.19/0.31.

6.En cuál de las siguientes regresiones simples hay información incoherente:

a.y=0.02x+1 con IC del 95% de la pendiente (0.01, 0.03) e IC del 95% de la correlación (0.1, 0.2).

b.y=0.2x+1 con IC del 95% de la pendiente (0.1, 0.3) e IC del 95% de la correlación (0.1, 0.3).

c.y=20x+1 con IC del 95% de la pendiente (10, 30) e IC del 95% de la correlación (0.1, 0.2).

d.y=-0.8x+1 con IC del 95% de la pendiente (-1.3, -0.4) e IC del 95% de la correlación (0.1, 0.2).

7.¿Cuál de las siguientes afirmaciones es cierta?:

a.La comprobación de si dos medias son iguales la hacemos con el test de Shapiro-Wilk.

b.Si un intervalo de confianza del 95% de la diferencia de medias es (-0.23, 0.45) el p-valor del contraste de igualdad de medias nos dará un p-valor superior a 0.05.

c.Si dos intervalos de la media del 95% se solapan en dos muestras independientes podemos afirmar que el p-valor en un contraste de hipótesis de igualdad de medias será inferior a 0.05.

d.En un ANOVA con dos factores anidados obtendremos tres p-valores porque tenemos que resolver tres contrastes de hipótesis.

8.¿Cuál de las siguientes afirmaciones es cierta?:

a.En una regresión si la R2 es inferior al 50% podemos decir ya que no tenemos una relación estadísticamente significativa entre las variables de la regresión.

b.Si en un estudio tenemos una potencia inferior al 80% el contraste que hagamos dará un p-valor superior a 0.05.

c.Si hacemos una comparación de medias entre dos muestras y el p-valor es inferior a 0.05 los intervalos de confianza del 95% de la media de ambas poblaciones se solaparán.

d.En una comparación de proporciones con p-valor igual a 0.12 un intervalo de confianza del 95% de la diferencia de proporciones puede ser (-0.05, 0.08).

9.Hemos realizado una comparación de medias de dos poblaciones que se ajustan a la normalidad. El p-valor ha resultado ser 0.001. ¿Cuál es la única respuesta que puede ser cierta?

a.Los intervalos de confianza del 95% de la media de ambas muestras son: (90, 110) y (95, 115).

b.Los intervalos de confianza del 95% descriptivos de ambas muestras son: (80, 120) y (90, 130).

c.Los intervalos de confianza del 95% de la media de ambas muestras son: (90, 110) y (95, 115) y los descriptivos son: (69, 109) y (101, 131).

d.Ninguna de las tres es posible.

10.Hemos analizado la cantidad de biomasa en una zona en dos tiempos distintos (T1 y T2). El análisis lo han realizado tres operadores, tres analistas distintos que se quieren comparar. Cada muestra cada operario la analiza por duplicado. Los resultados son los siguientes:

¿Cuál es la afirmación más razonable?:

a.Factor T: p<0.05. Factor Op: p>0.05. Interacción: p>0.05.

b.Factor T: p>0.05. Factor Op: p<0.05. Interacción: p<0.05.

c.Factor T: p<0.05. Factor Op: p<0.05. Interacción: p<0.05.

d.Factor T: p<0.05. Factor Op: p<0.05. Interacción: p>0.05.

 

Solución Situación 134

  1. Estamos ante un modelos de tres factores cruzados, uno aleatorio (quirófano) y los otros dos fijos. El modelo es pues:

7 efectos, 7 constrastes. Los cocientes se pueden deducir de esas esperanzas de los cuadrados medios. Se pueden consultar en el fichero dedicado a tres factores.

2.

 

3.

 

Solución Situación 133

1.

a. Se trata de dos factores aleatorios cruzados.

b. Tres efectos.

c. Deben evaluarse tres contrastes de hipótesis: uno para cada uno de los dos factores y otro para la interacción.

d. Los cocientes a realizar serán: En los dos factores el cociente es por la interacción y en la interacción el cociente es por el residuo.

2.

 

3.