1.En la muestra (1, 2, 3, 5, 5, 5, 6, 8), ¿cuál es su Box-Plot?
2.¿Cuál de las siguientes correlaciones es mayor?
a.r=0.57 IC 95%: (-0.15, 0.99)
b.r=-0.60 IC 95%: (-0.95, -0.15)
c.r=0.25 IC 95%: (0.15, 0.41)
d.r=0.15 IC 95%: (0.11, 0.24)
3.Estamos interesados en predecir cuántas personas toman antidepresivos en España. Para ello se toma al azar una muestra de tamaño 1000. Observamos que 200 toman antidepresivo. Un intervalo de confianza del 99.5% del porcentaje poblacional es el siguiente:
a.(14.47, 22.53).
b.(16.21, 23.79).
c.(18.10, 21.90).
d.(18.74, 21.26).
4.¿Cuál de las siguientes afirmaciones es cierta en una regresión?
a.Una pendiente con un IC 95%: (0.3, 5) es incompatible con una correlación con p-valor 0.02.
b.Una pendiente con una p=0.01 es incompatible con una correlación con IC 95%: (-0.4, -0.26).
c.Una pendiente con un IC 68.5%: (5.3, 6.8) es incompatible con una correlación con p-valor igual a 0.008.
d.Una pendiente con un valor de 1.9 con p=0.001 es incompatible con una correlación con un IC del 68.5%: (0.1, 4).
5.Si tenemos una variable descrita de la siguiente forma: 2 (-1, 25) podemos afirmar:
a.La media muestral es 2.
b.La desviación estándar es 26.
c.Entre 2 y 25 tenemos el 25% de valores.
d.El rango es 26.
6. Tenemos una Ji-cuadrado en una tabla de contigencias 4×2, con un valor de Ji-cuadrado de 8.15, podemos decir entonces que:
a.La V de Crámer nos dará 1.
b.La Odds ratio será la que nos dará el nivel de relación.
c.La V de Crámer que tengamos será estadísticamente significativa porque 8.15 es superior a 3.84.
d.La V de Crámer que tengamos será estadísticamente significativa porque 8.15 es superior al umbral establecido en una tabla 4×2.
7.¿Cuál de las siguientes Odds ratio indica una menor relación entre las variables estudiadas?
a.OR=4; IC 95%: (1.12, 8.92)
b.OR=3; IC 95%: (0.82, 7.78)
c.OR=0.25; IC 95%: (0.12, 0.45)
d.OR=0.68; IC 95%: (0.54, 0.88)
8.¿Cuál de las siguientes afirmaciones no es cierta?:
a.En una regresión lineal simple una R2 superior al 50% indica que tenemos una relación con una suficiente capacidad predictiva.
b.Con una ji-cuadrado de 2.84 ya podemos decir que será estadísticamente significativa la relación, independientemente del número de filas y de columnas que tenga la tabla de contingencias.
c.Una V de Crámer 0.5 es estadísticamente significativa si el test de la ji-cuadrado calculado a la tabla de contingencias tiene un p-valor que es superior a 0.05.
d.Una Odds ratio de 0.25 es equivalente, como medida de factor de protección, a una Odds ratio de 4 como factor de riesgo.
9.Estamos relacionando los cuatro grupos sanguíneos con cinco zonas del mundo. Hemos aplicado una ji-cuadrado y el valor es 23.33. Entonces:
a.No podemos decir que hay relación significativa porque 23.33 es menor que 31.41.
b.No podemos decir que hay relación significativa porque 23.33 es mayor a 3.84.
c.Podemos decir que hay relación significativa porque 23.33 es mayor que 21.02.
d.Podemos decir que hay relación significativa porque 23.33 es mayor que 3.84.
10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 10 y tamaño muestral de 10000 es:
a.(10, 30).
b.(19.5, 20.5).
c.(19.8, 20.2).
d.(0, 40).
11.En un estudio donde se quiere comparar dos psicoterapias tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo uno de los dos tratamientos a comparar. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.004. Es cierto lo siguiente:
a.Si el test de la t de Student para varianzas desiguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.
b.Si el test de la t de Student para varianzas desiguales da un p-valor superior a 0.05 debemos concluir que las medias son diferentes.
c.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.
d.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que no podemos decir que las medias son diferentes.
12.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente introducimos nuevos valores de ambas muestras que no teníamos previamente aumentando, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?
a.0.81/0.57/0.25/0.31.
b.0.56/0.24/0.81/0.12.
c.0.2/0.17/0.12/0.005.
d.0.02/0.001/0.09/0.1.
13.Hemos realizado un análisis clúster a una base de datos donde tenemos dos variables y el dendrograma obtenido es el siguiente:
¿Cuál es la base de datos que tenemos? Los individuos están por orden alfabético y en cada paréntesis tenemos primero el valor de la variable X y segundo el valor de la variable Y.
a.(1,2), (2,1), (4,3), (12,13), (13,12)
b.(1,2), (1,2), (1,3), (12,13), (12,17)
c.(1,2), (2,1), (4,3), (12,13), (22,23)
d.(1,2), (2,1), (2,1), (19,20), (20,19)
14.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 200 pacientes. 100 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 8% consigue la rehabilitación psicológica. En el otro grupo un 4% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:
a.Aplicar un Test de Mann-Whitney.
b.Aplicar un Test de proporciones.
c.Aplicar un Test exacto de Fisher.
d.Aplicar un Test de McNemar.
15.¿Cuál de las siguientes afirmaciones es cierta?
a. Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que las muestras son independientes.
b. En un contraste de hipótesis para evaluar la igualdad de varianzas un p-valor de 0.67 indica que no hay una igualdad de varianzas.
c. En un contraste de hipótesis cuanto más tamaño de muestra tengamos más posibilidades de no rechazar la hipótesis nula.
d.Cuanto más potencia queramos tener en un contraste de hipótesis más tamaño de muestra necesitaremos.
16.Hemos realizado un Análisis de componentes principales a una base de datos con cinco variables obteniendo dos componentes que explican un 85% de la información. La primera componente es Y1=0.5X1-0.5X2+0.5X3-0.5X4+0.5X5 y la segunda componente es Y2=0.5X1-0.01X2-0.01X3+0.01X4-0.5X5. En el siguiente gráfico de las dos primeras componentes principales, ¿cuál es el individuo 5?
a.(7, 4, 3, 3, 3)
b.(7, 5, 5, 6, 6)
c.(7, 3, 6, 2, 5)
d.(5, 2, 5, 3, 7)
17.¿Cuál de las siguientes afirmaciones no es cierta?
a.En un ANOVA de dos factores si ninguno de los dos factores es significativo la interacción puede ser significativa.
b.Si en las comparaciones múltiples de un ANOVA de un factor tenemos dos o más grupos homogéneos el p-valor del ANOVA será menor de 0.05.
c.Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es inferior a 0.05.
d. Si en un ANOVA de un factor con cinco niveles el p-valor es menor que 0.05 tendremos cinco grupos homogéneos.
18.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 99.5% de radio 3 si la Desviación estándar que tenemos en una muestra piloto es de 20?:
a. 100.
b. 1000.
c. 400.
d. 25.
19.En un Análisis de componentes principales la primera componente principal es 0.5X-0.45Y-0.48Z. Es cierto lo siguiente:
a.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X e Y y valores pequeños de Z.
b.En la representación de la primera componente los individuos más a la izquierda del eje tendrán valores grandes de X, pequeños de Y y grandes de Z.
c.En la representación de la primera componente los individuos más a la izquierda del eje tendrán valores pequeños de X y valores grandes de Y y de Z.
d.En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X y valores grandes de Y y pequeños de Z.
20.Tenemos los siguientes datos en un estudio donde se aplican dos sistemas de medir la altura (Sistema fotoeléctrico y Cinta métrica). Tres alumnos repiten tres veces la medida de la altura de una misma persona, en milímetros, en cada uno de los dos sistemas de medir. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:
a.Factor Sistema: p<0.05. Factor Alumno: p>0.05. Interacción: p<0.05.
b.Factor Sistema: p<0.05. Factor Alumno: p<0.05. Interacción: p>0.05.
c.Factor Sistema: p<0.05. Factor Alumno: p<0.05. Interacción: p<0.05.
d.Factor Sistema: p>0.05. Factor Alumno: p<0.05. Interacción: p<0.05.