1d: La Hipótesis nula en un test de comparación siempre afirma la igualdad, nunca la diferencia. Las otras tres afirmaciones son ciertas.
2a: Si se ha aplicado el test de la t de Student de varianzas diferentes es que se ha comprobado la normalidad previamente de cada una de las muestras (por lo que la respuesta b es incorrecta, porque nos estaría diciendo que no hay normalidad) y, después, hemos aplicado un test de comparación de varianzas, como es el test de Fisher-Snedecor, dando un p-valor menor de 0.05 y, por lo tanto, considerando que las varianzas poblacionales son diferentes.
3d: Si una enfermedad eleva su prevalente una técnica diagnóstica tiende a disminuir el Valor predictivo negativo. Y si una enfermedad disminuye su prevalencia una técnica diagnóstica tiende a disminuir su Valor predictivo positivo. Por lo tanto, las dos «a» y «b» son incorrectas.
4c: Entre las correlaciones signficativas la que tiene una mayor magnitud es la r=-0.7.
5a: Todas son Odds ratio significativas. Si pasamos todas las Odds ratio a la zona superior a 1, vemos que una OR=0.33 es equivalente a 3 y que una OR=0.5 es equivalente a 2. Por lo tanto, la mayor asociación es la mostrada por la OR=0.33.
6c: El error estándar es 0.5 porque es el resultado de dividir la desviación estándar (20) por la raíz cuadrada del tamaño de muestra. Por lo tanto, dos veces ese error estándar nos da el intervalo de confianza del 95% de la opción «c».
7d: El Test de Shapiro-Wilk muestra que no hay normalidad. El Test adecuado al caso es, pues, el Test de Mann-Whitney.
8c: Los datos, visulamente, de forma clara se ajustan a la distribución normal. Además el tamaño de muestra es pequeño. Todo va a favor de tener que mantener claramente la Hipótesis nula de normalidad. Es cierto que hay dos p-valores mayores de 0.05, pero uno está claramente alejado de esa frontera y el otro, por el contrario, no. En este caso la opción más lógica es elegir el p-valor superior. Observemos que si el nivel de significación lo fijáramos en 0.1 deberíamos rechazar la normalidad si tuviéramos un p-valor de 0.08.
9b: Observemos que si cogemos los valores de la OR y su intervalo de confianza y los pasamos al otro lado del 1, haciendo la división de 1 por cada uno de los tres valores implicados tenemos los valores de la opción «b»: 1/0.5=2. 1/0.36=2.77. 1/0.68=1.47.
Por otro lado, la opción «a» y la «c» son descartables por mostrar una situación de no significación que no es compatible con lo el hecho de que con el otro orden de valores sí haya significación.
La opción «d» nos da un intervalo muy próximo al 1 cosa que no es coherente con el otro intervalo. Pensemos que únicamente cambiamos de posición el elemento donde focalizamos a la hora de calcular la Odds ratio.
10c: Con una desviación estándar de 10 y un tamaño de 400 el error estándar es 0.5 y, por lo tanto, un intervalo de confianza de la media del 95% tendrá un radio de 1.
11b: Al filtrar a los pacientes de hecho lo que hacemos es aumentar la prevalencia de los que son sometidos a la prueba. Por lo tanto, al aumentar la prevalencia aumenta el Valor predictivo positivo.
12c: Hay suficiente ajuste a la normal. Sabemos que en una normal si multiplicamos la desviación estándar por 0.68 y ese valor lo sumamos y lo restamos a la media obtenemos un intervalos del 50% en torno a la media. En nuestro caso: 20×0.68=13.6. El rango será dos veces ese 13.6; o sea, 27.2.
13d: El error estándar en ambos casos es 0.5. Si construimos los dos intervalos de la media del 95% resultan: (14, 16) y (17, 19). No se tocan. Por lo tanto, hay diferencias significativas de medias poblaciones. Es con el intervalo de confianza de la media que hay que hacerlo, no con el intervalo de confianza de valores individuales.
14d: El que las cajas de los Box-Plot se toquen habla del grado de solapamiento de los valores individuales entres las dos poblaciones, pero no habla del solapamiento de los intervalos de confianza de la media. El Box-Plot no depende del tamaño de muestra. Puede aumentar mucho el tamaño de muestra y no cambiar sustancialmente la forma de ese gráfico, pero sí cambiar, y mucho, los intervalos de confianza de la media: que se van estrechando. Por lo tanto esta afirmación no es correcta.
15d: Si entre dos variables cuantitativas no existe correlación significativa no tiene sentido hacer una regresión. Además, al hacerla, la pendiente no será significativamente distinta de 0.
La «b» no es correcta porque habla del estadístico de la ji-cuadrado, del valor de la ji-cuadrado, no del p-valor.
16c: (Atención que ha cambiado la pregunta respecto a la versión anterior. Antes las respuestas eran la b, la c o la d). La precisión guarda una relación de tipo directo con el tamaño de muestra: mayor precisión mayor tamaño de muestra. Menor precisión menor tamaño de muestra.
17c: El primer cuartil es -3 porque es el promedio de -7 y 1. El tercer cuartil es claramente 3. Por lo tanto, el rango intercuartílico es 6 (3-(-3)).
18d: Si el tamaño de muestra es el mismo en dos correlaciones y una de ellas es una correlación de 0.6 y sabemos que es significativa también lo será, de significativa, una correlación que sea mayor. Podría ser dudosa la significación, sin p-valor, de una correlación que fuera menor que 0.6, pero no una mayor.
La «b» no es elegible por una razón fundamental. Es cierto que si el p-valor es inferior a 0.05 la tabla observada y la esperada son diferentes. De hecho, cualquier p-valor que no sea el 1 nos indica que la tabla observada y la esperada son distintas. Lo relevante estadísticamente es que si el p-valor es menor que 0.05 nos indica que hay relación entre las variables. Esto es lo relevante, no el que las tablas observadas y esperadas son distintas.
19b: En una tabla 2×2 el punto de referencia para aceptar o rechazar la Hipótesis nula en un test de la ji-cuadrado es 3.84, independientemente del tamaño de muestra. Este valor depende del número de filas y el número de columnas que tengamos en la tabla de contingencias, no del tamaño de muestra.
20d: Por definición de primer y tercer cuartil es obvio que por debajo del primer cuartil tendremos el 25% de la población y que por encima del tercer cuartil tendremos también un 25% de la población.