Solución Situación 65

1b: Las dos Odds ratio son significativas. Una mayor que 1 (factor de riesgo) y otra menor que 1 (factor de protección.

2c: El primer cuartil es 5 (promedio de 3 y 7) y el tercer cuartil es 22. Entonces 22-5=17.

3b: El Error estándar es 5/raíz(100)=0.5. La media más menos dos EE es (19, 21).

4b: El radio del intervalo es 5. Como es un intervalo del 95% el EE=2.5, porque el radio del intervalo es dos veces el EE. Tenemos, pues, la siguiente igualdad: 2.5=10/raíz(n). Luego, para que se cumpla la igualdad n debe ser 16.

5c: Un coeficiente de determinación menor del 50% implica una precisión en los pronósticos muy mala y, por lo tanto, inaceptable.

6a: Sólo las dos primeras Odds ratio son significativas. Una OR de 10 es mayor que 0.2 porque 10 es equivalente a 0.1 y 0.2 es equivalente a 5.

7c: La V de Crámer en ningún caso puede tener valores inferiores a 0. El valor más bajo posible es 0.

8c: El valor de la ji-cuadrado en ningún caso puede ser negativa. El mínimo posible es 0. Valor que se daría si la tabla de contingencia observada y esperada fueran iguales.

9d: Dispersión y tamaño de muestra tienen una relación directa. Si tenemos más dispersión, hay más incertidumbre y necesitaremos más tamaño de muestra para ver diferencias significativas.

10c: Estamos hablando de una variable cuantitativa, de muestras independientes y ninguna de las dos se ajusta a la distribución normal (el p-valor del Test de Shapiro-Wilk es menor que 0.05 y hay que recordar a que en un test de ajuste a la normal la hipótesis nula es que existe ajuste a la distribución normal). Por lo tanto, el Test adecuado al caso es el Test de Mann-Whitney.

11b: Estamos hablando de una variable dicotómica (superar o no dicho umbral), de dos muestras independientes. Por tamaño de muestra y por valor esperado por grupo estamos bajo las condiciones de aplicación del Test de proporciones.

12d: Una correlación de Pearson puede darse acompañada de un intervalo de confianza del 95%, como sucede en cualquier pronóstico. Este intervalo de confianza lleva implícito un mecanismo que proporciona la significación estadística de esa correlación. El criterio es el siguiente: si el intervalo contiene al 0 la correlación no es significativa. Si el intervalo no contiene al 0 la correlación es estadísticamente significativa.

13a: Por supuesto que puede suceder que en un ANOVA de dos factores cruzados ninguno de los dos factores sea significativo y la interacción sí lo sea.

14c: Las comparaciones múltiples se aplican cuando se ha rechazado la hipótesis nula de igualdad de niveles de un factor en un ANOVA. Sólo en este caso tiene sentido aplicarlas esas comparaciones. Con ellas sabremos el motivo del rechazo de la hipótesis de igualdad.

15bc: (Disculpad, revisando el examen he comprobado que en esta pregunta hay dos correctas, por lo tanto, cualquiera que haya contestado a cualquiera de las dos la tiene bien, evidentemente) Si un consumo de droga tiene una Odds ratio de 5, el no consumirla tiene una Odds ratio de 0.2. El valor de 5 y de 0.2 son equivalentes. Uno al lado del riesgo y el otro al lado de la protección. Bastaría cambiar los datos de la tabla de contingencias colocando como exposición el no consumo de esa droga para obtener esa Odds ratio de 0.2.

Como la Odds ratio es 5 y es significativa un intervalo de confianza del 95% sólo tendrá valores superiores a 1, porque para ser significativa una Odds ratio dicho intervalo de confianza no debe contener al 1.

16a: Tenemos que aplicar esta ecuación, pero como el intervalo de confianza es del 68.5% la k en este caso valdrá 1. Vale 2 si el intervalo de confianza es del 95% y 3 si el intervalo de confianza es del 99.5. Luego, si la K=1 y la r=1 al despejar la n nos quedará que n es igual al cuadrado de la DE y como DE=10, entonces n=100:

IMG_4906

17d: Por definición por encima del tercer cuartil de una muestra tenemos en la población aproximadamente el 25% de personas. Como no hay ajuste a la distribución normal la expresión de la afirmación a es incorrecta.

18d: Si una correlación es significativa también lo es la pendiente de la recta de regresión que construyamos con esa variable. Lo mismo: si una correlación no es significativa tampoco lo será esa pendiente. Son equivalentes ambos contrastes de hipótesis.

19b: Estamos construyendo un intervalo de confianza del 99.5%, lo que se consigue sumando y restando a la media 3 errores estándar. Por lo tanto, el error estándar es 1/3. Y como sabemos que EE=DE/raíz(n), tenemos la ecuación 1/3=DE/raíz(900). DE es igual a 10.

20d: El número de componentes generadas es el mismo que el número de variables originales. No tienen por qué ser positivos siempre los coeficientes de la primera componente. Si las variables son independientes el Análisis de componentes principales no nos aporta prácticamente nada. Y es cierto que si dos variables tienen fuerte correlación negativa en la primera componente saldrán con coeficientes grandes y de signo contrario. Ver, por ejemplo, en el Tema 17 el ejemplo de los datos meteorológicos: Temperatura y altitud de las comarcas tienen, lógicamente, una fuerte correlación negativa. Observad que en la primera componente sucede lo apuntado anteriormente: Coeficientes grandes y con signo distinto.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s