Archivo de la categoría: PROBLEMAS

Situación 71: Examen (Temas 1-7)

1. Si en una muestra tenemos un índice de Gini es 0.9, podemos decir:

a. Que existe mayor dispersión de valores en la muestra que en una que tuviéramos un índice de 0.3.

b. No podemos tener un valor de 0.9 porque el índice de Gini va de 0 a 0.5.

c. Que existe la misma diversidad que en una muestra con índice 0.1 pero en un orden contrario.

d. Que existe muy poca diversidad de valores dentro de la muestra.

2. En la muestra (8, 6, 0, 16):

a. La mediana es 6.

b. El rango intercuartílico es 9.

c. El rango es 6.

d. El primer cuartil es 6.

3. En una muestra de tamaño 100 con media 100 y desviación estándar 10 no es cierto:

a. Un intervalo de confianza de la media del 95% sería (98, 102).

b. Un intervalo de confianza de la media del 99.5% sería (97, 103).

c. Un intervalo de confianza de valores individuales del 95% sería (90, 100).

d. Un intervalo de confianza de valores individuales del 99.5% sería (70, 130).

4. Si en una muestra donde hemos evaluado dos variables cuantitativas tenemos una correlación r=0.78 (p>0.05) podemos decir:

a. El tamaño de muestra es muy grande.

b. Si aumentamos el tamaño de muestra y la correlación finalmente es significativa la correlación seguirá siendo positiva.

c. Si aumentamos el tamaño de muestra y la correlación finalmente es significativa la correlación será negativa.

d. Si aumentamos el tamaño de muestra y la correlación finalmente es significativa la correlación puede ser de cualquier signo.

5. ¿Qué correlación es mayor?

a. r=-0.56 (p=0.03)

b. r=0.50 (p=0.001)

c. r=0.45 (p=0.34)

d. r=0.45 (p=0.0001)

6. Si la correlación entre dos variables es r=-0.9 (p<0.05), no es cierto:

a. El coeficiente de determinación es 81%.

b. El contraste de hipótesis de la pendiente de la recta de regresión será significativo; o sea, deberemos rechazar la Hipótesis nula.

c. Del contraste de hipótesis sobre la Ordenada en el origen no tenemos suficiente información para saber si será o no será significativo.

d. El coeficiente de determinación es lo suficientemente grande como para hacer predicciones sin error.

7. En una muestra donde sabemos que la desviación estándar es 1:

a. El índice de Gini será 0.

b. El índice de Gini ya queda determinado por este valor de desviación estándar.

c. El índice de Gini será muy próximo a 0 porque hay muy poca desviación estándar.

d. El índice de Gini puede ser grande, intermedio o pequeño, dependiendo de la suma total de los valores de la variable en la muestra.

8. El Box-Plot siguiente:

IMG_0265

corresponde a la muestra:

a. (1, 2, 3, 12)

b. (1, 3, 3, 12)

c. (1, 2, 7.5, 12)

d. (1, 3, 7.5, 12)

9. El Box-Plot del apartado anterior:

a. Únicamente puede tener esta muestra que queda dibujada por ese Box-Plot.

b. Hay infinitas muestras que pueden ser dibujadas por ese Box-Plot.

c. Sólo hay 4 muestras que puedan ser dibujadas por ese Box-Plot.

d. Hay 1000 muestras que pueden ser dibujadas por ese Box-Plot.

10. Si entre dos variables no hay correlación significativa:

a. Podemos hacer una Regresión si el coeficiente de determinación es mayor del 50%.

b. Podemos hacer una Regresión si la correlación es positiva.

c. No podemos hacer una Regresión porque el paso previo a una Regresión es una correlación signficativa.

d. Podemos hacer una Regresión si la correlación es mayor que 0.9.

Solución Situación 70

1. Estamos ante una situación que podemos modelizar mediante un ANOVA de dos factores fijos y cruzados. Cada factor con dos niveles. El modelo puede verse en el artículo ANOVA de dos factores a efectos fijos.

El Test de Shapiro-Wilk aplicado a los residuos del modelo proporcionan un p-valor de 0.4535 lo que permite no rechazar la hipótesis nula de ajuste a la distribución normal. Si se aplica el Test de Levene para comprobar la igualdad de varianzas el p-valor es 0.84 y si se aplica el Test de Bartlett el p-valor es 0.74. Por lo que podemos aceptar la igualdad de varianzas.

La tabla ANOVA es la siguiente:

IMG_0190

 

Son significativos los tres contrastes. Los tres p-valores son menores que 0.05.

Observemos el gráfico de interacciones.IMG_0191

Los coeficientes del modelo son los siguientes:

IMG_0192

Observemos que los coeficientes del modelo serán la constante 13.56, los parámetros del factor mucolítico: 9.08 y -9.08, los del factor corticoide: -3.75 y 3.75 y los cuatro de la interacción: 4.36, -4.36, 4.36 y -4.36. La componente de la varianza residual es 10.94.

 

2. La situación se puede modelizar mediante un ANOVA de dos factores cruzados uno fijo y el otro aleatorio. Puede verse la estructura del modelo en el artículo ANOVA de dos factores mixtos.

La tabla ANOVA y las estimaciones de las componentes de la varianza son los siguientes:

IMG_0196-0

El cálculo de las componentes de la varianza, en base a las ecuaciones de las esperanzas de los cuadrados medios, es el siguiente:

IMG_0197

Los dos parámetros para el factor fijo «método» pueden obtenerse de la media de cada uno de los dos grupos restándoles, respectivamente, la media general:

IMG_0198

Para el cálculo que nos piden debemos suponer que hay un ajuste a la normal con la media la del método M1, que es 28.39, y como desviación estándar la raíz cuadrada de la suma de las tres componentes de la varianza del modelo (puede discutirse si tomar la de la interacción porque no es significativa); o sea, la raíz cuadrada de 10.2288+1.08435+5.79969, que es 4.13. Por lo tanto, debemos calcular el área que hay por debajo de 29 en la normal: N(28.39, 4.13).

Este área es 0,5587. O sea, un 55.87%.

 

3. Se trata de un diseño que se puede modernizar con tres factores fijos cruzados. La tabla ANOVA es la siguiente:

IMG_0193

Hay dos factores significativos: el fondo y la estación. Las comparaciones múltiples para estación dan el siguiente resultado:

IMG_0194

La tabla de medias es la siguiente:

IMG_0195

Situación 70: Examen (Tema 15) Problemas ANOVA

1. Se ensayan dos tipos diferentes de fármacos mucolíticos concretos (a y b) y dos tipos distintos de corticoides (1 y 2), también concretos, para ver el cambio que se produce en una variable que marca el nivel de la situación inflamatoria de un paciente. La variable respuesta analizada es el valor de esa variable «Después menos Antes». Los resultados son los siguientes:

Mucolít   Cortic      Después menos Antes

a              1              24,1

a              1              18,4

a              1              27,3

a              2              21,7

a              2              24

a              2              20,4

b             1              -0,2

b             1              -5,8

b             1              -4,9

b             2              16,4

b             2              11,2

b             2              10,2

 

Elegir el modelo ANOVA que se ajustaría a esta situación experimental y comprobar las condiciones del modelo.

Resolver el diseño.

2. Un laboratorio de análisis clínicos realiza el siguiente experimento respecto a la medida de una variable bioquímica sanguínea: Le interesa comparar dos procedimientos analíticos diferentes concretos (M1 y M2) y la variabilidad existente entre diferentes operarios. Se toma, para ello, una muestra homogénea de sangre y se escogen tres operarios al azar entre el grupo amplio de operarios que trabajan en ese laboratorio. Cada uno de los tres operarios realiza tres mediciones de la muestra con un método de análisis y otras tres con el otro método. Los resultados obtenidos son los siguientes:

Mètodo      Operario         Medida

M1                         1              27,46

M1                         1              26,33

M1                         1              32,78

M1                         2              25,05

M1                         2              22,92

M1                         2              22,93

M1                         3              31,5

M1                         3              36,1

M1                         3              30,48

M2                         1              16,66

M2                         1              20,89

M2                         1              19,52

M2                         2              12,98

M2                         2              17,99

M2                         2              16,62

M2                         3              19,28

M2                         3              21,23

M2                         3              19,58

Plantear el modelo y resolverlo.

Calcular la probabilidad de que con el método M1 el valor obtenido sea menor que 29.

3. Se quiere estudiar el efecto de la granulometria del fondo marino (Fina/Granítica), de la estación del año y del nivel de contaminación orgànica (Alto/Bajo) en la diversidad de una sèrie de organismos marinos. Se ha elegido ocho zones, dos con fondo fino y contaminación alta, dos con fondo fino y contaminación baja, dos con fondo granítico y contaminación alta, dos con fondo granítico y contaminación baja. Se ha evaluado el nivel de diversidad en las cuatro estaciones con el índice de Shannon-Weaver.

Los resultados son los siguientes:

FONDO     CONTAMINACIÓN          ESTACIÓN             DIVERSIDAD

FINA                       ALTA                      PRIMAVERA         0,5685

FINA                       ALTA                      PRIMAVERA         0,4971

FINA                       ALTA                      VERANO                0,7296

FINA                       ALTA                      VERANO                0,9903

FINA                       ALTA                      OTOÑO                  0,5543

FINA                       ALTA                      OTOÑO                  0,3388

FINA                       ALTA                      INVIERNO             0,1315

FINA                       ALTA                      INVIERNO             0,0032

FINA                       BAJA                      PRIMAVERA         0,7185

FINA                       BAJA                      PRIMAVERA         0,4172

FINA                       BAJA                      VERANO                0,6768

FINA                       BAJA                      VERANO                0,5912

FINA                       BAJA                      OTOÑO                  0,0956

FINA                       BAJA                      OTOÑO                  0,718

FINA                       BAJA                      INVIERNO             0,076

FINA                       BAJA                      INVIERNO             0,1861

GRANÍTICA          ALTA                      PRIMAVERA         0,6264

GRANÍTICA          ALTA                      PRIMAVERA         0,657

GRANÍTICA          ALTA                      VERANO                0,7061

GRANÍTICA          ALTA                      VERANO                0,944

GRANÍTICA          ALTA                      OTOÑO                  0,7574

GRANÍTICA          ALTA                      OTOÑO                  0,6267

GRANÍTICA          ALTA                      INVIERNO             0,3857

GRANÍTICA          ALTA                      INVIERNO             0,7496

GRANÍTICA          BAJA                      PRIMAVERA         0,6805

GRANÍTICA          BAJA                      PRIMAVERA         0,9141

GRANÍTICA          BAJA                      VERANO                0,8809

GRANÍTICA          BAJA                      VERANO                0,9628

GRANÍTICA          BAJA                      OTOÑO                  0,5621

GRANÍTICA          BAJA                      OTOÑO                  0,7111

GRANÍTICA          BAJA                      INVIERNO             0,6584

GRANÍTICA          BAJA                      INVIERNO             0,2386

Resolver el diseño.

Solución Situación 69

1a: Si se ordena la muestra es: (-4, -1, 0, 0, 5, 18, 23). Como el tamaño de muestra es impar la mediana es el valor del medio: 0.

2b: Si se ordena la muestra es: (-18, -4, -2, 0, 0, 5, 7, 123). El primer cuartil es -3 porque es el promedio de -4 y -2. El tercer cuartil es 6 porque es el promedio de 5 y 7. El rango intercuartílico es 6-(-3)=9.

3: Box-Plot 2: Porque el mínimo es 2, el primer cuartil es 3, la mediana 6, el tercer cuartil es 8 y el máximo es 12.

4: Curva 4.

5d.

 

Situación 69: Examen (Tema 2)

1. ¿Cuál es la mediana de la muestra (-1, 5, -4, 18, 0, 0, 23)?

a. 0.

b. 18.

c. -1.

d. 24.

2. ¿Cuál es rango intercuartílico de la muestra (-2, 5, -4, -18, 0, 0, 123, 7)?

a. 141.

b. 9.

c. 5.

d. 18.

3. ¿Cuál de los siguientes Box-Plot es el correspondiente a la muestra (2, 2, 4, 6, 6, 7, 9, 12)?

IMG_0073

4. ¿Cuál de las siguientes curvas de Lorenz es la correspondiente a la muestra (5, 5, 15, 25, 50)?

IMG_0074

5. ¿Cuál de las siguientes afirmaciones es cierta?

a. El índice de Gini es más grande cuanta menor dispersión haya entre los valores de una muestra.

b. Si la desviación estándar de una muestra es 0 el índice de Gini es 1.

c. Si la desviación estándar de una muestra es muy grande el índice de Gini puede ser mayor que 1.

d. La relación que hay, en una muestra, entre el índice de Gini y la desviación estándar es una relación directa: o sea, valores grandes del índice en una muestra van asociados a valores grandes de la desviación estándar en esa misma muestra, y, paralelamente, valores pequeños del índice van asociados a valores pequeños de desviación estándar.

 

 

Situación 68: Examen (Temas 1-17)

1. Sabemos que los homocigotos e4 para el gen APOE que codifica la Apoproteína E tienen una asociación con la enfermedad de Alzhéimer cuantificada mediante una Odds ratio de 5.5 (IC 95%: (4.23, 7.18)) y que los homocigotos e2 tienen una Odds ratio de 0.32 (IC 95%: (0.18, 0.45)). Es cierto lo siguiente:

a. Que para saber si la asociación es significativa nos faltaría saber el tamaño de muestra.

b. Que ser homocigoto e4 para ese gen es un factor de protección y ser homocigoto e2 es un factor de riesgo, respecto a la enfermedad de Alzhéimer.

c. Que existe asociación, en ambos casos, porque ninguno de los dos intervalos de confianza incluye al 1.

d. Que necesitamos saber los p-valores para decir algo con significación estadística.

2. En la muestra (-10, 3, 3, 11, 15, 22, 22, 100):

a. La mediana es 15.

b. El rango es 22.

c. El rango intercuartílico es 17.

d. El primer cuartil es 3.

3. Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 20 y tamaño muestral de 16 es:

a. (10, 30).

b. (19, 21).

c. (19.5, 20.5).

d. (18.5, 21.5).

4. Un intervalo de confianza del 68.5% de la media que sea (95, 105) que proceda de una muestra con media muestral 100 y desviación estándar 10, tiene un tamaño muestral de:

a. 4.

b. 16.

c. 25.

d. 100.

5. De una correlación r=0.45 (p=0.002), podemos decir:

a. El tamaño muestral es muy grande porque la correlación es pequeña.

b. Podemos decir que hay una relación significativa entre las variables comparadas no por el p-valor sino porque el coeficiente de determinación R2 es menor del 50%.

c. Podremos predecir con una precisión aceptable el valor de una variable a partir de la otra, mediante una Regresión, porque el coeficiente de determinación R2 es menor del 50%.

d. Existe correlación significativa entre estas variables porque el p-valor es menor que 0.05.

6. ¿Cuál de las siguientes relaciones indica una relación más fuerte entre las dos variables cualitativas?

a. OR=10 (IC 95%: (0.5, 125)).

b. OR=0.2 (IC 95%: (0.04, 0.35)).

c. OR=25 (IC 95%: (0.8, 145)).

d. OR=0.9 (IC 95%: (0.75, 1.12)).

7. ¿Cuál de las siguientes afirmaciones es cierta?

a. El índice Kappa nunca puede ser usado como una medida del grado de concordancia entre dos observadores.

b. El Kappa tiene como valor máximo el 10.

c. La V de Crámer puede tener valores entre el 0 y el 1.

d. Si la tabla de contingencias observada y la tabla de contingencias esperada son iguales entonces la V de Crámer valdrá -1.

8. ¿Cuál de las siguientes afirmaciones no es cierta?

a. Si una ji-cuadrado nos proporciona un p-valor mayor que 0.05 indica que no podemos decir, con el nivel de información que tenemos, que hay relación significativa entre las dos variables cualitativas.

b. Si la tabla de contingencias observada y la esperada son idénticas el p-valor es 1.

c. Entre dos variables cuantitativas una ji-cuadrado positiva indica una relación directa entre las variables.

d. Una correlación negativa y significativa entre dos variables cuantitativas va seguida de una regresión lineal simple con pendiente negativa y significativa.

9. Respecto a la comparación de poblaciones no es cierto:

a. Cuanto menor tamaño de muestra tenemos más dispersión necesitamos para poder encontrar una diferencia de medias significativa.

b. Cuanta menor dispersión tenemos en las muestras menos diferencia de medias necesitamos para poder encontrar una diferencia de medias significativa.

c. Cuanto más tamaño de muestra tenemos menos diferencia de medias necesitamos para poder encontrar una diferencia de medias significativa.

d. Cuanto mayor dispersión tenemos mayor tamaño de muestra necesitamos para encontrar una diferencia de medias significativa.

10. Hemos de comparar dos procedimientos distintos de tratamiento para pacientes con demencia. Tomamos 100 pacientes y los repartimos al azar en dos grupos de 50 cada uno. La variable elegida para evaluar ambos tratamientos es el Mini-Mental. El Test de Shapiro-Wilk nos da, en ambas muestras, un p-valor superior a 0.05. Debemos:

a. Aplicar el Test de Fisher-Snedecor de comparación de varianzas para saber si hemos de aplicar el Test de la t de Student de varianzas iguales o el Test de la t de Student de varianzas diferentes.

b. Aplicar directamente el Test de la t de Student de varianzas iguales sin hacer previamente el Test de Fisher-Snedecor.

c. Aplicar el Test de Mann-Whitney.

d. Aplicar el Test de la t de Student de datos apareados.

11. Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 200 pacientes. 100 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 2% no consigue la rehabilitación psicológica. En el otro grupo un 4% no lo consigue. Debemos:

a. Aplicar un Test de Mann-Whitney.

b. Aplicar un Test de proporciones.

c. Aplicar un Test exacto de Fisher.

d. Como entre un 50% y un 40% hay una diferencia superior al 5%, que en tanto por 1 es igual a 0.05, se trata de una diferencia estadísticamente significativa.

12. ¿Cuál de las siguientes afirmaciones es cierta?

a. El Test de Mann-Whitney necesita, para ser aplicado, que las varianzas de las dos poblaciones sean iguales.

b. En un contraste de hipótesis para evaluar el ajuste a la distribución normal la hipótesis alternativa es siempre cierta.

c. El contraste de hipótesis al trabajar y evaluar una Odds ratio tiene como hipótesis nula: OR=1.

d. La significación en una correlación de Pearson no puede darse mediante un intervalo de confianza.

13. En un ANOVA no es cierto:

a. Si hay dos factores cruzados podemos tener interacción significativa y que ninguno de los dos factores, individualmente, sea significativo.

b. Un ANOVA como mínimo tendrá un factor a estudiar.

c. Si es un ANOVA de dos factores anidados no puede estudiarse la interacción entre esos factores.

d. Si hay dos factores cruzados y los dos factores son significativos la interacción no será significativa.

  1. ¿Cuál de las siguientes afirmaciones es cierta?

a. En un ANOVA de dos factores cruzados con cuatro y tres niveles, respectivamente, el número de condiciones experimentales diferentes del estudio es de 12.

b. La interacción significativa entre dos factores es indicativo de que cada uno de esos factores también es significativo.

c. Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es superior a 0.05.

d. En un ANOVA de dos factores cruzados como mínimo uno de los dos factores será significativo.

15. Estamos tratando de asociar el consumo de una determinada droga con un determinado trastorno psiquiátrico. Nos dicen que la Odds ratio entre los consumidores de esa droga es de 5, y que es significativa. Podemos afirmar:

a. Que un intervalo de confianza del 95% de la Odds ratio no contiene al 1.

b. Que la Odds ratio asociada al no consumo de esa droga es de 0.1.

c. Que un intervalo de confianza del 95% de la Odds ratio tiene valores inferiores a 1.

d. Que la ji-cuadrado previa ha dado un p-valor superior a 0.5.

16. Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 1 si la Desviación estándar que tenemos en una muestra piloto es de 10?:

a. 100.

b. 1000.

c. 400.

d. 250.

17. Nos dicen que la concentración de dopamina en pacientes con Parkinson de menos de 3 años de evolución tiene una media de 20, una mediana de 19, una desviación estándar de 20, un primer cuartil de 12 y un tercer cuartil de 32, una curtosis estandarizada de 1.45 y una asimetría estandarizada de -0.24. ¿Cuál de las siguientes afirmaciones es correcta:

a. Una representación adecuada de esta muestra es 20±20.

b. Una representación breve adecuada de esta muestra es 19±19.

c. Por encima de 12 tenemos aproximadamente el 50% de la población de los pacientes de Parkinson de menos de 3 años de evolución.

d. Por debajo de 28 tenemos aproximadamente el 50% de la población de los pacientes de Parkinson de menos de 3 años de evolución.

18. En una Regresión lineal simple es cierto:

a. Si la R2 es superior a 5% tenemos una relación estadísticamente significativa entre las variables de la regresión.

b. Si la pendiente de la recta presenta un intervalo de confianza del 95% como el siguiente: (-3.35, -0.18), la pendiente es negativa y significativa.

c. Si un intervalo de confianza del 95% de la pendiente de la recta incluye al -1 no es una pendiente significativa.

d. Si un intervalo de confianza del 95% de la pendiente de la recta no incluye al 0 entonces un intervalo de confianza del 95% de la correlación de Pearson de esas variables tampoco incluirá al 1.

19. Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. Se determina, finalmente, que para el nivel de precisión requerido y para la Desviación estándar que se ha previsto, necesitamos una n=400. El intervalo del 99.5% obtenido es (7, 13). La Desviación estándar era:

a. 15.

b. 10.

c. 20.

d. 25.

20. En un Análisis de componentes principales es cierto:

a. El número de componentes generadas en el análisis es igual que el número de variables originales.

b. Los coeficientes de la primera componente son siempre positivos.

c. Si las variables son independientes entre ellas, el Análisis de componentes principales nos aporta una muy buena reducción de dimensiones.

d. Dos variables que tienen una muy fuerte correlación positiva entre sí tendrán coeficientes grandes y con signo distinto en la primera componente principal.

Soluciones Situación 67

1c: La correlación de la respuesta «a» no es significativa, porque en su intervalo de confianza está incluido el 0. Las otras tres, sí son correlaciones signficativas. De esas tres la corrrelación con mayor magnitud, con valor absoluto mayor es -0.7.

2a: Las cuatro Odds ratio son significativas pero la que indica mayor relación es la OR=0.1. Ésta OR es equivalente a 10, que es mayor que 8, que 5 y que 4, que es la equivalente de 0.25.

3c: El Error estándar es 10/raiz(400); o sea, 0.5. Dos veces 0.5 es 1. Por lo tanto, 40 más menos 1 dan lugar al intervalo (39,41).

4c: La variable es continuda, las muestras son relacionadas. La variable diferencia se ajusta a la distribución normal porque el p-valor del test de Shapiro-Wilk es superior a 0.05. Por lo tanto, el test a aplicar es el test de la t de Student de datos apareados.

5d: De la asimetría y curtosis estandarizadas deducimos que la muestra no se ajusta a la distribución normal, luego ni la mediana muestral no tiene por qué ser igual a la media, ni podremos construir los intervalos tal como lo solemos hacer con la distribución normal ni tampoco podremos de forma pautada establecer los percentiles si previamente no los hemos calculado a la muestra. Por lo tanto, ni la respuesta «a», ni la «b», ni la «c» son correctas.

6d: La correlación que nos dan aunque grande no es significativa. Debemos tener un tamaño de muestra pequeño. Para saber si es éste el signo de la correlación y la magnitud no nos queda otro remedio que aumentar el tamaño de muestra.

7d: Si en una técnica de comparación el p-vaor es menor que 0.05 las medias poblacionales sí son distintas significativamente.

8a: En el intervalo de confianza del 95% (1.9, 3.1) no tenemos incluido al 1, por lo tanto se trata de una relación significativa.

9d: Un intervalo de confianza del 99% será mayor, de más amplitud, que uno del 95%. Recordemos lo que sucede al contruir intervalos de confianza de una variable con distribución normal: Más menos una DE crea un intervalo del 68.5%, más menos dos DE lo crea del 95%, más menos 3 DE crea uno del 99.5%. Cada vez más amplio y con más valores en su interior.

10d: El primer cuartil es el promedio entre -7 y 1, que es -3.

 

Situación 67: Examen (Temas 1-5, 8, 9, 13 y 14)

1. ¿Qué correlación es mayor?

a. r= 0.75 (IC 95%: (-0.1, 0.99)

b. r= 0.5 (p<0.05)

c. r= -0.7 IC 95%: (-0.99, -0.2)

d. r= 0.3 (p<0.05)

2. ¿Qué Odds ratio es mayor; o sea, cuál indica más relación entre dos variables dicotómicas?

a. 0.1 ( IC 95%: (0.001, 0.2)

b. 8 (p<0.05)

c. 0.25 (p<0.05)

d. 5 ( IC 95%: (2, 15.5)

3. Si una muestra de tamaño 400, que se ajusta bien a una distribución normal, tiene una media muestral de 40 y una desviación estándar de 10, un intervalo de confianza del 95% de la media poblacional sería:

a. (38, 42)

b. (0, 80)

c. (39, 41)

d. (39.5, 40.5)

4. Estamos estudiando dos posibles nuevos productos alimentarios. Para hacer un estudio de mercados se toma una muestra de 50 personas y se divide en dos grupos de 25 cada uno. Cada persona de los dos grupos prueba los dos productos. La diferencia entre ambos grupos es únicamente en el orden de degustación. Los degustadores puntúan el producto entre el 0 y el 10. Con los valores obtenidos de esa variable resta de ambas puntuaciones encuestado a encuestado se aplica el Test de Shapiro-Wilk resultando un p-valor superior a 0.05. El Test a aplicar para comparar ambos productos será:

a. El Test de la t de Student de varianzas desiguales si el Test de Fisher-Snedecor nos da un p-valor inferior a 0.05..

b. El Test de la t de Student de varianzas iguales si el Test de Fisher-Snedecor nos da un p-valor inferior a 0.05.

c. El Test de la t de Student de datos apareados.

d El Test de McNemar.

5. En una muestra con una variable cuantitativa con Asimetría estandarizada igual a 7.23 y Curtosis estandarizada de -12.98, con media igual a 120 y desviación estándar igual a  10, podemos afirmar:

a. La mediana muestral es 120.

b. Que el 95% de la población, aproximadamente, tiene valores entre 100 y 140.

c. Que el percentil 95 es 140.

d. Ninguna de las tres afirmaciones anteriores es cierta.

6. Si entre dos variables tenemos una correlación de Pearson: r=-0.76 (p>0.05), podemos afirmar lo siguiente:

a. Existe correlación significativa porque el p-valor es superior a 0.05.

b. No es significativa porque las correlaciones negativas nunca pueden ser significativas.

c. El tamaño muestral debe ser muy grande para tener ese p-valor asociado con esa correlación.

d. Si queremos comprobar si hay relación entre esas variables, de qué signo es y de qué magnitud es, necesitamos aumentar el tamaño de muestra.

7. ¿Qué afirmación, entre las siguientes, no es cierta?:

a. Cuanta menos dispersión tenemos en dos grupos a comparar menos tamaño de muestra necesitaremos para encontrar diferencias significativas.

b. Cuanta más diferencia haya entre las medias muestrales de dos grupos a comparar menos tamaño de muestra necesitaremos para detectar significación estadística.

c. En una técnica estadística de comparación de dos poblaciones aplicada a dos muestras con medias muestrales iguales, el p-valor será mayor que 0.05.

d. Si el p-valor en una comparación de dos poblaciones es menor de 0.05 entonces las dos medias poblacionales no son distintas significativamente.

8. ¿Qué afirmación, entre las siguientes, es cierta?:

a. Si la Odds ratio entre dos variables dicotómicas nos da un intervalo de confianza del 95% (1.9, 3.1) se trata de una relación significativa porque el intervalo no contiene al 1.

b. Si el valor del estadístico de la ji-cuadrado es menor que 0 rechazamos la Hipótesis nula de independencia de las variables cualitativas.

c. Una correlación de Pearson entre dos variables cuantitativas con intervalo de confianza del 95% (0.05, 0.85) no es una correlación significativa porque no contiene al 0.

d. Una correlación de Pearson es significativa si el tamaño de muestra es superior a 30.

9. ¿Cuál de las siguientes afirmaciones es cierta?

a. Un intervalo de confianza del 95% de una Odds ratio que incluye al 0 es significativa.

b. Una correlación de Pearson mayor que 0.5 es significativa.

c. Cuanto mayor es el tamaño de muestra de dos poblaciones a comparar más difícil es ver diferencias significativas entres sus medias poblacionales.

d. Un intervalo de confianza del 99% tendrá una longitud de intervalo mayor que uno del 95% de confianza.

10. Sea la muestra (-7, -7, 1, 1, 3, 3, 3, 7). Podemos afirmar:

a. El rango es 7.

b. La mediana es 1.

c. El rango intercuartílico es 14.

d. El primer cuartil es -3.

 

Situación 66: Trabajo para ciencias sociales y humanas

Estos son los datos de las distribuciones porcentuales de licenciados, en el año 2010, distribuidos según ámbito de estudio, en los siguientes estados:

Estado    Educación Humanidades    Ciencias sociales    Ciencias puras    Ingeniería    Agricultura    Ciencias salud    Servicios
Bélgica 12,7 11,5 31,7 5,3 11,3 2,4 23 2
Bulgaria 5,5 6,8 51,6 4,7 15,2 1,9 6,7 7,6
República Checa 15,6 7,7 35,1 9,5 14,6 3,6 9,2 4,7
Dinamarca 7,6 13,2 32,7 8,3 11,1 1,6 22,6 2,9
Alemania 9,3 16,5 22,4 12,7 13 1,5 21,6 3
Estonia 7,7 12,8 37,6 9,8 10,7 1,9 11 8,5
Irlanda 8,8 12,4 31,9 11,6 12,5 1,4 16,2 5,3
Grecia 8,8 13,2 30,3 12,1 15,4 4,6 12,6 3,1
España 14,5 8,7 26,8 8,7 16,2 1,7 15,4 8
Italia 6 17,1 33,5 7,4 15,3 1,5 16 3,2
Chipre 10,7 10,1 49 6,9 6,4 0,1 7,6 9,2
Letonia 8,3 7,2 54,4 5 9,3 0,9 9,3 5,7
Lituania 11,5 7,2 45,8 5 16,2 1,9 9,6 2,9
Hungría 11,5 12,5 39,9 6,8 8,8 2,4 8,9 9,2
Malta 10,5 18,9 38,3 9,4 6,9 0,5 12,6 2,9
Países Bajos 13,5 9 37,8 6,2 7,9 1,5 18,8 5,3
Austria 12,1 8,6 34 9,8 19,3 1,8 10,9 3,5
Polonia 16,4 8,1 42,8 6,9 9 1,7 8,9 6,2
Portugal 8,7 8,2 29,3 6,5 18,3 1,6 20,8 6,5
Rumanía 1,5 8,3 60 4,8 12,3 1,6 8,8 2,7
Eslovenia 7,5 6,2 44,3 5,5 15,6 2,8 8,7 9,4
Eslovaquia 13,7 6,6 31,9 7,9 12,9 1,9 19,2 5,9
Finlandia 6,1 13,4 23 7,8 24 2,2 18,4 5,1
Suecia 14,8 6,3 24,1 7,4 18,4 1,1 24,9 3,1
Reino Unido 11,1 15,9 31,2 12,9 9,7 0,9 16,9 1,5
Islandia 20,4 10,3 36,9 6,6 9,1 0,5 15,1 1,2
Noruega 17,7 8,6 29,4 7,1 8,9 0,8 22,6 4,9
Suiza 9,9 8,2 37,4 7,5 12,3 1,9 15,6 7,2
Croacia 4,8 11,9 44,2 7,8 12,3 3,5 6,9 8,7
Macedonia 10,2 13,5 37,7 11,6 7,7 2,3 10,6 6,3
Turquía 11,8 8,2 44,8 7 13,3 4,5 5,9 4,6

Plantea posibles estudios donde aplicar diferentes técnicas estadísticas vistas durante el curso para tratar de organizar y sacarle el máximo provecho posible a estos datos.