Archivo de la categoría: PROBLEMAS

Situación 174: Examen (Temas 1-12)

1.¿En cuál de estas pendientes tenemos más capacidad predictiva?

a.Pendiente=2; IC 95% (1, 2); r=0.35

b.Pendiente=3; IC 95% (-1, 7); r=0.7

c.Pendiente=-1; IC 95% (-3, 1); r=-0.8

d.Pendiente=0.1; IC 95% (0.05, 0.15); r=0.7

2.¿Cuál es el rango intercuartílico de la siguiente muestra?

(19, 7, 3, 6, 2, 10, 12, 1, 17)

a.4

b.9

c.15

d.13

3.Se nos proporciona un intervalo de confianza de la media del 95% de la concentración de un neurotransmisor en pacientes con trastorno bipolar. Este intervalo es (22, 26) y el tamaño de muestra es 100. ¿Cuál era la desviación estándar?

a.10

b.5

c.4

d.1

4.Nos dan un intervalo de confianza del 95% descriptivo de una variable con una muestra de tamaño 100, que es (90, 110). Construir un intervalo de la media del 95%:

a.(90, 110)

b.(99, 101)

c.(98, 102)

d.(99.5, 1005)

5.¿Cuál de las siguientes afirmaciones es cierta?

a.Una V de Crámer de -1 indica una total relación entre dos variables cualitativas

b.Si tenemos una correlación r=0.5 con p=0.24 con n=5 si aumentamos el tamaño de muestra a n=10 será significativa.

c.Un kappa de 0 indica que hay que aceptar la hipótesis nula de total concordancia entre operadores.

d.Una OR=0.5 con un IC 95%: (0.4, 0.6) indica que estamos ante un factor de protección significativo.

6.¿Cuál de las siguientes afirmaciones es cierta?

a.Una r=0.8 con p=0.5 indica suficiente capacidad predictiva.

b.Una regresión logística con OR=0.7 con p=0.02 indica que estamos ante un factor de riesgo significativo.

c.Una ji-cuadrado de 34.5 con una tabla 3×3 indica que debemos mantener la hipótesis nula de no relación entre las variables.

d.Una r=0.1 con una p=0.001 indica que estamos ante significación formal pero no ante significación material.

7.¿Cuál de las siguientes afirmaciones es cierta?

a.En una tabla de contingencias cualquiera si el valor de la ji-cuadrado es 1.44 podemos decir que existe relación significativa entre las variables sin necesidad de mirar el umbral en la tabla de la ji-cuadrado.

b.Una OR=1.45 con un IC del 95% de (1.20, 2.04) es compatible con un valor de Ji-cuadrado de 2.16

c.Una muestra como la siguiente (1, 2, 3, 4, 5) tiene un rango intercuartílico de 3.

d.Una pendiente de una recta de regresión de -3 con un IC 95% de (-4, -2) no es compatible con una correlación r=0.7 con un IC 95% de (0.6, 0.8).

8.¿Cuál de las siguientes afirmaciones es cierta?

a.En una tabla de contingencias 4×4 si el valor de la ji-cuadrado es 3.99 existe relación

significativa entre las variables.

b.Una OR=0.19 con un IC del 95% de (0.05, 0.42) es compatible con una Ji-cuadrado de 2.01

c.En una regresión logística que relaciona edad con un enfermedad tenemos una OR=1.08 IC 95%: (1.07, 1.09). Por cada año que aumentamos tenemos un 8% más posibilidades de adquirir la enfermedad.

d.Una correlación r=0.57 con un p-valor de 0.44 es compatible con una pendiente de 33 con un intervalo de confianza del 95% de (12, 57)

9.¿Cuál de las siguientes afirmaciones es cierta?

a.Una pendiente de 5 con un intervalo de confianza del 95% de (3, 8) es compatible con una correlación con intervalo de confianza (-0.1, 0.5)

b.Una OR=1.5 como factor de riesgo es equivalente a una OR=0.666 como factor de protección. 

c.Si queremos realizar una fórmula matemática para predecir la variable «Cantidad de un neurotrasmisor» con la variable «Años que lleva un paciente diagnosticado de una enfermedad psiquiátrica», la técnica estadística que utilizaremos es una regresión logística.

d.Para ver la concordancia de un operador consigo mismo utilizaremos un test de la ji-cuadrado.

10.¿Cuál de las siguientes afirmaciones es cierta?

a.Una pendiente de 0.5 con un intervalo de confianza del 95% de (0.3, 0.8) es compatible con una correlación con intervalo de confianza (-0.8, -0.5)

b.Una OR=100 como factor de riesgo es equivalente a una OR=0.1 como factor de protección. 

c.Una muestra de horas de estudio de unos estudiantes como la siguiente (1, 1, 2, 5) tiene el mismo índice de Gini que una muestra, también de horas de estudio, de otros estudiantes com la siguiente (7, 7, 8, 11).

d.Una OR=0.67 con IC 95%: (0.58, 0.74) en una regresión logística indica que al ir aumentando el valor de la variable cuantitativa disminuye la probabilidad de contraer la enfermedad que estamos estudiando.

 

Situación 173: Examen (Temas 1-12)

1.¿En cuál de estas pendientes tenemos más capacidad predictiva?

a.Pendiente=2; IC 95% (1, 3); r=0.6

b.Pendiente=3; IC 95% (-1, 7); r=0.9

c.Pendiente=15; IC 95% (-3, 1); r=0.9

d.Pendiente=0.1; IC 95% (0.05, 0.15); r=0.4

2.¿Cuál es el rango intercuartílico de la siguiente muestra?

(19, 7, 3, 6, 2, 4, 5, 1, 17)

a.4

b.9

c.15

d.13

3.Se nos proporciona un intervalo de confianza de la media del 95% de la concentración de un neurotransmisor en pacientes con trastorno bipolar. Este intervalo es (23, 25) y el tamaño de muestra es 100. ¿Cuál era la desviación estándar?

a.10

b.5

c.4

d.1

4.Nos dan un intervalo de confianza del 95% descriptivo de una variable con una muestra de tamaño 100, que es (80, 120). Construir un intervalo de la media del 95%:

a.(90, 110)

b.(99, 101)

c.(98, 102)

d.(99.5, 100.5)

5.¿Cuál de las siguientes afirmaciones es cierta?

a.Una V de Crámer de 1 indica una total relación entre dos variables cualitativas

b.Si tenemos una correlación r=0.5 con p=0.24 con n=5 si aumentamos el tamaño de muestra a n=10 será significativa.

c.Un kappa de 0 indica que hay que aceptar la hipótesis nula de total concordancia entre operadores.

d.Una OR=0.5 con un IC 95%: (4.0, 6.0) indica que estamos ante un factor de protección significativo.

6.¿Cuál de las siguientes afirmaciones es cierta?

a.Una r=0.001 con p=0.001 indica suficiente capacidad predictiva.

b.Una regresión logística con OR=0.7 con p=0.02 indica que estamos ante un factor de riesgo significativo.

c.Una ji-cuadrado de 34.5 con una tabla 3×3 indica que debemos rechazar la hipótesis nula de no relación entre las variables.

d.Una r=0.1 con una p=0.001 indica que estamos ante significación formal y material.

7.¿Cuál de las siguientes afirmaciones es cierta?

a.En una tabla de contingencias cualquiera si el valor de la ji-cuadrado es 2.22 podemos decir que existe relación significativa entre las variables sin necesidad de mirar el umbral en la tabla de la ji-cuadrado.

b.Una OR=1.45 con un IC del 95% de (1.20, 2.04) es compatible con un valor de Ji-cuadrado de 0.0001

c.Una muestra como la siguiente (1, 2, 3, 8, 6) tiene un rango intercuartílico de 4.

d.Una pendiente de una recta de regresión de -3 con un IC 95% de (-4, -2) es compatible con una correlación r=0.7 con un IC 95% de (0.6, 0.8).

8.¿Cuál de las siguientes afirmaciones es cierta?

a.En una tabla de contingencias 4×4 si el valor de la ji-cuadrado es 3.99 existe relación

significativa entre las variables.

b.Una OR=0.19 con un IC del 95% de (0.05, 0.42) es compatible con una Ji-cuadrado de 4.44

c.En una regresión logística que relaciona edad con un enfermedad tenemos una OR=1.08 IC 95%: (1.07, 1.09). Por cada año que aumentamos tenemos un 18% más posibilidades de adquirir la enfermedad.

d.Una correlación r=0.57 con un p-valor de 0.44 es compatible con una pendiente de 33 con un intervalo de confianza del 95% de (12, 57)

9.¿Cuál de las siguientes afirmaciones es cierta?

a.Una pendiente de 5 con un intervalo de confianza del 95% de (3, 8) es compatible con una correlación con intervalo de confianza (-0.1, 0.5)

b.Una OR=1.5 como factor de riesgo es equivalente a una OR=0.5 como factor de protección. 

c.Si queremos realizar una fórmula matemática para predecir la variable «Cantidad de un neurotrasmisor» con la variable «Años que lleva un paciente diagnosticado de una enfermedad psiquiátrica», la técnica estadística que utilizaremos es una regresión logística.

d.Para ver la concordancia de un operador consigo mismo utilizaremos un test kappa

10.¿Cuál de las siguientes afirmaciones es cierta?

a.Una pendiente de 0.5 con un intervalo de confianza del 95% de (0.3, 0.8) es compatible con una correlación con intervalo de confianza (-0.8, -0.5)

b.Una OR=100 como factor de riesgo es equivalente a una OR=0.1 como factor de protección. 

c.Una muestra de horas de estudio de unos estudiantes como la siguiente (1, 1, 2, 5) tiene el mismo índice de Gini que una muestra, también de horas de estudio, de otros estudiantes com la siguiente (7, 7, 8, 11).

d.Una OR=0.67 con IC 95%: (0.58, 0.74) en una regresión logística indica que al ir aumentando el valor de la variable cuantitativa disminuye la probabilidad de contraer la enfermedad que estamos estudiando.

 

Situación 172: Examen (Tema 11)

1.Tenemos la siguiente muestra de pacientes con los valores de edad y si el paciente tiene o no un trastorno del sueño (0=no; 1=sí):

(14, 0) (18, 0) (23, 0) (25, 0) (28, 0) (32, 1) (41, 0) (48, 0) (53, 1) (62, 0) (65, 1) (68, 1) (75, 1) (78, 0) (81,1) (85, 1)

¿Cuál crees que es la OR más posible con estos datos en una regresión logística?

a. Mayor que 1.

b. 0

c. Menor que 1.

d. Con esta información no podemos decir nada.

2. Tenemos en una regresión logística la siguiente relación entre la variable Edad y el padecer o no un trastorno psicológico (0=no; 1=sí):

En una persona que no sabemos si padece ese trastorno psicológico pero que sabemos que tiene 40 años, cuál dirías que es la probabilidad de que sufra dicho transtorno:

a. 10%

b. 30%

c. 60%

d. 0%

3.Estamos relacionando la Edad con un determinado trastorno psicológico. La curva de la Regresión logística es la siguiente:

¿Cuál crees que es la OR más posible tras ver esta curva?

a. Mayor que 1.

b. 0

c. Menor que 1.

d. Con esta información no podemos decir nada.

4.Tenemos en un estudio donde se busca asociación entre ciertos comportamientos y una determinada enfermedad unos resultados expresado mediante la técnica estadística de la regresión logística. ¿Cuál de las siguientes variables tiene más relación con la enfermedad)

a.OR=1.06 IC 95%: (1.05, 1.07).

b.OR=1.26 IC 95%: (0.88, 1.57).

c.OR=0.95 IC 95%: (0.93, 0.97).

d.OR=0.91 IC 95%: (0.67, 1.28).

5.A continuación tenéis el abstract de una revista de Medicina de familia:

¿Qué afirmación es cierta viendo los resultados de regresión logística de este estudio?

a. Estar casada, tener pareja estable, ser solteras o ser viuda es un factor de riesgo para sufrir violencia de género.

b. Ser de la etnia caucásica es un factor de riesgo para sufrir violencia de género.

c. Estar separada o divorciada es un factor de riesgo para sufrir violencia de género.

d. No hay relación significativa entre el estado civil de una mujer y la violencia de género.

6. En un estudio donde se analiza mujeres diagnosticadas de anorexia y se trabaja con un grupo control de mujeres sin tal trastorno, se afirma que la relación entre el número declarado de amigos o amigas íntimas de cada mujer y el tener o no tener el trastorno es una OR=0.869, IC 95%: (0.853, 0.881). ¿Qué afirmación es cierta?

a.Tener muchos amigos es un factor de riesgo para tener anorexia.

b.Tener pocos amigos es un factor de protección para tener anorexia.

c.Por cada amigo íntimo o amiga íntima que una mujer añada se reduce un 15% la probabilidad de tener anorexia.

d.Ninguna de las respuestas anteriores es cierta.

 

Situación 170: Trabajo práctico (Psicología)

A continuación tenéis la siguiente base de datos:

P=Paciente

S=Sexo (1=Hombre; 2=Mujer)

E=Edad en años

IMC=Índice de masa corporal

TS=Transtorno del sueño (1=Sí; 0=No)

TA=Transtorno de la alimentación (1=Sí; 0=No)

Hb=Hemoglobina

P S E IMC TS TA Hb
1 1 32 24 0 0 15,1
2 1 45 21 0 0 14,4
3 1 34 27 0 0 14,6
4 1 67 29 0 0 13,3
5 1 54 32 1 1 13,2
6 1 34 20 0 0 13,2
7 1 78 19 0 0 12,4
8 1 43 22 0 0 14,0
9 1 21 32 0 1 14,5
10 1 37 20 0 0 14,6
11 1 44 37 1 0 13,9
12 1 33 22 0 0 14,9
13 1 22 24 0 0 16,1
14 1 18 25 0 0 15,7
15 1 75 23 0 0 14,1
16 1 34 34 1 0 13,8
17 1 65 38 1 0 15,5
18 1 45 27 0 0 12,8
19 1 35 29 0 0 13,2
20 1 61 32 1 0 15,1
21 1 66 20 1 0 14,6
22 1 60 19 0 0 15,8
23 1 70 24 1 0 14,7
24 1 30 33 0 0 13,6
25 1 44 27 0 0 14,6
26 1 33 29 0 0 14,1
27 1 55 32 1 0 14,8
28 1 42 20 0 0 15,0
29 1 19 24 0 1 13,3
30 1 34 21 0 0 13,4
31 1 65 27 0 0 14,9
32 1 45 32 1 0 13,5
33 1 35 32 1 0 13,9
34 1 61 20 0 0 13,8
35 1 66 19 0 0 12,9
36 1 60 22 0 0 14,5
37 1 70 32 1 1 13,5
38 1 30 20 0 0 12,9
39 1 44 24 0 0 15,2
40 1 33 21 0 0 13,4
41 1 55 27 0 0 14,9
42 1 42 29 0 0 13,6
43 1 19 32 1 1 13,7
44 1 23 20 0 1 13,6
45 1 36 19 0 0 14,8
46 1 45 22 0 0 15,0
47 1 48 32 1 0 14,2
48 1 70 24 0 0 15,7
49 1 30 21 0 0 15,0
50 1 44 27 0 0 14,2
51 2 33 29 0 0 13,4
52 2 55 32 1 0 13,0
53 2 42 20 0 0 14,2
54 2 70 19 0 0 13,1
55 2 30 24 0 0 12,1
56 2 44 21 0 0 10,0
57 2 33 27 0 1 15,7
58 2 55 29 0 0 13,0
59 2 42 32 1 0 13,3
60 2 19 20 0 1 11,3
61 2 23 19 0 0 12,4
62 2 70 22 0 0 11,9
63 2 30 32 1 0 14,7
64 2 44 24 0 0 11,5
65 2 33 21 0 0 11,5
66 2 55 27 0 0 11,7
67 2 42 29 0 0 12,5
68 2 70 19 0 0 14,3
69 2 30 22 0 0 12,0
70 2 44 32 1 1 12,7
71 2 33 34 1 0 12,0
72 2 55 24 0 0 12,6
73 2 42 21 0 0 14,1
74 2 19 27 0 1 12,3
75 2 23 19 0 1 13,1
76 2 36 22 0 0 13,0
77 2 45 32 1 0 14,0
78 2 48 20 0 0 11,3
79 2 60 31 1 1 12,6
80 2 70 21 1 0 13,9
81 2 30 19 0 1 13,0
82 2 44 22 0 0 13,1
83 2 33 32 1 1 12,6
84 2 22 19 0 1 12,7
85 2 42 22 0 0 13,2
86 2 19 32 1 1 11,8
87 2 34 20 0 0 13,3
88 2 65 24 0 0 11,8
89 2 45 21 0 0 14,6
90 2 35 27 0 0 12,9
91 2 61 29 0 0 12,7
92 2 66 32 1 0 11,3
93 2 60 20 0 0 11,4
94 2 70 19 0 0 11,5
95 2 30 22 0 0 14,1
96 2 44 28 0 0 13,1
97 2 22 27 0 1 12,9
98 2 31 22 0 1 14,7
99 2 69 21 0 0 12,7
100 2 39 18 0 0 13,0


a. Hacer una descriptiva de las variables IMC por sexos: Media, Mediana, Desviación estándar, Primer y Tercer cuartil, Rango intercuartílico, Box-Plot.
1.

b. Hacer una descriptiva de las variables TS y TA, global, no por sexos.

c. Describir brevemente y numéricamente la variable edad y la variable IMC de estos 100  pacientes agrupados, no por sexos.

d.Crear un Intervalo de confianza de la media de la variable IMC global, no por sexos.

2.

a.Comprobar si hay relación entre el sexo y el tener trastorno del sueño.

b.Comprobar si hay relación entre la edad y el IMC.

c.Calcular la Odds ratio para Sexo (Mujer) respecto a trastorno de la alimentación.

d.Realizar una Regresión logística entre Edad y Trastorno de la alimentación.

e.Realizar una Regresión logística entre Edad y Trastorno del sueño.

3.

a.Comparar si hay diferencias significativas de IMC entre los hombres y las mujeres.

b.Comparar si hay diferencias significativas de Edad entre los que tienen y los que no tienen un transtorno de la alimentación.

c.Comparar si hay diferencias significativas de Hb entre hombres y mujeres.

d.Comparar si hay diferencias significativas de Hb entre los que tienen y los que no tienen un transtorno del sueño.

Situación 171: Examen (Tema 10)

1. ¿Dónde hay más tamaño del efecto entre los cuatro siguientes casos?

a.Media 1=5; Media 2=6: Desviación estándar=0.1.

b.Media 1=5; Media 2=6: Desviación estándar=0.5.

c.Media 1=5; Media 2=6: Desviación estándar=0.2.

d.Media 1=5; Media 2=6: Desviación estándar=1.

 

2.En un primer estudio de comparación se calcula la d de Cohen y resulta ser 5 y en un segundo estudio la d de Cohen resulta ser 1. Podemos decir:

a.En el primer estudio hay más tamaño del efecto.

b.Debemos ver primero si la diferencia es estadísticamente significativa antes de valorar esta diferencia en el tamaño del efecto.

c.El segundo estudio tiene mayor tamaño del efecto.

d.En el primer estudio hay más Desviación estándar.

 

3.En un estudio tenemos una correlación de Pearson de r=0.8 con una p=0.23. Podemos decir:

a. Tenemos significación formal y significación material.

b.Tenemos significación formal y no tenemos significación material.

c.No tenemos significación formal y no tenemos significación material.

d.No tenemos significación formal y sí tenemos significación material.

 

4.En un estudio tenemos una correlación de Pearson de r=0.2 con una p=0.001. Podemos decir:

a. Tenemos significación formal y significación material.

b.Tenemos significación formal y no tenemos significación material.

c.No tenemos significación formal y no tenemos significación material.

d.No tenemos significación formal y sí tenemos significación material.

 

5.En un estudio tenemos una correlación de Pearson de r=0.9 con una p=0.001. Podemos decir:

a. Tenemos significación formal y significación material.

b.Tenemos significación formal y no tenemos significación material.

c.No tenemos significación formal y no tenemos significación material.

d.No tenemos significación formal y sí tenemos significación material.

 

6.En un estudio tenemos una correlación de Pearson de r=0.1 con una p=0.73. Podemos decir:

a. Tenemos significación formal y significación material.

b.Tenemos significación formal y no tenemos significación material.

c.No tenemos significación formal y no tenemos significación material.

d.No tenemos significación formal y sí tenemos significación material.

 

7.En un estudio tenemos una OR=2; IC 95%: (0.3, 5.32). Podemos decir:

a. Tenemos significación formal y significación material.

b.Tenemos significación formal y no tenemos significación material.

c.No tenemos significación formal y no tenemos significación material.

d.No tenemos significación formal y sí tenemos significación material.

 

8.En un estudio tenemos una OR=0.40; IC 95%: (0.18, 0.67). Podemos decir:

a. Tenemos significación formal y significación material.

b.Tenemos significación formal y no tenemos significación material.

c.No tenemos significación formal y no tenemos significación material.

d.No tenemos significación formal y sí tenemos significación material.

 

9.En un estudio en el que relacionamos dos variables dicotómicas tenemos una OR=1.02; IC 95%: (0.41, 4.03). Podemos decir:

a. Tenemos significación formal y significación material.

b.Tenemos significación formal y no tenemos significación material.

c.No tenemos significación formal y no tenemos significación material.

d.No tenemos significación formal y sí tenemos significación material.

 

10.En un estudio en el que relacionamos dos variables dicotómicas tenemos una OR=1.02; IC 95%: (1.01, 1.03). Podemos decir:

a. Tenemos significación formal y significación material.

b.Tenemos significación formal y no tenemos significación material.

c.No tenemos significación formal y no tenemos significación material.

d.No tenemos significación formal y sí tenemos significación material.

 

Solución Situación 165

1.

Peso en Ambiente 1:

Peso en Ambiente 2:

%Proteína en Ambiente 1:

%Proteína en Ambiente 2:

2.

Al trabajar la variable en la muestra global de los dos ambientes vemos con el Sesgo (Asimetría) y Curtosis estandarizadas (ambos valores están dentro del intervalo (-2, 2)) que la muestra se ajusta suficientemente a la distribución normal, por lo que se puede representar con la media más menos la desviación estándar:

21.44+-3.3464

3.

Existe una correlación estadísticamente significativa (p<0.001) y una R2 del 81.79%. Suficiente, pues, capacidad predictiva. Podemos construir un modelo de Regresión lineal simple:

4.

Al tratarse de dos variables dicotómica podemos aplicar una ji-cuadrado:

Como si lo enfocamos como una comparación de dos poblaciones con una variable dicotómica y muestras independientes, al ser un tamaño de muestra por grupo inferior a 30, deberíamos aplicar un test exacto de Fisher, podemos también, y tal vez sea más adecuado, aplicar este test:

 

5.

Como se trata de dos poblaciones, variables continuas y muestra independientes, lo primero será comprobar la normalidad:

Como podemos aceptar la normalidad de ambas muestra, aplicamos el test de igualdad de varianzas:

Al ser las varianzas iguales aplicamos un test de la t de Student de varianzas iguales:

6.

Como se trata de dos poblaciones, variables continuas y muestra independientes, lo primero será comprobar la normalidad:

Como se trata de dos muestras que no se ajustan a la normal aplicaremos un test de Mann-Whitney:

Solución Situación 169

1c. Todos los cambios implican bajada de la potencia.

2c. Porque el IC del 95% incluye al 0.

3b. Si aplicamos la fórmula del tema 3 para un IC del 95% de una proporción obtenemos estos valores.

4a. El error estándar es 1. Por lo tanto, la Desviación estándar de la muestra es 5, para que al dividirla por la raíz cuadrada de 25 nos dé el valor de error estándar.

5d. En esta muestra el primer cuartil es 1 y el tercero es 3. Luego, el rango intercuartílico es 2.

6b. Tenemos un p-valor de no significación y un IC del 95% que incluye al cero.

7d. Ambos cambios propuestos van en la dirección de bajar el p-valor.

8b. Si se aplica la fórmula de la determinación del tamaño de muestra del tema 16 se obtiene este valor.

9d. Si en la tabla de la ji-cuadrado se busca el valor de 14.86 en la fila de los cuatro grados de libertad ((3-1)x(3-1)), se observa que a su derecha tenemos un área de 0.005. Este área es el p-valor.

10d. La variable estudiada es dicotómica y la muestra es relacionada puesto que se aplica a cada una de las 50 observaciones los dos tratamientos. El test de McNemar es el apropiado.

11a. Si se observa la tabla de la ji-cuadrado es el único caso que concuerda el valor de la ji-cuadrado y el p-valor correspondiente (área a la derecha de la curva de la distribución ji-cuadrado)

12d. Como 17.8 es el tercer cuartil, podemos hacer esta afirmación coherentemente.

13b. Los dos intervalos de confianza de la media claramente no se solapan. Esto lleva a la conclusión de que se trata de diferencias estadísticamente significativas.

14c. La ji-cuadrado es un test que permite valorar la significación de la V de Crámer.

15a. Claramente hay diferencias y las comparaciones múltiples nos dará que hay tres grupos y no cuatro en este estudio.

16a. Zona es significativo. Posición respecto a la termoclina no. Hay interacción porque la zona 1 y 2 están cruzadas.

17b. No hay normalidad en una de las dos muestras. Luego, debemos aplicar el test de Mann-Whitney.

18c. El 25 está dentro del IC del 95 por lo que la hipótesis nula no la rechazaremos. Hay dos p-valores que marcan que no hay significación. Pero el p-valor 1 solo saldría si coincidieran la media de la hipótesis y la media muestral, cosa que no sucede. Cosa que pasaría si la hipótesis fuera que la media poblacional es 26.

19c. Porque el intervalo no contiene al 0.

20d. Concordancia entre dos operadores o de un operador consigo mismo tiene una matriz en la que la mayor parte de valores se sitúan en la diagonal principal.

 

 

Situación 169: Examen (Temas 1-16)

1)Tenemos dos muestras de tamaño 20 obtenidas de dos poblaciones en las que queremos comparar sus medias poblacionales. Las dos medias muestrales son 100 y 106 y la desviación estándar muestral en ambas muestras es de 5. Evaluamos con el GRANMO la potencia del estudio realizado obteniendo la siguiente tabla:

¿qué respuesta es correcta?

a.Con estos datos no encontraremos diferencias estadísticamente significativas porque la potencia es menor al 95%.

b.Si aumentáramos el tamaño de muestra, la diferencia de medias se mantuviera y la desviación estándar subiera, entonces la potencia bajaría.

c.Si disminuyéramos el tamaño de muestra, la diferencia de medias bajara y la desviación estándar aumentara, entonces la potencia bajaría.

d.Si aumentáramos el tamaño de muestra, la diferencia de medias subiera y la desviación estándar se mantuviera igual, entonces la potencia bajaría.

 

2)En un artículo donde se compara la temperatura media del agua entre dos zonas marítimas distintas se nos da la siguiente información: La diferencia de medias poblacionales tiene un intervalo de confianza del 95% de (-0.8, 1.05). ¿Cuál de las siguientes afirmaciones es cierta?

a.Como no tenemos un p-valor no podemos decir nada sobre esa comparación de temperaturas.

b.Necesitaríamos saber qué técnica de comparación se ha aplicado.

c.Podemos decir que no hay diferencias de temperatura estadísticamente significativas.

d.Necesitamos conocer cómo es la descriptiva de cada una de las dos muestras para tomar una decisión.

 

3)En un estudio donde hemos analizado 100 muestras recogidas en el mar mediterráneo en 23 se ha superado un umbral de un contaminante. Calcular un intervalo de confianza del 95%:

a.(10.38, 35.62)

b.(14.58, 31.42)

c.(18.79, 27.21)

d.(20.90, 25.10)

 

4)En un estudio vemos que nos dan el siguiente intervalo de confianza del 95% de la media: (48.0, 52.0). Leemos que el tamaño de muestra ha sido 25. ¿Cuál es el intervalo de confianza del 95% descriptivo de la variable o, también denominado, intervalo de valores individuales de esa variable?

a.(40, 60)

b.(35, 65)

c.(30, 70)

d.(45, 55)

 

5)¿En cuál de las siguientes muestras el rango intercuartílico es 2?

a.(1, 1, 2, 4, 6, 8, 10, 11)

b.(1, 4, 5, 12)

c.(1, 2, 4, 8)

d.(1, 1, 3, 3, 5)

 

6)De las siguientes afirmaciones cuál es cierta:

a.En una Regresión es compatible una pendiente con p=0.33 con un IC de confianza del 95% de la correlación de (0.5, 0.9)

b.En una comparación de proporciones es compatible un p-valor de 0.24 con un intervalo de confianza del 95% de la diferencia de proporciones de (-0.13, 0.22).

c.En una V de Crámer si el valor es superior a 0.5 se trata de una relación estadísticamente significativa.

d.En una técnica de comparación de medias es compatible un p-valor de 0.004 con un intervalo de confianza del 95% de la diferencia de medias de (-1, 5)

 

7)Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.22 es cierto lo siguiente:

a.Si aumentamos el tamaño de muestra y disminuimos la desviación estándar el p-valor pasará a ser significativo.

b.Si aumentamos la desviación estándar y disminuimos la diferencia de medias el p-valor bajará.

c.Si disminuimos la diferencia de medias y disminuimos la desviación estándar el p-valor subirá.

d.Si aumentamos el tamaño de muestra y aumentamos la diferencia de medias el p-valor bajará.

 

8)Se quiere hacer un pronóstico del porcentaje de playas ante población de más de 10.000 habitantes en las que tenemos la presencia de una determinada especie de zooplancton. Se pretende tener un radio del intervalo del 1%, en un intervalo del 95%. Por la información previa que manejamos se piensa que el valor debe estar en torno al 10%. ¿Cuál es el tamaño de muestra recomendable en base a esta información:

a.6400.

b.3600.

c.1000.

d.8800.

 

9)Se estudia la sangre de 1000 ejemplares de una especie de pez tomados en una expedición y se compara la frecuencia en cuanto a tres variedades (A, B, C) y respecto a tres niveles cualitativos de peso (1, 2, 3). Realizamos un test de la ji-cuadrado obteniendo un valor de ji-cuadrado de 14.86.

a.El p-valor será 0.05.

b.El p-valor será 0.001.

c.El p-valor será 0.1.

d.El p-valor será 0.005.

 

10)Se ensayan dos tratamientos (A y B) a aguas residuales procedentes de una muestra de 50 depuradoras, con la finalidad de eliminar gran parte de un contaminante concreto. Cada muestra se homogeniza y se divide en dos y se aplica a cada una de ellas uno de los dos tratamientos. Se estudia la variable siguiente: Se ha superado o no el umbral de un contaminante tras el tratamiento. Para comparar si esta diferencia es estadísticamente significativa el test adecuado es:

a.El Test de proporciones.

b.El Test exacto de Fisher.

c.El Test de Mann-Whitney.

d.El Test de McNemar.

 

11).¿Cuál de estas cuatro informaciones es coherente?

a.Ji-cuadrado=12.01 de una tabla 8X2 y p-valor de 0.10

b.Ji-cuadrado=7.37 de una tabla 3X2 y p-valor de 0.005

c.Ji-cuadrado=20.51 de una tabla 6×2 y p-valor de 0.01

d.Ji-cuadrado=24.10 de una tabla 4X3 y p-valor de 0.005

 

12)En un estudio de distribución de la temperatura marina nos dan la siguiente información sobre la temperatura de una muestra de tamaño 100: 17.3 (13.5-17.8). ¿Cuál de las siguientes informaciones es coherente?

a.La media muestral es 17.3.

b.La desviación estándar es 4.5.

c.Si hiciéramos, en lugar de 100 medidas, 1000, unas 250 aproximadamente serían temperaturas por debajo de 17.3.

d.El 75% de las temperaturas en esta zona están por debajo de 17.8.

 

13)En un estudio de comparación de la salinidad marina de dos zonas tenemos la siguiente información:

Zona 1: Media muestral= 35.1; Desviación estándar=1;n=100

Zona 2: Media muestral= 35.6; Desviación estándar=1;n=100

Si queremos hacer una comparación de medias de ambos grupos, ¿cuál de las siguientes afirmaciones es cierta?

a.Habrá diferencias significativas porque las dos medias son distintas.

b.Habrá diferencias significativas porque los dos intervalos de confianza de la media no se solapan.

c.No habrá diferencias significativas porque los intervalos de confianza descriptivos de ambas muestras se solapan.

d.No habrá diferencias porque no tenemos información sobre la aplicación del test de la t de Student de varianzas iguales.

 

14)¿Cuál de las siguientes afirmaciones es cierta?

a.Un intervalo de confianza del 95% de la diferencia de proporciones de dos muestras de (0.12, 0.23) indica que no hay diferencia estadísticamente significativa entre las proporciones de ambas poblaciones.

b.Una correlación de Pearson de 0.9 con un intervalo de confianza del 95% que no contenga al uno es estadísticamente significativa.

c.Una V de Crámer de 0.9 con una ji-cuadrado con un p-valor de 0.15 implica que no hay relación significativa entre las variables cualitativas relacionadas.

d.Una R2 superior al 50% implica que la regresión lineal simple es estadísticamente significativa.

 

15)Tenemos la siguiente tabla de resultados en un estudio donde comparamos la cantidad de ejemplares de una especie de pez en cuatro zonas concretas del mediterráneo. En cada zona se toma una muestra de tamaño 5. Los resultados, en cuanto al número de ejemplares de esa especie de pez contadas en cada muestra y zona, son los siguientes:

Elige la respuesta correcta del resultado que obtendríamos con un ANOVA de un factor:

a.Factor Zona: p<0.05. Tres grupos homogéneos

b.Factor Zona: p<0.05. Cuatro grupos homogéneos

c.Factor Zona: p<0.05. Dos grupos homogéneos

d.Factor Zona: p>0.05. Una zona homogénea.

 

16)Tenemos la siguiente tabla de resultados en un estudio donde comparamos el porcentaje de una especie de zooplancton en tres zonas concretas del mediterráneo. También, en cada zona, se ha diferenciado entre muestras tomadas sobre la termoclina o por debajo de ella. Los resultados de porcentaje obtenidos son los siguientes:

En un ANOVA de dos factores, ¿cuáles son los resultados que obtendríamos?

a.Factor Zona: p<0.05. Factor Situación respecto a la termoclina: p>0.05. Interacción: p<0.05.

b.Factor Zona: p<0.05. Factor Situación respecto a la termoclina: p>0.05. Interacción: p>0.05.

c.Factor Zona: p<0.05. Factor Situación respecto a la termoclina: p<0.05. Interacción: p<0.05.

d.Factor Zona: p>0.05. Factor Situación respecto a la termoclina: p<0.05. Interacción: p>0.05.

 

17)Hemos recogido 50 muestras de un litro de agua en dos playas en las que queremos comparar la cantidad de un determinado contaminante. Después de obtener los resultados analíticos hemos aplicado primero el test de Fisher-Snedecor y proporciona un p-valor de 0.001. Luego hemos aplicado el test de Shapiro-Wilk aplicado y la primera muestra nos da un p-valor de 0.33 y la segunda un p-valor de 0.01. ¿Qué test de comparación hemos de utilizar?

a.El test de la t de Student de varianzas iguales

b.El test de Mann-Whitney

c.El test de la t de Student de varianzas diferentes

d.El test de la t de Student de datos apareados

 

18)Tenemos una muestra en la que medimos el porcentaje de la abundancia de una especie de fitoplancton en el conjunto de la biomasa. A partir de esa muestra obtenemos el intervalo de confianza del 95% de la media siguiente: (23.5, 28.5). Queremos realizar el contraste de hipótesis sobre la media de una población. Nuestra hipótesis nula es que la media poblacional el 25 y la hipótesis alternativa que la media poblacional es distinta de 25. ¿Cuál de los siguientes p-valores te parece podríamos haber obtenido?

a.0.001

b.0

c.0.43

d.1

 

19)En una Regresión lineal simple es cierto:

a.Si la pendiente tiene un intervalo de confianza del 95% de (0.23, 1.12) no es estadísticamente significativa por contener al 1.

b.Si la R2 es inferior al 5% tenemos una relación que no es estadísticamente significativa entre las variables de la regresión.

c.Si el intervalo de confianza del 95% de la diferencia de medias de dos poblaciones es (0.125, 0.199) podemos decir que hay una diferencia de medias estadísticamente significativa.

d.Una pendiente estadísticamente significativa no puede tener una R2 menor del 50%.

 

20)¿Qué afirmación entre las siguientes es cierta?

a.En una concordancia entre dos operadores si un operador tiene una kappa de 0.2 y el otro tiene una kappa de 0.8 es que concuerdan muy poco.

b.En una concordancia entre dos operadores si un operador tiene una kappa de 0.8 y el otro tiene una kappa de 0.8 es que concuerdan mucho.

c.En una concordancia de un operador consigo mismo si un operador tiene una kappa de 0.1 indica que este operador es muy coherente en sus respuestas.

d.En una concordancia de un operador consigo mismo si un operador tiene una kappa de 0.9 es que en la diagonal principal de la tabla de contingencias están la mayor parte de valores.