Se trata de una ANOVA de tres factores, dos fijos y un tercero aleatorio anidado en la interacción.
El modelo es:
Hay cuatro efectos y, por lo tanto, cuatro contrastes de hipótesis. Los estadísticos de test se pueden deducir fácilmente de estas esperanzas de los cuadrados medios.
1c. Tenemos simetría pero no ajuste a la normal porque la curtosis supera ampliamente el umbral. No podemos afirmar, pues, ni a, ni b, ni d. Sin embargo, c sí, puesto que requiere únicamente simetría.
2b. Para los tres valores de los estadísticos de test (25.19, 3.86 y 0.43) el valor de 4.75 es el único que es coherente con los p-valores. El 25.19 supera en mucho el umbral puesto que el p-valor es muy pequeño, el 3.86 no lo supera pero está cerca, por eso el p-valor es mayor que 0.05 pero muy cercano a él y el 0.43 está muy lejos de superar el umbral, por eso el p-valor es muy superior a 0.05.
3.b. Es claro que el grupo 1 y el 2 los intervalos se solapan, el 2 y el 3 también, pero el 1 y el 3 no se solapan.
4c. La ordenada en el origen tiene un valor estimado de 4.01 y un error estándar de 1. Si contruimos un IC del 95% debemos sumar y restar a 4.01 dos veces ese error estándar.
5b. La respuesta a no es cierta porque la información que tenemos no nos habla sobre la significación de la pendiente. Si nos fijamos en el IC descriptivo podemos observar que la desviación estándar para un individuo con valor x=5 es aproximadamente 3.88 (10.57-6.99). Como este IC se ha hecho con con desviaciones estándares, si cogemos una desviación estándar será 1.94, que si le sumamos y restamos este valor a 6.69 nos da la respuesta b.
7b. Es una variable continua, son muestras independientes, hay normalidad porque los p-valores de ambas muestras son superiores a 0.05. Hay igualdad de varianzas. Debe aplicarse el test de la t de Student de varianzas iguales.
8c. Al estar comparando dos medias si la diferencia de medias muestral es 0.5 y el error estándar es 0.4, un IC del 95% de la diferencia de medias poblacional será (-0.3, 1.3) porque consiste en sumar y restar dos veces el error estándar a la diferencia de medias obtenida. Por lo que el p-valor será superior a 0.05 puesto que el IC contiene al 0.
9c. Si ordenamos la muestra tenemos (1, 3, 4, 5, 6, 8, 9, 10, 16), como son nueve valores el primer cuartil es 4 y el tercero es 9. El rango intercuartílico es 5.
10a. Estamos ante un contraste de hipótesis que el criterio de rechazo es estar fuera del intervalo (-1.96, 1.96). El valor obtenido del estadístico es 3. Se rechaza la hipótesis nula, por lo tanto. La d, pues, claramente descartada. La b da un p-valor muy próximo a 0.05, el valor del estadístico en este caso debería estar fuera del intervalo pero muy próximo a -1.96 ó a 1.96; por ejemplo, -2.01. La c da un p-valor muy pequeño, debe estar mucho más alejado; por ejemplo, -17. La respuesta a es una respuesta más coherente. Si se observa la tabla de la t de Student se puede deducir este p-valor aproximadamente:
Si se observa la última fila de la tabla se observa que a la derecha de 3.09 el área es 0.001, a la izquierda, pues, de -3.09 también habrá un área de 0.001. Estamos hablando de que el estadístico de test ha dado -3, luego el p-valor es el área que hay a la izquierda de -3 y a la derecha de 3, sumadas. El p-valor exacto calculado con un ordenador es 0.0028. P
11b. La suma de los valores propios debe ser 5, los porcentajes deben sumar 100 y las componentes deben tener un orden de progresiva pérdida de varianza explicada.
12ac. Hay, por error, dos respuestas de 0.5. Si el IC es del 95, el error estándar debe ser la mitad del radio del intervalo. El radio es 1 (4.5-3.5).
13b. Si calculamos el IC 95% con la fórmula:
Tomaremos p=0.5 porque no tenemos información previa. Y r=0.01.
14c. Es la única opción donde la concordancia es muy elevada.
15a. El error estándar es 0.05. La desviación estándar será, pues, 1.
16d. La amplitud de un intervalo de confianza de la diferencia de dos medias poblacionaes depende sólo del error estándar y éste depende de la relación entre desviación estándar y tamaño de muestra. En el apartado d no ha cambiado ni la desviación estándar ni el tamaño de muestra, por lo tanto, la amplitud (su diámetro) del intervalo no cambiará.
La c no es correcta en general porque es verdad que si el tamaño de muestra es menor y encima la desviación es mayor el intervalo se ampliará, pero esto no implica necesariamente que se amplíe tanto como para que acabe incluyendo al 0 un IC que era de (0.23, 1.14).
17d. Si la desviación estándar baja la potencia aumentará.
18b. Si vamos a la tabla de la chi-cuadrado y miramos la fila de valor 9 (=(4-1)x(4-1)), veremos que la derecha de 4,1682 hay un área de 0.90:
19c. Ya sabemos que lo que le pase a la correlación le pasa a la pendiente. Este caso es muy sutil, pero observemos que en la correlación el IC del 95% es (-0.43, 0.02), con muchísimo peso en la parte negativa y el de la pendiente es (-0.04, 5.13) con muchísimo peso ahora en la parte positiva. Esto tampoco sucede en la realidad. Correlación y pendiente tienen destinos comunes y aquí hay una incoherencia.
20b. La curva de Lorenz y el coeficiente de Gini miden la diversidad del reparto de un total. En la muestra b se puede observar que la zona que tiene más temperatura es casi el doble de la temperatura de la zona más fría. Esto no sucede en las otras muestras. El coeficiente de Gini es el mayor, porque es donde hay más desigualdad en el reparto del total.
Si se observan las Odds ratio de la Regresión logística y entendiendo que hemos codificado con un 1 los ejemplares viables y con un 0 los ejemplares no viables, debemos concluir lo siguiente:
La humedad tiene una OR significativa (no contiene el 1 el intervalo de confianza del 95%). Al ser mayor que 1 significa que al aumentar la humedad aumenta la probabilidad de que se dé viabilidad.
La inclinación del terreno tiene una OR significativa (no contiene el 1 el intervalo de confianza del 95%). Al ser menor que 1 significa que al aumentar la humedad disminuye la probabilidad de que se dé viabilidad.
La temperatura tiene, también, una OR significativa (no contiene el 1 el intervalo de confianza del 95%). Al ser menor que 1 significa que al aumentar la humedad disminuye la probabilidad de que se dé viabilidad.
La densidad del sotobosque no tiene una relación significativa con la viabilidad. El IC del 95% del a OR contiene al 1.
3.
La primera componente tiene un enorme peso (79,1%). Los valores absolutos de los coeficientes altos son los de las variables Crecimiento, Humedad, Inclinación y Temperatura. Sin embargo, en la primer componente no pesa la variable Densidad del sotobosque. Tengamos en cuenta que el crecimiento tiene una relación obvia con la viabilidad. Los ejemplares viables deben tener un crecimiento medio alto y las no viables un crecimiento medio bajo. Los signos de los coeficientes (positivos Crecimiento y Humedad y negativos Inclinación y Temperatura) están en perfecta correspondencia con el hecho visto en la Regresión logística: Humedad alta aumenta la viabilidad e Inclinación y Temperatura alta la disminuye. La Densidad del sotobosque no tiene relación con la viabilidad en la Regresión logística y tampoco pesa en esa primera componente.
Luego, es la primera componente la que realmente nos informa bien sobre la viabilidad. Y los puntos que estarán más a la izquierda del gráfico, los que tienen un valor más bajo de esa primera componente son los que deben ser los ejemplares no viables.
1.Comprobar si hay diferencias estadísticamente significativas entre las dos siguientes curvas de supervivencia en las que se ha analizado los tiempos de muerte de dos especies de árboles reimplantados en una zona previamente quemada, en un seguimiento hasta 24 meses. Los 24c indica que al final del estudio estaban en situación de viabilidad:
2.Construir la curva de supervivencia de los siguientes valores de tiempo hasta muerte de unos ejemplares de peces que se han llevado a un ambiente simulado natural de un zoológico. El seguimiento se ha realizado hasta 12 meses. Los 12c indica que al final del estudio el ejemplar estaba vivo:
3.En un estudio de reforestación se ha estudiado la relación entre la concentración de minerales en el suelo y la viabilidad o no del ejemplar a un año (viabilidad=0; no viabilidad=1) y se tiene una OR=0.62; IC95%=(0.44, 0.87). Simular unos datos que puedan dar estos resultados, justificando la elección. No hace falta comprobar si es así, sólo ver las tendencias de los valores y explicar los valores elegidos.
4.En otro estudio similar al caso anterior efectuado por otro equipo de investigación en otra zona dan el siguiente resultado: HR=1.45 IC95%=(0.44, 0.87). Simular unos datos que puedan dar estos resultados, justificando la elección. No hace falta comprobar si es así, sólo ver las tendencias de los valores y explicar los valores elegidos.
5.En un estudio de muestras marinas tomadas en distintos puntos del mar mediterráneo, se han evaluado la abundancia (la densidad) de seis especies marinas en un análisis de componentes princiaples. La primera componente es Y1=0.43X1+0.46X2+0.41X3+0.39X4+0.44X5+0.47X6. La segunda es Y2=0.56X1-0.44X2-0.43X3-0.02X4+0.51X5+0.01X6. Las dos componentes juntas explican el 82% de la variabilidad. ¿Cómo interpretas biológicamente esta realidad? Explica qué distribución de estas seis especies tendríamos en los cuatro cuadrantes del gráfico de las dos componentes.
Tenemos una base de datos de pacientes con Endocarditis.
Las variables son las siguientes:
P=Paciente.
S=Sexo.
E=Edad.
Ch=Índice Charlson.
Et=Etiología bacteriana de la Endocarditis (AUREUS=Staphylococcus aureus; VIRIDANS=Miembros del grupo VIRIDANS; GNB=Bacilos Gram negativos; CoNS=Staphylococcus coagulasa negativos; ENTEROCOCCUS:Diferentes especies de este género).
C=Se le ha practicado cirugía reparativa de la válvula cardíaca afectada (0=No operado; 1=Sí operado).
M=Muere a causa del episodio antes de un año (0=No muere; 1=Muere).
P
S
E
Ch
Et
C
M
1
m
52
2
ENTEROCOCCUS
1
0
2
h
59
2
AUREUS
0
1
3
h
70
3
VIRIDANS
0
0
4
m
47
0
ENTEROCOCCUS
1
1
5
m
38
2
VIRIDANS
0
0
6
m
29
0
VIRIDANS
1
0
7
m
47
0
GNB
0
1
8
h
50
1
GNB
1
0
9
h
53
1
AUREUS
0
1
10
h
63
2
CoNS
1
0
11
h
70
3
GNB
1
0
12
m
74
5
ENTEROCOCCUS
0
0
13
h
57
3
AUREUS
0
1
14
h
49
0
AUREUS
1
1
15
m
60
2
CoNS
1
0
16
h
65
4
ENTEROCOCCUS
1
0
17
h
52
2
ENTEROCOCCUS
0
0
18
h
47
0
ENTEROCOCCUS
1
1
19
m
48
0
VIRIDANS
0
0
20
m
31
0
VIRIDANS
1
0
21
m
45
0
VIRIDANS
0
0
22
h
48
0
ENTEROCOCCUS
1
0
23
h
78
3
AUREUS
0
1
24
h
58
4
AUREUS
0
1
25
h
50
1
VIRIDANS
0
0
26
m
54
4
CoNS
1
1
27
h
67
3
ENTEROCOCCUS
0
0
28
h
44
0
VIRIDANS
1
0
29
m
27
0
VIRIDANS
0
0
30
h
55
4
VIRIDANS
0
0
31
h
51
1
AUREUS
1
0
32
m
44
0
AUREUS
0
1
33
h
61
3
AUREUS
1
1
34
h
55
2
AUREUS
0
1
35
m
54
1
VIRIDANS
1
0
36
m
56
2
CoNS
0
0
37
m
61
2
AUREUS
0
0
38
m
75
6
AUREUS
0
0
39
h
54
1
VIRIDANS
1
0
40
h
40
0
ENTEROCOCCUS
1
0
41
h
65
4
AUREUS
1
0
42
h
78
7
ENTEROCOCCUS
1
0
43
m
48
3
AUREUS
0
1
44
h
60
2
AUREUS
1
0
45
h
56
1
VIRIDANS
1
0
46
m
47
0
GNB
1
0
47
h
72
4
ENTEROCOCCUS
0
1
48
h
47
0
VIRIDANS
1
0
49
h
46
1
VIRIDANS
1
0
50
m
73
3
VIRIDANS
0
0
51
m
41
0
VIRIDANS
1
0
52
m
47
0
VIRIDANS
0
0
53
h
68
3
AUREUS
1
0
54
h
52
1
AUREUS
0
1
55
h
58
2
AUREUS
0
1
56
h
29
0
VIRIDANS
1
0
57
m
66
4
AUREUS
1
1
58
h
32
0
VIRIDANS
0
0
59
h
57
1
AUREUS
0
1
60
m
52
3
AUREUS
1
0
61
h
82
5
AUREUS
0
1
62
h
77
4
ENTEROCOCCUS
1
0
63
m
48
1
AUREUS
1
0
64
h
40
3
AUREUS
1
1
65
h
47
0
ENTEROCOCCUS
1
0
66
m
54
4
VIRIDANS
0
1
67
h
58
4
VIRIDANS
0
1
68
h
51
1
VIRIDANS
1
0
69
m
83
6
VIRIDANS
0
0
70
m
54
4
VIRIDANS
0
0
71
m
81
10
GNB
0
1
72
m
51
4
VIRIDANS
0
0
73
h
67
5
GNB
1
0
74
h
58
3
ENTEROCOCCUS
0
0
75
h
36
0
AUREUS
0
0
76
h
70
3
AUREUS
0
1
77
m
45
0
AUREUS
1
0
78
h
58
3
AUREUS
0
1
79
h
39
0
ENTEROCOCCUS
0
0
80
m
33
2
AUREUS
1
0
81
h
61
4
ENTEROCOCCUS
1
0
82
h
21
0
VIRIDANS
1
0
83
h
43
0
ENTEROCOCCUS
0
0
84
m
46
0
AUREUS
0
0
85
m
38
0
VIRIDANS
1
0
86
m
65
2
ENTEROCOCCUS
0
0
87
h
70
4
VIRIDANS
1
1
88
m
74
5
CoNS
1
0
89
h
45
0
AUREUS
1
1
90
h
66
2
ENTEROCOCCUS
0
0
91
m
46
0
AUREUS
0
0
92
h
65
4
ENTEROCOCCUS
0
1
93
h
22
0
AUREUS
0
1
94
m
65
5
ENTEROCOCCUS
1
0
95
h
48
0
AUREUS
1
1
96
h
53
4
VIRIDANS
0
1
97
m
70
6
CoNS
0
1
98
h
25
0
VIRIDANS
0
0
99
h
47
0
VIRIDANS
0
1
100
m
34
0
ENTEROCOCCUS
1
1
101
m
26
0
VIRIDANS
0
0
102
h
50
1
ENTEROCOCCUS
0
1
103
h
77
3
AUREUS
0
0
104
m
33
0
AUREUS
0
1
105
h
80
7
ENTEROCOCCUS
0
1
106
h
80
6
AUREUS
1
1
107
m
70
6
CoNS
0
0
108
h
32
0
VIRIDANS
1
0
109
h
41
2
VIRIDANS
1
1
110
m
58
1
AUREUS
1
1
111
h
21
0
AUREUS
1
0
112
m
49
2
AUREUS
0
1
113
h
52
4
AUREUS
0
1
114
h
44
2
AUREUS
0
0
115
m
49
2
AUREUS
0
1
116
h
34
2
AUREUS
0
1
117
h
70
5
AUREUS
0
0
118
m
48
3
AUREUS
0
0
119
h
55
3
ENTEROCOCCUS
0
0
120
h
51
1
CoNS
1
0
121
m
31
0
AUREUS
0
1
122
h
22
0
AUREUS
1
0
123
h
51
1
AUREUS
1
1
124
m
27
0
VIRIDANS
1
0
125
h
48
0
VIRIDANS
1
0
126
h
52
1
ENTEROCOCCUS
1
1
127
m
47
0
AUREUS
1
1
128
h
24
2
CoNS
1
0
129
h
66
5
AUREUS
1
1
130
m
49
1
ENTEROCOCCUS
0
1
131
h
47
2
VIRIDANS
0
0
132
h
80
9
CoNS
0
1
133
m
43
1
CoNS
1
0
134
h
23
0
AUREUS
0
0
135
h
47
0
AUREUS
0
1
136
m
52
1
ENTEROCOCCUS
0
1
137
h
51
3
CoNS
1
1
138
h
82
7
CoNS
1
1
139
m
50
1
CoNS
1
0
140
h
49
2
CoNS
1
0
141
h
63
2
AUREUS
1
1
142
m
25
0
AUREUS
1
0
143
h
86
4
AUREUS
0
1
144
h
60
4
AUREUS
0
1
145
m
49
3
VIRIDANS
1
1
146
m
29
0
CoNS
1
1
147
m
67
2
GNB
0
1
148
h
46
0
AUREUS
0
0
149
h
80
6
AUREUS
0
1
150
m
80
9
VIRIDANS
0
0
151
h
71
5
GNB
1
0
152
m
27
0
AUREUS
1
0
153
h
36
0
GNB
1
0
154
h
26
0
AUREUS
1
0
155
m
79
3
CoNS
0
0
156
h
54
1
AUREUS
0
0
157
h
37
2
ENTEROCOCCUS
1
0
158
m
47
0
VIRIDANS
0
0
159
h
27
0
AUREUS
0
0
160
h
54
1
ENTEROCOCCUS
0
0
161
m
50
1
ENTEROCOCCUS
0
0
162
h
46
0
AUREUS
1
1
163
h
47
0
AUREUS
0
1
164
m
65
2
AUREUS
1
1
165
h
39
2
AUREUS
0
0
166
h
49
0
AUREUS
0
1
167
m
74
3
CoNS
1
0
168
h
48
2
AUREUS
1
0
169
h
52
4
GNB
0
1
170
m
29
0
AUREUS
0
0
171
h
41
0
VIRIDANS
1
0
172
h
77
6
ENTEROCOCCUS
0
0
173
m
60
2
ENTEROCOCCUS
0
1
174
h
29
0
AUREUS
0
0
175
h
36
0
AUREUS
0
1
176
m
44
0
AUREUS
0
0
177
h
43
0
VIRIDANS
0
1
178
m
29
0
VIRIDANS
1
0
179
h
24
0
VIRIDANS
0
0
180
h
82
8
CoNS
0
0
181
m
29
0
VIRIDANS
1
0
182
h
76
4
CoNS
0
1
183
m
40
2
AUREUS
0
1
184
h
59
3
GNB
0
1
185
h
77
3
VIRIDANS
0
0
186
m
51
3
AUREUS
0
1
187
h
37
0
CoNS
0
0
188
h
39
2
VIRIDANS
0
0
189
m
81
7
AUREUS
0
1
190
h
28
2
ENTEROCOCCUS
0
1
191
h
55
3
CoNS
0
0
192
h
81
6
AUREUS
0
1
193
h
66
3
AUREUS
0
1
194
h
80
4
ENTEROCOCCUS
0
1
195
m
41
0
ENTEROCOCCUS
0
0
196
h
44
2
AUREUS
0
1
197
h
79
7
VIRIDANS
0
0
198
m
49
2
AUREUS
1
0
199
h
46
0
AUREUS
0
1
200
h
52
1
VIRIDANS
0
0
Preguntas:
1.Hacer una descriptiva con media y desviación estándar o mediana y rango intercuartílico de las variables Edad y Charlson. Justificar la elección.
2.Ver si hay relación entre el grupo etiológico de la infección y la mortalidad.
3.Ver si hay diferencias estadísticamente significativas en el valor del Charlson entre los que mueren en el episodio y los que no mueren.
4. Ver si hay diferencias estadísticamente significativas en la edad de los infectados entre los hombres y las mujeres.
5.¿Es la infección producida por S. aureus, respecto a las demás etiologías, un factor de riesgo o de protección de mortalidad?
6,¿Es la infección producida por miembros del grupo VIRIDANS, respecto a las demás etiologías, un factor de riesgo o de protección de mortalidad?
7.¿Es la cirugía un factor protector de mortalidad?
8.¿Es ser mujer un factor de riesgo o de protección de mortalidad?
9.Ver si hay correlación entre la Edad y el Charlson. Si es así construir un modelo para predecir el índice Charlson en función de la Edad. ¿Tiene buena capacidad predictiva?
10.¿Es ser mujer un factor de riesgo o de protección para sufrir una infección cardíaca por S. aureus?