Archivo de la categoría: Uncategorized

Solución Situación 183

1.

Se trata de una ANOVA de tres factores, dos fijos y un tercero aleatorio anidado en la interacción.

El modelo es:

Hay cuatro efectos y, por lo tanto, cuatro contrastes de hipótesis. Los estadísticos de test se pueden deducir fácilmente de estas esperanzas de los cuadrados medios.

2.

3.

4.

Un ejemplo posible:

Solución Situación 182

1c. Tenemos simetría pero no ajuste a la normal porque la curtosis supera ampliamente el umbral. No podemos afirmar, pues, ni a, ni b, ni d. Sin embargo, c sí, puesto que requiere únicamente simetría.

2b. Para los tres valores de los estadísticos de test (25.19, 3.86 y 0.43) el valor de 4.75 es el único que es coherente con los p-valores. El 25.19 supera en mucho el umbral puesto que el p-valor es muy pequeño, el 3.86 no lo supera pero está cerca, por eso el p-valor es mayor que 0.05 pero muy cercano a él y el 0.43 está muy lejos de superar el umbral, por eso el p-valor es muy superior a 0.05.

3.b. Es claro que el grupo 1 y el 2 los intervalos se solapan, el 2 y el 3 también, pero el 1 y el 3 no se solapan.

4c. La ordenada en el origen tiene un valor estimado de 4.01 y un error estándar de 1. Si contruimos un IC del 95% debemos sumar y restar a 4.01 dos veces ese error estándar.

5b. La respuesta a no es cierta porque la información que tenemos no nos habla sobre la significación de la pendiente. Si nos fijamos en el IC descriptivo podemos observar que la desviación estándar para un individuo con valor x=5 es aproximadamente 3.88 (10.57-6.99). Como este IC se ha hecho con con desviaciones estándares, si cogemos una desviación estándar será 1.94, que si le sumamos y restamos este valor a 6.69 nos da la respuesta b.

6b. EXP(1.01)=2.74; EXP(0.07)=1.07; EXP(1.95)=7.02

7b. Es una variable continua, son muestras independientes, hay normalidad porque los p-valores de ambas muestras son superiores a 0.05. Hay igualdad de varianzas. Debe aplicarse el test de la t de Student de varianzas iguales.

8c. Al estar comparando dos medias si la diferencia de medias muestral es 0.5 y el error estándar es 0.4, un IC del 95% de la diferencia de medias poblacional será (-0.3, 1.3) porque consiste en sumar y restar dos veces el error estándar a la diferencia de medias obtenida. Por lo que el p-valor será superior a 0.05 puesto que el IC contiene al 0.

9c. Si ordenamos la muestra tenemos (1, 3, 4, 5, 6, 8, 9, 10, 16), como son nueve valores el primer cuartil es 4 y el tercero es 9. El rango intercuartílico es 5.

10a. Estamos ante un contraste de hipótesis que el criterio de rechazo es estar fuera del intervalo (-1.96, 1.96). El valor obtenido del estadístico es 3. Se rechaza la hipótesis nula, por lo tanto. La d, pues, claramente descartada. La b da un p-valor muy próximo a 0.05, el valor del estadístico en este caso debería estar fuera del intervalo pero muy próximo a -1.96 ó a 1.96; por ejemplo, -2.01. La c da un p-valor muy pequeño, debe estar mucho más alejado; por ejemplo, -17. La respuesta a es una respuesta más coherente. Si se observa la tabla de la t de Student se puede deducir este p-valor aproximadamente:

Si se observa la última fila de la tabla se observa que a la derecha de 3.09 el área es 0.001, a la izquierda, pues, de -3.09 también habrá un área de 0.001. Estamos hablando de que el estadístico de test ha dado -3, luego el p-valor es el área que hay a la izquierda de -3 y a la derecha de 3, sumadas. El p-valor exacto calculado con un ordenador es 0.0028. P

11b. La suma de los valores propios debe ser 5, los porcentajes deben sumar 100 y las componentes deben tener un orden de progresiva pérdida de varianza explicada.

12ac. Hay, por error, dos respuestas de 0.5. Si el IC es del 95, el error estándar debe ser la mitad del radio del intervalo. El radio es 1 (4.5-3.5).

13b. Si calculamos el IC 95% con la fórmula:

Tomaremos p=0.5 porque no tenemos información previa. Y r=0.01.

14c. Es la única opción donde la concordancia es muy elevada.

15a. El error estándar es 0.05. La desviación estándar será, pues, 1.

16d. La amplitud de un intervalo de confianza de la diferencia de dos medias poblacionaes depende sólo del error estándar y éste depende de la relación entre desviación estándar y tamaño de muestra. En el apartado d no ha cambiado ni la desviación estándar ni el tamaño de muestra, por lo tanto, la amplitud (su diámetro) del intervalo no cambiará.

La c no es correcta en general porque es verdad que si el tamaño de muestra es menor y encima la desviación es mayor el intervalo se ampliará, pero esto no implica necesariamente que se amplíe tanto como para que acabe incluyendo al 0 un IC que era de (0.23, 1.14).

17d. Si la desviación estándar baja la potencia aumentará.

18b. Si vamos a la tabla de la chi-cuadrado y miramos la fila de valor 9 (=(4-1)x(4-1)), veremos que la derecha de 4,1682 hay un área de 0.90:

19c. Ya sabemos que lo que le pase a la correlación le pasa a la pendiente. Este caso es muy sutil, pero observemos que en la correlación el IC del 95% es (-0.43, 0.02), con muchísimo peso en la parte negativa y el de la pendiente es (-0.04, 5.13) con muchísimo peso ahora en la parte positiva. Esto tampoco sucede en la realidad. Correlación y pendiente tienen destinos comunes y aquí hay una incoherencia.

20b. La curva de Lorenz y el coeficiente de Gini miden la diversidad del reparto de un total. En la muestra b se puede observar que la zona que tiene más temperatura es casi el doble de la temperatura de la zona más fría. Esto no sucede en las otras muestras. El coeficiente de Gini es el mayor, porque es donde hay más desigualdad en el reparto del total.

Solución Situación 181

1,

img_6506

2.

Si se observan las Odds ratio de la Regresión logística y entendiendo que hemos codificado con un 1 los ejemplares viables y con un 0 los ejemplares no viables, debemos concluir lo siguiente:

La humedad tiene una OR significativa (no contiene el 1 el intervalo de confianza del 95%). Al ser mayor que 1 significa que al aumentar la humedad aumenta la probabilidad de que se dé viabilidad.

La inclinación del terreno tiene una OR significativa (no contiene el 1 el intervalo de confianza del 95%). Al ser menor que 1 significa que al aumentar la humedad disminuye la probabilidad de que se dé viabilidad.

La temperatura tiene, también, una OR significativa (no contiene el 1 el intervalo de confianza del 95%). Al ser menor que 1 significa que al aumentar la humedad disminuye la probabilidad de que se dé viabilidad.

La densidad del sotobosque no tiene una relación significativa con la viabilidad. El IC del 95% del a OR contiene al 1.

3.

La primera componente tiene un enorme peso (79,1%). Los valores absolutos de los coeficientes altos son los de las variables Crecimiento, Humedad, Inclinación y Temperatura. Sin embargo, en la primer componente no pesa la variable Densidad del sotobosque. Tengamos en cuenta que el crecimiento tiene una relación obvia con la viabilidad. Los ejemplares viables deben tener un crecimiento medio alto y las no viables un crecimiento medio bajo. Los signos de los coeficientes (positivos Crecimiento y Humedad y negativos Inclinación y Temperatura) están en perfecta correspondencia con el hecho visto en la Regresión logística: Humedad alta aumenta la viabilidad e Inclinación y Temperatura alta la disminuye. La Densidad del sotobosque no tiene relación con la viabilidad en la Regresión logística y tampoco pesa en esa primera componente.

Luego, es la primera componente la que realmente nos informa bien sobre la viabilidad. Y los puntos que estarán más a la izquierda del gráfico, los que tienen un valor más bajo de esa primera componente son los que deben ser los ejemplares no viables.

Situación 179: Examen práctico (Oceanografía)

Tenemos la siguiente base de datos donde se comparan dos zonas marinas distintas:

Zona: 1 y 2.

Esp A: Presencia (1) o ausencia (0) de la Especie A.

Esp B: Presencia (1) o ausencia (0) de la Especie B.

T: Temperatura.

E: Eutrofia.

D: Diversidad biológica.

Zona Esp A Esp B T E D
1 1 1 16,2 32,6 1,91
1 1 1 15,6 32,1 1,97
1 1 0 14,0 31,8 2,25
1 1 0 15,3 30,5 2,68
1 0 1 15,5 33,2 1,74
1 0 1 15,8 31,8 1,87
1 1 1 15,8 33,7 1,77
1 1 0 15,2 32,4 1,98
1 0 1 16,3 36,3 1,54
1 1 0 17,1 33,1 2,36
1 1 0 14,7 30,0 2,86
1 0 1 15,6 34,2 1,74
1 0 1 16,3 32,8 1,60
1 0 0 16,3 36,1 1,66
1 0 1 16,3 36,3 1,12
1 1 0 14,2 29,1 2,21
1 0 1 16,2 35,5 1,44
1 1 1 16,0 32,4 1,99
1 0 1 16,3 35,9 1,65
1 1 1 15,5 32,7 1,90
1 0 0 15,6 34,9 1,09
1 1 1 15,2 33,6 2,17
1 0 1 15,5 34,4 1,16
1 1 0 15,1 31,8 2,50
1 0 1 17,1 35,1 1,17
2 0 1 16,3 34,9 1,33
2 0 0 15,0 31,1 1,91
2 1 1 16,5 34,2 2,03
2 1 1 17,1 36,8 1,57
2 1 1 17,1 36,8 1,43
2 0 1 18,1 39,1 0,82
2 0 1 16,6 35,0 1,48
2 1 0 19,1 34,0 2,06
2 0 1 18,4 39,0 0,45
2 0 0 16,8 33,2 2,30
2 1 1 17,0 36,8 1,02
2 1 1 16,4 35,5 1,14
2 0 1 18,5 39,1 0,88
2 1 0 16,3 35,6 1,22
2 0 1 17,7 38,7 0,84
2 0 0 17,0 34,5 1,83
2 1 1 17,3 37,1 1,05
2 0 1 16,1 34,8 2,02
2 1 1 16,9 37,5 1,05
2 0 1 17,7 38,9 0,71
2 0 1 17,6 36,9 0,99
2 1 0 16,6 34,0 1,35
2 0 1 15,8 35,4 1,24
2 0 1 16,1 35,2 1,44
2 1 1 16,1 34,9 1,59

Preguntas:

1.Resumir con media y desviación estándar o mediana y rango intercuartílico las variables Temperatura y Eutrofia, diferenciando por zona.

2.Estudiar la relación entre la Eutrofia y la Diversidad biológica.

3.Estudiar la relación entre que la Diversidad biológica tenga un valor inferior o no a 2 y la presencia o no de la especie B.

4.Calcular una predicción de la probabilidad de encontrar la especie B con un nivel de eutrofia de 35.

5.Calcular la predicción de la probabilidad de encontrar la especie B con un nivel de diversidad de 2.

6.Hacer una predicción con un intervalo del 90% de la media de Eutrofia en todos los puntos donde la temperatura sea de 17 grados.

7.Estudiar si hay diferencias significativas en cuanto a la presencia simultánea de la Especie A y la Especie B entre las dos zonas.

8.Estudiar si hay diferencias significativas en la Diversidad entre las dos zonas.

9.Estudiar si hay diferencias significativas en la Temperatura entre las dos zonas.

10.Calcular la probabilidad de encontrar una diversidad por encima de 1.99 cuando en un punto encontramos una temperatura de 18 grados.

Situación 180: Examen (Temas 11, 17, 21 y 22)

1.Comprobar si hay diferencias estadísticamente significativas entre las dos siguientes curvas de supervivencia en las que se ha analizado los tiempos de muerte de dos especies de árboles reimplantados en una zona previamente quemada, en un seguimiento hasta 24 meses. Los 24c indica que al final del estudio estaban en situación de viabilidad:

Especie A: (1, 1, 2, 4, 4, 12, 14, 24c, 24c, 24c)

Especie B: (7, 7, 7, 10, 12, 18, 21, 22, 24c, 24c)

2.Construir la curva de supervivencia de los siguientes valores de tiempo hasta muerte de unos ejemplares de peces que se han llevado a un ambiente simulado natural de un zoológico. El seguimiento se ha realizado hasta 12 meses. Los 12c indica que al final del estudio el ejemplar estaba vivo:

(1, 1, 2, 2, 2, 3, 3, 4, 5, 7, 8, 12c, 12c, 12c, 12c, 12c, 12c, 12c, 12c, 12c)

3.En un estudio de reforestación se ha estudiado la relación entre la concentración de minerales en el suelo y la viabilidad o no del ejemplar a un año (viabilidad=0; no viabilidad=1) y se tiene una OR=0.62; IC95%=(0.44, 0.87). Simular unos datos que puedan dar estos resultados, justificando la elección. No hace falta comprobar si es así, sólo ver las tendencias de los valores y explicar los valores elegidos.

4.En otro estudio similar al caso anterior efectuado por otro equipo de investigación en otra zona dan el siguiente resultado: HR=1.45 IC95%=(0.44, 0.87). Simular unos datos que puedan dar estos resultados, justificando la elección. No hace falta comprobar si es así, sólo ver las tendencias de los valores y explicar los valores elegidos.

5.En un estudio de muestras marinas tomadas en distintos puntos del mar mediterráneo, se han evaluado la abundancia (la densidad) de seis especies marinas en un análisis de componentes princiaples. La primera componente es Y1=0.43X1+0.46X2+0.41X3+0.39X4+0.44X5+0.47X6. La segunda es Y2=0.56X1-0.44X2-0.43X3-0.02X4+0.51X5+0.01X6. Las dos componentes juntas explican el 82% de la variabilidad. ¿Cómo interpretas biológicamente esta realidad? Explica qué distribución de estas seis especies tendríamos en los cuatro cuadrantes del gráfico de las dos componentes.

Situación 179: Prácticas de BIOMEDICINA

Tenemos una base de datos de pacientes con Endocarditis.

Las variables son las siguientes:

P=Paciente.

S=Sexo.

E=Edad.

Ch=Índice Charlson.

Et=Etiología bacteriana de la Endocarditis (AUREUS=Staphylococcus aureus; VIRIDANS=Miembros del grupo VIRIDANS; GNB=Bacilos Gram negativos; CoNS=Staphylococcus coagulasa negativos; ENTEROCOCCUS:Diferentes especies de este género).

C=Se le ha practicado cirugía reparativa de la válvula cardíaca afectada (0=No operado; 1=Sí operado).

M=Muere a causa del episodio antes de un año (0=No muere; 1=Muere).

PSEChEtCM
1m522ENTEROCOCCUS10
2h592AUREUS01
3h703VIRIDANS00
4m470ENTEROCOCCUS11
5m382VIRIDANS00
6m290VIRIDANS10
7m470GNB01
8h501GNB10
9h531AUREUS01
10h632CoNS10
11h703GNB10
12m745ENTEROCOCCUS00
13h573AUREUS01
14h490AUREUS11
15m602CoNS10
16h654ENTEROCOCCUS10
17h522ENTEROCOCCUS00
18h470ENTEROCOCCUS11
19m480VIRIDANS00
20m310VIRIDANS10
21m450VIRIDANS00
22h480ENTEROCOCCUS10
23h783AUREUS01
24h584AUREUS01
25h501VIRIDANS00
26m544CoNS11
27h673ENTEROCOCCUS00
28h440VIRIDANS10
29m270VIRIDANS00
30h554VIRIDANS00
31h511AUREUS10
32m440AUREUS01
33h613AUREUS11
34h552AUREUS01
35m541VIRIDANS10
36m562CoNS00
37m612AUREUS00
38m756AUREUS00
39h541VIRIDANS10
40h400ENTEROCOCCUS10
41h654AUREUS10
42h787ENTEROCOCCUS10
43m483AUREUS01
44h602AUREUS10
45h561VIRIDANS10
46m470GNB10
47h724ENTEROCOCCUS01
48h470VIRIDANS10
49h461VIRIDANS10
50m733VIRIDANS00
51m410VIRIDANS10
52m470VIRIDANS00
53h683AUREUS10
54h521AUREUS01
55h582AUREUS01
56h290VIRIDANS10
57m664AUREUS11
58h320VIRIDANS00
59h571AUREUS01
60m523AUREUS10
61h825AUREUS01
62h774ENTEROCOCCUS10
63m481AUREUS10
64h403AUREUS11
65h470ENTEROCOCCUS10
66m544VIRIDANS01
67h584VIRIDANS01
68h511VIRIDANS10
69m836VIRIDANS00
70m544VIRIDANS00
71m8110GNB01
72m514VIRIDANS00
73h675GNB10
74h583ENTEROCOCCUS00
75h360AUREUS00
76h703AUREUS01
77m450AUREUS10
78h583AUREUS01
79h390ENTEROCOCCUS00
80m332AUREUS10
81h614ENTEROCOCCUS10
82h210VIRIDANS10
83h430ENTEROCOCCUS00
84m460AUREUS00
85m380VIRIDANS10
86m652ENTEROCOCCUS00
87h704VIRIDANS11
88m745CoNS10
89h450AUREUS11
90h662ENTEROCOCCUS00
91m460AUREUS00
92h654ENTEROCOCCUS01
93h220AUREUS01
94m655ENTEROCOCCUS10
95h480AUREUS11
96h534VIRIDANS01
97m706CoNS01
98h250VIRIDANS00
99h470VIRIDANS01
100m340ENTEROCOCCUS11
101m260VIRIDANS00
102h501ENTEROCOCCUS01
103h773AUREUS00
104m330AUREUS01
105h807ENTEROCOCCUS01
106h806AUREUS11
107m706CoNS00
108h320VIRIDANS10
109h412VIRIDANS11
110m581AUREUS11
111h210AUREUS10
112m492AUREUS01
113h524AUREUS01
114h442AUREUS00
115m492AUREUS01
116h342AUREUS01
117h705AUREUS00
118m483AUREUS00
119h553ENTEROCOCCUS00
120h511CoNS10
121m310AUREUS01
122h220AUREUS10
123h511AUREUS11
124m270VIRIDANS10
125h480VIRIDANS10
126h521ENTEROCOCCUS11
127m470AUREUS11
128h242CoNS10
129h665AUREUS11
130m491ENTEROCOCCUS01
131h472VIRIDANS00
132h809CoNS01
133m431CoNS10
134h230AUREUS00
135h470AUREUS01
136m521ENTEROCOCCUS01
137h513CoNS11
138h827CoNS11
139m501CoNS10
140h492CoNS10
141h632AUREUS11
142m250AUREUS10
143h864AUREUS01
144h604AUREUS01
145m493VIRIDANS11
146m290CoNS11
147m672GNB01
148h460AUREUS00
149h806AUREUS01
150m809VIRIDANS00
151h715GNB10
152m270AUREUS10
153h360GNB10
154h260AUREUS10
155m793CoNS00
156h541AUREUS00
157h372ENTEROCOCCUS10
158m470VIRIDANS00
159h270AUREUS00
160h541ENTEROCOCCUS00
161m501ENTEROCOCCUS00
162h460AUREUS11
163h470AUREUS01
164m652AUREUS11
165h392AUREUS00
166h490AUREUS01
167m743CoNS10
168h482AUREUS10
169h524GNB01
170m290AUREUS00
171h410VIRIDANS10
172h776ENTEROCOCCUS00
173m602ENTEROCOCCUS01
174h290AUREUS00
175h360AUREUS01
176m440AUREUS00
177h430VIRIDANS01
178m290VIRIDANS10
179h240VIRIDANS00
180h828CoNS00
181m290VIRIDANS10
182h764CoNS01
183m402AUREUS01
184h593GNB01
185h773VIRIDANS00
186m513AUREUS01
187h370CoNS00
188h392VIRIDANS00
189m817AUREUS01
190h282ENTEROCOCCUS01
191h553CoNS00
192h816AUREUS01
193h663AUREUS01
194h804ENTEROCOCCUS01
195m410ENTEROCOCCUS00
196h442AUREUS01
197h797VIRIDANS00
198m492AUREUS10
199h460AUREUS01
200h521VIRIDANS00

Preguntas:

1.Hacer una descriptiva con media y desviación estándar o mediana y rango intercuartílico de las variables Edad y Charlson. Justificar la elección.

2.Ver si hay relación entre el grupo etiológico de la infección y la mortalidad.

3.Ver si hay diferencias estadísticamente significativas en el valor del Charlson entre los que mueren en el episodio y los que no mueren.

4. Ver si hay diferencias estadísticamente significativas en la edad de los infectados entre los hombres y las mujeres.

5.¿Es la infección producida por S. aureus, respecto a las demás etiologías, un factor de riesgo o de protección de mortalidad?

6,¿Es la infección producida por miembros del grupo VIRIDANS, respecto a las demás etiologías, un factor de riesgo o de protección de mortalidad?

7.¿Es la cirugía un factor protector de mortalidad?

8.¿Es ser mujer un factor de riesgo o de protección de mortalidad?

9.Ver si hay correlación entre la Edad y el Charlson. Si es así construir un modelo para predecir el índice Charlson en función de la Edad. ¿Tiene buena capacidad predictiva?

10.¿Es ser mujer un factor de riesgo o de protección para sufrir una infección cardíaca por S. aureus?