Archivo de la categoría: PROBLEMAS

Situación 158: Examen (Temas 1-17 y 19)

1.Tenemos una muestra de 1000 pacientes de una enfermedad psiquiátrica y 1000 pacientes controles sin esa enfermedad.  Queremos ver si hay diferencias entre ambos grupos en cuanto a tener o no una determinada enfermedad hematológica. Entre los controles hay 400 que tienen la patología y entre los pacientes con la enfermedad psiquiátrica son 450. ¿Cuál es la técnica de comparación a utilizar para ver si esta diferencia es estadísticamente significativa?

a.El test de Mann-Whitney

b.El test de McNemar

c.El test exacto de Fisher

d.El test de proporciones

 

2.Nos dan un intervalo de confianza del 95% de una proporción y el intervalo es (0.45, 0.55) o, en porcentajes: (45%, 55%). ¿Cuál es el tamaño de la muestra?

a.400

b.100

c.25

d.1600

 

3.Cuál de estas pendientes indica una menor capacidad predictiva?

a.Pendiente=2; IC 95% (-2, 6); r=0.65

b.Pendiente=5; IC 95% (3, 7); r=0.7

c.Pendiente=1; IC 95% (0.3, 1.7); r=0.4

d.Pendiente=16; IC 95% (1, 31); r=0.3

 

4.¿Cuál de las siguientes afirmaciones es cierta?

a.En una tabla de contingencias cualquiera si el valor de la ji-cuadrado es 5.44 podemos decir que no existe relación significativa entre las variables sin necesidad de mirar el umbral en la tabla de la ji-cuadrado.

b.Una OR=0.45 con un IC del 95% de (0.20, 1.14) es compatible con un valor de Ji-cuadrado de 1.99.

c.Una muestra como la siguiente (1, 8, 2, 4, 12) tiene una mediana de 2.

d.Una OR=0.5 con un intervalo de confianza del 95% de (0.2, 0.8) indica una relación de riesgo estadísticamente significativa.

 

5.¿Cuál de las siguientes afirmaciones es cierta?

a.Un kappa de 0 indica una total concordancia entre dos evaluadores

b.Si después de hacer un test de comparación de medias lo repetimos aumentando el tamaño de las dos muestras, sin cambiar ni desviación estándar ni el valor de las dos medias, el p-valor aumentará.

c.En un ANOVA de un factor no significativo el número de grupos homogéneos que tendremos en una comparación múltiple es de uno.

d.En una tabla de contingencias 3×3 la Odds ratio que calculemos será mayor que 1.

 

6.Estamos comparando dos técnicas psicoterapéuticas distintas, aplicadas a pacientes con trastorno de la alimentación. Hemos establecido un umbral de un test para delimitar si hemos conseguido este nivel que consideramos positivo o, por el contrario, que no lo hemos conseguido. Hemos hecho el estudio con 40 pacientes. Con 20 hemos ensayado una técnica y con los otros 20 la otra técnica. En la primera 15 han superado el umbral. En la segunda 10.

¿Cuál es la técnica estadística que hemos de aplicar?

a.El test exacto de Fisher

b.El test de proporciones

c.El test de la ji-cuadrado

d.El test de Mann-Whitney

 

7.Estamos comparando si hay diferencias estadísticamente significativas entre los que se han infectado por el coronavirus entre personas según el grupo sanguíneo A, B, AB u O. Hemos elegido 20 pacientes del A, 20 del B, 20 del AB y 60 del O. Estamos interesados en comparar el grupo O respecto al conjunto de los otros tres grupos. En el grupo O hay 5 casos de seropositivos y en el otro grupo (A, B y AB) son 10. ¿Cuál es la técnica de comparación a utilizar para ver si esta diferencia es estadísticamente significativa?

a.El test exacto de Fisher

b.Un ANOVA de un factor

c.El test de McNemar

d.El test de proporciones

 

8.Queremos determinar el tamaño de muestra para realizar la predicción de cuántas personas han padecido la covid-19 en España y tienen seroprotección. No tenemos ninguna referencia sobre el porcentaje real poblacional con el que nos podemos encontrar. Queremos tener un radio del intervalo del 1%.

a.10000

b.1000

c.5000

d.100

 

9.Si después de hacer un test de comparación de medias tenemos un p-valor de 0.35 y, después:

1)Lo repetimos aumentando el tamaño de las dos muestras y sin que cambien ni las medias ni las desviaciones estándar

2)Luego aumentamos las diferencias entre las medias muestrales, sin que cambie ni tamaños de muestra ni desviaciones estándar;

3)Finalmente, disminuyemos las desviaciones estándar de ambas muestras sin modificar la diferencia de medias ni el tamaño de muestra. ¿Cuál es el itinerario posible de p-valores sucesivos?

a.0.25/0.45/0.18

b.0.65/0.45/0.18

c.0.15/0.05/0.01

d.0.15/0.01/0.10

 

10.Tenemos dos tratamientos psicoterapéuticos a ensayar en dos grupos de 50 personas cada uno. Cada paciente toma un único fármaco. Se evalúa una variable cuantitativa. Hemos aplicado primero el test de Fisher-Snedecor y proporciona un p-valor de 0.15. Luego aplicamos el test de Shapiro-Wilk aplicado y la primera muestra nos da un p-valor de 0.04 y la segunda un p-valor de 0.34. ¿Qué test de comparación hemos de utilizar para hacer el contraste de hipótesis de comparación?

a.El test de la t de Student de varianzas iguales

b.El test de Mann-Whitney

c.El test de la t de Student de varianzas diferentes

d.El test de la t de Student de datos apareados

 

11.Tenemos la siguiente tabla de resultados en un experimento donde estudiamos cinco tratamientos psicoterapéuticos, donde evaluamos el resultado posterior de un test. Tenemos en total 20 pacientes, 4 para cada tratamiento. Los resultados obtenidos son los siguientes:

Tratamiento 1: 8; 11; 9; 8.

Tratamiento 2: 10; 10; 8; 9.

Tratamiento 3: 1; 3; 3; 2.

Tratamiento 4: 5; 4; 6; 5.

Tratamiento 5: 9; 8; 10; 9

Elige la respuesta correcta

 

a.Factor Tratamiento: p<0.05

Tres grupos homogéneos

b.Factor Tratamiento: p<0.05

Cinco grupos homogéneos

c.Factor Tratamiento: p<0.05

Dos grupos homogéneos

d.Factor Tratamiento: p>0.05

Dos grupos homogéneos

12.Estamos relacionado cuatro tres tipos de trastornos del sueño con tres tipos de trastornos de la alimentación. Hemos construido para ello una tabla de contingencias 3×3 y hemos buscado en personas que tuvieran ambos trastornos qué tipo de cada uno tenían. Hemos hecho la ji-cuadrado y no da una ji-cuadrado de 23.51. El p-valor es:

a.0.01

b.0.0001

c.0.005

d.0.001

 

13.¿Cuál de las siguientes afirmaciones es cierta?

a.En una tabla de contingencias 4×2 si el valor de la ji-cuadrado es 6.25 existe relación

significativa entre las variables.

b.Una OR=1.65 con un IC del 95% de (0.33, 2.44) es compatible con una Ji-cuadrado de 7.88

c.En una técnica de comparación de medias un p-valor de 0.35 es compatible con un intervalo de confianza de la diferencia de medias de (0.28, 1.98)

d.Una correlación r=0.45 con un p-valor de 0.23 es compatible con una pendiente de 45 con un intervalo de confianza del 95% de (-25, 115)

 

14.¿Cuál de las siguientes afirmaciones es cierta?

a.Si en un test de comparación de medias tenemos un p-valor de 0.45 y una potencia del 65% afirmaremos que hay igualdad de medias.

b.Si en un test de comparación de proporciones tenemos un p-valor de 0.04 y una potencia del 87% afirmaremos que hay igualdad de proporciones.

c.Si en un test de ANOVA  de una factor con cuatro niveles tenemos un p-valor de 0.005 y una potencia del 83% afirmaremos que no hay igualdad de medias.

d.Si en un test de ANOVA  de una factor con cinco niveles tenemos un p-valor de 0.01 y una potencia del 95% afirmaremos que la medias de los cinco grupos comparados son diferentes.

 

15.¿Cuál de las siguientes afirmaciones es cierta?

a.Una pendiente de 0.5 con un intervalo de confianza del 95% de (0.3, 0.8) es compatible con una correlación con intervalo de confianza (-0.8, -0.5)

b.Una OR=10 como factor de riesgo es equivalente a una OR=1 como factor de protección.

c.En un ANOVA de dos factores cruzados si un factor es significativo el otro no lo será.

d.Si se aplica el test de McNemar en una comparación es que estamos ante una variable dicotómica y dos muestras relacionadas.

 

16.En un Análisis de componentes principales la primera componente principal es V=0.5X+0.5Y-0.5Z y la segunda es W=0.5X-0.5Y+0.01Z ¿Cuál de los siguientes puntos es el que está muy a la derecha y arriba? (Tener en cuenta que el primer valor es la X, el segundo la Y y el tercero la Z):

a.(10, 1, 10)

b.(8, 5, 1)

c.(1, 1, 8)

d.(5, 8, 0)

 

17.Tenemos en un estudio de Alzhéimer tenemos cinco pacientes: a, b, c, d, e. De estos cinco pacientes tenemos seis variables, con los siguientes valores:

a:(10, 2, 25, 5, 15, 8)

b:(10, 5, 20, 13, 16, 1)

c:(9, 2, 21, 11, 15, 3)

d:(10, 1, 21, 10, 15, 3)

e:(9, 4, 20, 13, 16, 2)

¿Qué afirmación es cierta?

a.En un Análisis clúster el paciente que se agrupará en última posición respecto a los demás es el paciente a.

b.En un Análisis clúster el paciente que se agrupará en última posición respecto a los demás es el paciente e.

c.En un Análisis clúster los dos pacientes que se agruparán en primer lugar serán los pacientes a y b.

d.En un Análisis clúster los dos pacientes que se agruparán en primer lugar serán los pacientes b y d.

 

18.¿Cuál es el rango intercuartílico de la siguiente muestra?:(8, 2, 3, 5, 7)

a.4

b.3

c.6

d.2

 

19.Se nos proporciona un intervalo de confianza de la media del 95% de la concentración de un neurotransmisor en pacientes con trastorno bipolar. Este intervalo es (23, 27). Nos dicen que la desviación estándar de esa muestra era 5. ¿Cuál es el tamaño de la muestra?

a.25

b.100

c.400

d.125

 

20.En un artículo donde se comparan dos tratamientos, al analizar una variable dicotómica nos dan la siguiente información: el intervalo de confianza del 95% de la diferencia de proporciones es (0.25, 0.45) ¿cuál de las siguientes afirmaciones es cierta?

a.Los dos intervalos de confianza del porcentaje de cada población no se solapan.

b.Hay diferencias significativas porque el intervalo no contiene al 1.

c.No hay diferencias significativas porque no tenemos el p-valor del estudio.

d.No podemos decir nada todavía porque no tenemos el p-valor del estudio.

 

 

Solución Situación 156

1.

Las variables cualitativas:

Las variables cuantitativas:

2 y 3:

La correlación es positiva y con valor 0.8339, significativa, porque en la regresión que vemos a continuación el p-valor de la correlación coincide con la de la pendiente de la recta; o sea, una p<0.001. La regresión es la siguiente:

Tiene una buena capacidad predictiva: 69.54%.

4.

No hay relación entre ninguna de estas tres variables individualmente con la Recidiva.

5.

6.

No hay asociación con cada variable individualmente, sin embargo, a la que creamos una variable en la que separamos los que tienen alguna afectación respecto a los que no tienen ninguna sí obtenemos relación. Se trata de un factor de riesgo con una OR de 2.8 prácticamente.

7. Comprobemos primero la normalidad:

8.

9.

10.

 

 

Solución Situación 151

1a:

1b:

1c:

2ab:

Hay correlación significativa, pero con una capacidad predictiva muy baja (24,97%). La ecuación sería:

Volumen del hipocampo=-0.16*Dif+4.35

2c:

No hay relación estadísticamente significativa.

3a:

Hay diferencias estadísticamente significativas.

3b:

No hay diferencias estadísticamente significativas.

 

Situación 157: Examen (Temas 1-16)

1)Tenemos dos muestras de tamaño 200, cada una, en la que hemos aplicado dos tratamientos farmacológicos distintos que estamos comparando. En una el 30% responden favorablemente y en la otra es el 40% los que responden favorablemente. Hacemos un test de proporciones y el p-valor es 0.03, tenemos también el siguiente análisis:

¿qué respuesta es correcta?

a.Hay diferencia estadísticamente significativa entre estos dos tratamientos.

b.Debemos ser cautelosos y aumentar el tamaño de muestra puesto que la potencia es menor del 80%.

c.Como hemos rechazado la hipótesis nula y la potencia es superior al 50% podemos decir con tranquilidad que las probabilidades de equivocarnos diciendo que son distintas es muy baja.

d.Debemos decir que no hay diferencias estadísticamente significativas entre estos dos tratamientos.

2)En un artículo donde comparan dos tratamientos al analizar una variable dicotómica nos dan la siguiente información: La diferencia de porcentaje de mortalidad entre los dos tratamientos es del 15%, ¿cuál de las siguientes afirmaciones es cierta?

a.Como esa diferencia no es cero podemos decir que hay diferencias estadísticamente significativas.

b.Necesitaríamos saber los porcentajes de cada uno de los dos grupos, no sólo la diferencia de ambos porcentajes.

c.Necesitaríamos tener un intervalo de confianza del 95% de esa diferencia a nivel poblacional para poder tomar una decisión.

d.Necesitamos conocer cómo se comportan otras variables del estudio para tomar una decisión.

3)Si en un estudio sobre la prevalencia de una enfermedad tenemos una muestra de tamaño 10000 de los cuales 300 tienen esa patología, un intervalo de confianza del 95% del porcentaje poblacional será:

a.(2.16, 3.84)

b.(1.46, 4.54)

c.(2.06, 3.94)

d.(2.66, 3.34)

4)En un estudio vemos que nos dan el siguiente intervalo de confianza del 95% de la media: (49.0, 51.0). Leemos que el tamaño de muestra ha sido 400. ¿Cuál es el intervalo de confianza del 95% descriptivo de la variable o, también denominado, intervalo de valores individuales de esa variable?

a.(40, 60)

b.(35, 65)

c.(30, 70)

d.(45, 55)

5)¿En cuál de las siguientes muestras el rango intercuartílico es 1?

a.(1, 1, 2, 3)

b.(1, 5, 5, 7, 12)

c.(1, 3, 3, 4, 7)

d.(1, 1, 3, 3)

6)De las siguientes afirmaciones cuál es cierta:

a.En una Regresión es compatible una pendiente con p=0.45 con un IC de confianza del 95% de la correlación de (-0.7, -0.1)

b.En una comparación de proporciones es compatible un p-valor de 0.23 con un intervalo de confianza del 95% de la diferencia de proporciones de (0.12, 0.23).

c.En una Odds ratio es compatible un p-valor de 0.01 con un intervalo de confianza del 95% (0.21, 0.32)

d.En una técnica de comparación de medias es compatible un p-valor de 0.001 con un intervalo de confianza del 95% de la diferencia de medias de (-23, 45)

7)Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.15 es cierto lo siguiente:

a.Si aumentamos el tamaño de muestra y disminuimos la desviación estándar el p-valor subirá.

b.Si aumentamos la desviación estándar y disminuimos la diferencia de medias el p-valor bajará.

c.Si disminuimos la diferencia de medias y aumentamos la desviación estándar el p-valor subirá.

d.Si aumentamos el tamaño de muestra y disminuimos la diferencia de medias el p-valor subirá.

8)Se quiere hacer un pronóstico del porcentaje de consumidores que tendría un producto y se quiere tener una muy buena precisión: que el radio del intervalo sea del 1% en un intervalo del 95%. Sabemos que un producto similar en países muy parecidos al nuestro tiene un porcentaje de consumo alrededor del 20%. ¿Cuál es el tamaño de muestra recomendable en base a esta información:

a.6400.

b.11500.

c.14400.

d.8800.

9)Se estudia la sangre de 100.000 personas y se compara el grupo sanguíneo (A, B, AB, O) con el hecho de tener o no inmunoglobulinas contra el SARS-CoV-2 y el valor de la ji-cuadrado es 16.26.

a.El p-valor será 0.05.

b.El p-valor será 0.001.

c.El p-valor será 0.1.

d.El p-valor será 0.005.

10)Se ensayan dos medicamentos (A y B) en 50 pacientes con Alzhéimer y 50 controles. Se estudia la variable siguiente: El MiniMental a los dos años de tratamiento baja más de 3 unidades o no. Después de los dos años el 10% de los pacientes que toman el tratamiento A bajan más de 3 unidades y el 6% de los del tratamiento B. Para comparar si esta diferencia es estadísticamente significativa el test adecuado es:

a.El Test de proporciones.

b.El Test exacto de Fisher.

c.El Test de Mann-Whitney.

d.El Test de McNemar.

11).¿Cuál de estas cuatro informaciones es coherente?

a.OR=3.1; IC 95% (0.2, 0.45); p=0.1

b.r=0.5; IC 95% (-0.6, -0.5); p=0.0001

c.OR=2.8; IC 95% (2.24, 4.36); Ji-cuadrado=1.23

d.OR=0.6; IC 95% (0.12, 1.83); Ji-cuadrado=2.89

12)En la tabla de contingencias siguiente:

¿Cuál de las siguientes afirmaciones es cierta?

a.El valor de la ji-cuadrado será 0.

b.El p-valor será 0.

c.El p-valor no será 1 porque la tabla de contingencias esperada no coincide con esta tabla observada.

d.La ji-cuadrado no es aplicable porque no tenemos el mismo tamaño de muestra en cada tratamiento.

13)Hemos hecho una comparación de dos tratamientos en dos grupos diferentes. Los valores de la muestra que tenemos quedan representados de la siguiente forma mediante un Box-Plot:

Si queremos hacer una comparación de medias de ambos grupos, ¿cuál de las siguientes afirmaciones es cierta?

a.Habrá diferencias significativas porque las dos medias son distintas.

b.No habrá diferencias significativas porque los intervalos de la media se solapan.

c.Sin conocer el tamaño de muestra no podemos evaluar si habrá o no diferencias estadísticamente significativas.

d.El tamaño de muestra no es decisivo aquí por lo que con la información que apreciamos en el Box-Plot podemos saber si habrá o no diferencias significativas.

14)¿Cuál de las siguientes afirmaciones es cierta?

a.Una Odds ratio de 0.5 con un intervalo de confianza del 95% que no contenga al cero es estadísticamente significativa.

b.Una correlación de Pearson de 0.9 con un intervalo de confianza del 95% que no contenga al uno es estadísticamente significativa.

c.Una V de Crámer de 0.9 con una ji-cuadrado con un p-valor de 0.15 implica que no hay relación significativa entre las variables cualitativas relacionadas.

d.Una R2 superior al 50% implica que la regresión lineal simple es estadísticamente significativa.

15)Una prueba diagnóstica de una enfermedad con una prevalencia del 10% que tenga un 10% de falsos positivos y un 5% de falsos negativos tendrá un Valor predictivo positivo del:

a.48.33%

b.78.45%

c.51.35%

d.89.23%

16)¿Cuál de las siguientes afirmaciones es cierta?:

a.Si la prevalencia de una enfermedad es pequeña la sensibilidad será baja.

b.Si la prevalencia de una enfermedad es pequeña la especificidad será baja.

c.La sensibilidad y la especificidad son dos valores independientes.

d.La sensibilidad y la especificidad sumarán siempre 1.

17)Tenemos dos tratamientos psicoterapéuticos a ensayar en dos grupos de 50 personas cada uno. Cada paciente toma un único fármaco. Se evalúa una variable cuantitativa. Hemos aplicado primero el test de Fisher-Snedecor y proporciona un p-valor de 0.02. Luego aplicamos el test de Shapiro-Wilk aplicado y la primera muestra nos da un p-valor de 0.24 y la segunda un p-valor de 0.32. ¿Qué test de comparación hemos de utilizar para hacer el contraste de hipótesis de comparación?

a.El test de la t de Student de varianzas iguales

b.El test de Mann-Whitney

c.El test de la t de Student de varianzas diferentes

d.El test de la t de Student de datos apareados

18)¿Cuál de las siguientes muestras se ajustan mejor a una distribución Poisson?

a.(1, 5, 7, 9, 60)

b.(5, 8, 8, 7, 6, 7)

c.(0, 1, 1, 0, 1, 1, 2)

d.(20, 21, 22, 20, 21, 22)

19)En una Regresión lineal simple es cierto:

a.Si la pendiente tiene un intervalo de confianza del 95% de (0.23, 1.12) no es estadísticamente significativa por contener al 1.

b.Si la R2 es inferior al 5% tenemos una relación que no es estadísticamente significativa entre las variables de la regresión.

c.Con una correlación r=0.5 con un intervalo de confianza del 95% de (-0.03, 0.78) no podemos decir que sea una correlación estadísticamente significativa.

d.Una pendiente positiva o negativa pero estadísticamente significativa no puede tener una R2 menor del 50%.

20)Si ser hombre respecto a ser mujer tiene una OR=1.6 en referencia a tener la covid-19 y que se pueda complicar, ser mujer respecto a ser hombre tendrá una OR:

a.0.75

b.El mismo valor 1.6 puesto que se trata de la misma tabla de contingencias.

c.0.4

d.0.625

Situación 156: Trabajo práctico BIOMEDICINA

Tenemos la siguiente base de datos clínica donde se ha estudiado la influencia de sexo, edad y diferentes comorbilidades en la recidiva de una Endocarditis antes de los tres años en pacientes que tuvieron un primer diagnóstico de Endocarditis.

Las variables son las siguientes:

P: Paciente

S: Sexo (1=Mujer; 2=Hombre)

E: Edad

D: Diabetes

H: Hipertensión

C: Enfermedad coronaria

R1: Al menos una de las tres enfermedades anteriores

CH: Charlson (Medida del grado de comorbilidades del paciente)

RE: Recidiva de una Endocarditis después de tres años de la primera

(En las variables con 0 y 1, 0 es la etiqueta de NO y 1 es la etiqueta de SÍ)

La base de datos es la siguiente:

P S E D H C R1 CH RE
1 1 78 1 1 0 1 8 1
2 1 50 0 0 0 0 1 0
3 1 69 0 1 0 1 5 0
4 1 55 1 0 1 1 5 0
5 2 77 0 0 1 1 6 1
6 2 59 0 1 0 1 1 1
7 2 52 1 1 0 1 1 1
8 2 70 1 0 0 1 6 0
9 2 77 0 0 1 1 6 0
10 1 67 0 1 0 1 5 0
11 1 66 1 1 0 1 5 0
12 1 69 1 1 0 1 5 0
13 2 45 0 0 0 0 0 0
14 2 60 0 0 0 0 5 0
15 1 70 1 0 0 1 6 0
16 1 77 0 0 1 1 6 0
17 2 67 0 1 0 1 5 0
18 2 66 1 1 0 1 5 0
19 2 69 1 1 0 1 5 0
20 2 45 0 0 0 0 0 0
21 2 58 0 0 0 0 5 0
22 1 58 0 1 1 1 1 1
23 1 71 0 1 1 1 6 1
24 1 61 0 0 0 0 5 0
25 2 72 1 1 1 1 6 0
26 2 71 1 1 0 1 6 0
27 2 61 0 0 0 0 5 0
28 2 51 0 0 0 0 0 0
29 2 76 1 1 1 1 6 0
30 1 62 1 1 0 1 5 0
31 1 53 0 0 0 0 0 0
32 1 57 0 0 0 0 0 0
33 2 59 1 1 0 1 0 0
34 2 50 0 0 0 0 1 1
35 1 54 0 0 1 1 1 1
36 1 56 1 1 1 1 0 1
37 2 66 0 0 0 0 5 0
38 2 61 0 0 0 0 5 0
39 2 53 1 1 0 1 1 0
40 2 78 1 0 0 1 6 0
41 2 59 0 1 0 1 1 0
42 1 66 0 1 1 1 5 1
43 1 65 1 0 1 1 5 1
44 1 66 1 0 0 1 5 1
45 2 52 0 1 0 1 1 0
46 2 56 0 0 0 0 1 0
47 1 67 1 0 1 1 5 0
48 1 52 0 1 0 1 1 0
49 2 78 0 1 0 1 6 0
50 2 62 1 0 0 1 5 0
51 2 68 0 0 1 1 5 0
52 2 76 0 1 0 1 6 1
53 2 62 0 0 0 0 5 0
54 1 58 1 0 0 1 1 1
55 1 71 0 1 1 1 6 1
56 2 61 0 0 0 0 5 0
57 2 70 1 0 0 1 6 1
58 2 53 0 0 0 0 1 1
59 2 67 0 1 0 1 5 1
60 2 53 0 0 0 0 1 1
61 1 69 1 1 0 1 5 1
62 1 45 0 0 0 0 0 0
63 1 62 0 0 1 1 5 0
64 2 72 1 1 1 1 6 0
65 2 71 1 1 0 1 6 0
66 2 61 0 0 0 0 5 0
67 2 51 0 0 0 0 0 0
68 2 76 1 1 1 1 6 0
69 1 62 1 1 0 1 5 0
70 1 53 0 0 0 0 0 0
71 1 57 0 0 0 0 0 0
72 1 59 1 1 0 1 0 0
73 2 50 0 0 0 0 1 1
74 2 54 0 0 1 1 1 1
75 2 56 1 1 1 1 0 1
76 2 66 0 0 0 0 5 0
77 2 61 0 0 0 0 5 0
78 1 53 1 1 0 1 1 0
79 1 68 1 0 1 1 5 0
80 2 66 0 1 1 1 5 0
81 2 70 0 1 0 1 5 1
82 2 80 1 0 0 1 8 1
83 2 71 0 1 1 1 6 1
84 2 61 0 0 0 0 5 0
85 1 70 1 0 0 1 6 1
86 2 53 0 0 0 0 1 1
87 2 67 0 1 0 1 5 1
88 2 80 0 0 0 0 6 1
89 1 69 1 1 0 1 5 1
90 2 45 0 0 0 0 0 0
91 2 62 0 0 1 1 5 0
92 2 72 1 1 1 1 6 0
93 2 71 1 1 0 1 6 0
94 2 61 0 0 0 0 5 0
95 1 51 0 0 0 0 0 0
96 1 76 1 1 1 1 6 0
97 2 62 1 1 0 1 5 0
98 1 53 0 0 0 0 0 0
99 1 57 0 0 0 0 0 0
100 2 59 1 1 0 1 0 0
101 2 50 0 0 0 0 1 1
102 1 54 0 0 1 1 1 1
103 1 56 1 1 1 1 0 1
104 2 66 0 0 0 0 5 0
105 2 61 0 0 0 0 5 0
106 2 53 1 1 0 1 1 0
107 1 89 1 0 0 1 8 0
108 2 77 1 1 0 1 7 0
109 2 69 0 1 0 1 6 0
110 1 54 0 0 0 0 1 0
111 2 68 1 0 1 1 5 0
112 2 66 0 1 1 1 5 0
113 1 61 0 1 0 1 5 1
114 1 69 1 0 0 1 4 1
115 2 77 1 0 0 1 6 1
116 2 59 0 1 0 1 1 0
117 2 53 0 0 0 0 1 0
118 1 85 1 0 1 1 10 0
119 1 59 0 1 1 1 1 0
120 2 62 0 1 0 1 5 0
121 1 88 1 0 1 1 10 0
122 1 59 0 1 1 1 1 0
123 2 62 0 1 0 1 5 0
124 2 68 0 0 1 1 5 0
125 2 58 0 0 0 0 1 0
126 2 61 0 1 0 1 5 0
127 2 83 0 0 0 0 9 0
128 1 57 1 0 0 1 1 0
129 1 59 0 1 0 1 1 0
130 1 59 0 1 1 1 1 0
131 1 77 1 0 1 1 6 0
132 1 57 1 0 0 1 1 0
133 2 59 1 1 0 1 2 0
134 2 50 0 1 0 1 1 0
135 1 54 0 0 0 0 1 0
136 2 68 1 0 1 1 5 0
137 2 66 0 1 1 1 5 0
138 1 61 0 1 0 1 5 1
139 1 82 1 0 0 1 1 1
140 2 77 1 0 0 1 6 1
141 2 59 0 1 0 1 1 0
142 2 53 0 0 0 0 1 0
143 1 85 1 0 1 1 10 0
144 1 59 0 1 1 1 1 0
145 2 62 0 1 0 1 5 0
146 1 85 1 0 1 1 10 0
147 1 78 0 1 1 1 1 0
148 2 62 0 1 0 1 5 0
149 2 88 0 0 1 1 7 0
150 2 58 0 0 0 0 1 0
151 2 61 0 1 0 1 5 0
152 2 83 0 0 0 0 9 0
153 1 57 1 0 0 1 1 0
154 2 59 0 1 0 1 1 0
155 1 59 0 1 1 1 2 0
156 2 77 1 0 1 1 6 0
157 1 59 1 0 0 1 1 0
158 1 80 0 0 0 0 7 0
159 2 60 0 0 0 0 5 0
160 2 77 1 1 0 1 6 0
161 1 71 1 0 1 1 6 0
162 1 61 0 1 0 1 5 1
163 2 51 0 0 0 0 1 0
164 1 66 1 0 0 1 5 1
165 2 62 0 1 1 1 5 0
166 1 53 0 0 0 0 1 0
167 1 57 1 0 0 1 1 0
168 2 78 1 1 0 1 4 0
169 2 69 0 1 0 1 2 0
170 1 54 0 0 0 0 1 0
171 2 58 0 0 0 0 1 0
172 2 61 0 1 0 1 5 0
173 2 83 0 0 0 0 9 0
174 1 57 1 0 0 1 1 0
175 2 58 0 0 0 0 1 0
176 2 61 0 1 0 1 5 0
177 2 83 0 0 0 0 9 0
178 1 57 1 0 0 1 1 0
179 2 58 0 0 0 0 1 0
180 2 61 0 1 0 1 5 0
181 2 90 0 0 0 0 9 0
182 1 57 1 0 0 1 1 0
183 2 77 0 1 0 1 3 0
184 2 76 0 1 1 1 4 0
185 2 77 1 0 1 1 6 0
186 1 59 1 0 0 1 1 0
187 1 80 0 0 0 0 7 0
188 2 60 0 0 0 0 5 0
189 2 77 1 1 0 1 8 0
190 1 71 1 0 1 1 6 0
191 1 61 0 1 0 1 5 1
192 2 51 0 0 0 0 1 0
193 2 66 1 0 0 1 5 1
194 2 82 0 1 1 1 5 0
195 1 53 0 0 0 0 1 0
196 1 57 1 0 0 1 1 0
197 2 77 1 1 0 1 5 0
198 2 78 0 1 0 1 6 0
199 1 54 0 0 0 0 1 0
200 1 87 1 0 0 1 8 0
  1. Preparar una descriptiva básica de cada una de las variables del estudio.
  2. Calcular la correlación entre la edad y la comorbilidad medida mediante el Charlson.
  3. Calcular la función lineal que nos permitiría pronosticar el Charlon sabiendo la edad de un paciente. Evalúa la calidad de este pronóstico.
  4. ¿Existe relación entre tener diabetes, hipertensión o enfermedad coronaria (individualmente) con recidiva de Endocarditis antes de los tres años? Si la hay calcula la Odds ratio.
  5. ¿Existe relación entre tener tener al menos una de las tres patologías recogidas (diabetes, hipertensión, enfermedad coronaria), que es la variable R1, con recidiva de Endocarditis antes de los tres años? Si la hay calcula la Odds ratio.
  6. Discutir brevemente, de forma global, los resultados que se han obtenido en los apartados 4 y 5.
  7. ¿Hay diferencias, estadísticamente significativa, en las medias de Edad entre los que tienen una o más de una de esas tres enfermedades y los que no tienen ninguna (variable R1)?
  8. Calcula la potencia de este contraste de hipótesis.
  9. ¿Hay diferencia estadísticamente significativas en la media del Charlson entre sexos?
  10. Calcula la potencia de este contraste.