Archivo del Autor: estadisticallopis

Situación 62: Práctica (Tema14)

Se ha realizado un estudio clínico con pacientes diagnosticados de Alzheimer. Se ha ensayado un tratamiento que intenta frenar el proceso de la demencia progresiva. Para ello se han seleccionado un grupo de 60 pacientes con esta enfermedad. De forma aleatoria se reparten estos pacientes en dos grupos de 30 pacientes cada uno. Durante 2 años a uno de los grupos se les da un tratamiento experimental y al otro grupo se les da un placebo. El estudio es a doble ciego. La variable estudiada para evaluar el nivel cognitivo del paciente era el Mini-Mental.

El Mini-Mental es una evaluación numérica del nivel cognitivo obtenido mediante una encuesta validada que es la siguiente:

20140410-233409.jpg

20140410-233419.jpg

A continuación se aporta la base de datos con los valores basales (0 años) y los valores a los 2 años de tratamiento:

GPlacebo0a=Grupo Placebo a nivel basal (a los 0 años).

GPlacebo2a=Grupo Placebo a los 2 años.

RestaP=Resta GPlacebo0a-GPlacebo2a.

GTratamiento0a=Grupo Tratamiento a nivel basal (a los 0 años).

GTratamiento2a=Grupo Tratamiento a los 2 años.

RestaT=Resta GTratamiento0a-GTratamiento2a.

GPlacebo0a GPlacebo2a RestaP GTratamiento0a GTratamiento2a RestaT
18 14 4 17 15 2
21 16 5 20 18 2
17 13 4 21 19 2
15 12 3 23 19 4
18 13 5 22 20 2
15 12 3 19 18 1
16 14 2 19 17 2
18 14 4 18 17 1
21 16 5 20 16 4
23 17 6 15 12 3
22 21 1 16 14 2
21 18 3 18 16 2
19 13 6 21 20 1
18 14 4 20 18 2
18 13 5 16 15 1
16 13 3 16 13 3
18 13 5 23 21 2
18 11 7 24 22 2
16 13 3 22 18 4
19 18 1 19 13 6
20 15 5 18 17 1
15 13 2 17 15 2
16 12 4 17 13 4
18 15 3 19 16 3
21 16 5 17 14 3
23 19 4 16 14 2
15 14 1 19 14 5
16 12 4 20 19 1
18 13 5 15 14 1
19 14 5 19 18 1

Se pide:

1. ¿Hay diferencia, estadísticamente significativa, a nivel basal (a los 0 años), en cuanto al nivel de enfermedad entre los dos grupos (el grupo Placebo y el grupo Tratamiento)?

2. ¿Hay una pérdida, estadísticamente significativa, en el grupo Tratamiento, en los dos años?

3. ¿Hay una pérdida, estadísticamente significativa, en el grupo Control, en los dos años?

4. ¿Hay diferencia, estadísticamente significativa, entre los dos grupos (Placebo y Tratamiento) en cuanto a la variable Resta; o sea, la variable Mini-Mental a 0 años-Mini-Mental a 2 años?

5. ¿Hay diferencia, estadísticamente significativa, entre ambos grupos, en cuanto al porcentaje de los pacientes que en los dos años el descenso del valor individual es superior o igual a 6?

Aplicación del Test de Hosmer-Lemeshow en Medicina

La Regresión logística es uno de los modelos matemáticos más usuales en Medicina. Un modelo no puede aplicarse así, sin más, porque se suela hacer. Un modelo puede usarse siempre y cuando haya un buen ajuste. Usar un modelo sin ajustarlo previamente es actuar a ciegas y esto es grave en ciencia.

El Test de Hosmer y Lemeshow es un test de bondad de ajuste de unos datos a un modelo de Regresión logística. Y como la Regresión logística es muy usual en Medicina este Test es un muy importante Test en Medicina.

Un Test de bondad de ajuste, en general, lo que hace es comprobar si el modelo propuesto puede explicar lo que se observa. Es un Test donde se evalúa la distancia entre lo observado en los datos que tenemos de la realidad y lo esperado bajo el modelo. Para introducirse en la visión general de los tests estadísticos donde se evalúa la distancia entre observado y esperado ver el artículo Tema 8: Relación entre variables cualitativas: Test de la ji-cuadrado.

El Test básicamente consiste en dividir el recorrido de valores de la variable dependiente (0,1) en una serie de intervalos. Intervalos que contengan un número de observaciones suficientemente grande (5 ó más). Se trata, entonces, de contar intervalo por intervalo el esperado y el observado para cada uno de los dos resultados posibles de la variable dependiente dicotómica (tiene la enfermedad o no la tiene, es hombre o mujer, etc). El observado es lo que se tiene y el esperado es el valor esperado teórico calculado mediante el modelo construido. El estadístico es un estadístico de la ji-cuadrado, como el visto en el tema dedicado a la relación entre variables cualitativas.

Veamos un par de ejemplos donde podemos comprobar la aplicación del Test a un caso donde hay ajuste y a otro donde no lo hay. El ejemplo es con pocos datos, para que se entienda mejor, lo que fuerza a que el número de observaciones por intervalo sea muy bajo (menos de 5), lo que hace menos fiable el test. Los datos son los siguientes:

IMG_8389

Vemos la variable «y» que es la variable dependiente. Una variable codificada con 1 ó 0. Es la variable dicotómica estudiada: Enfermo-No enfermo, Muere-No muere, Metástasis-No metástasis, etc.

Las otras dos variables son las variables independientes. Haremos una Regresión logística con cada una de las dos variables independientes.

Empezemos con la primera, la variable x1. El dibujo de la Regesión logística es el siguiente:

IMG_8390

Como puede verse los valores aparecen bien segregados, los valores con variable dependiente 1 ó 0. La aplicación del Test de Hosmer-Lemeshow es la siguiente:

IMG_8392

Observemos que el p-valor es superior a 0.05. Aquí la Hipótesis nula es que el modelo se ajusta a la realidad. En un Test de bondad de ajuste siempre en la Hipótesis nula se afirma que el modelo propuesto se ajusta a lo observado. Por lo tanto, un p-valor superior a 0.05 implica que lo que observamos se ajusta suficientemente a lo que esperado bajo el modelo.

Observemos también que en la tabla de aplicación del Test, en la que se van calculando, en una serie de intervalos, los valores observados y esperados, hay mucha proximidad entre estos valores reales y teóricos. Esto es lo que permite pensar que usar este modelo y calcular predicciones con él es suficientemente correcto. Esto suele considerarse como una Calibración.

Veamos ahora lo mismo pero con la variable x2:

IMG_8391

Viendo estos datos vemos que los valores con 1 ó 0 ya no tienen una disposición que haga pensar en un buen ajuste. Veamos la aplicación del Test:

IMG_8393

Ahora el p-valor del Test es menor que 0.05, lo que implica que la Hipótesis nula no parece lógico mantenerla a la luz de lo que vemos en nuestros datos. Si observamos, también, la tabla de los valores observados y esperados, tanto entre los valores con 1 y con 0, vemos que hay mucha distancia entre los valores observados y los valores esperados.

En una situación como esta no sería recomendable el uso del modelo de Regresión logística.

Solución Situación 61

1d: No existen métodos de comparación entre estas tres medidas del grado de relación entre variables. Entre dos medidas significativas del mismo tipo sí que la hay, pero no entre estos distintos tipos de medidas. Cada una tiene un rango de valores posibles distinto y no hay unas pautas de comparación entre los diferentes tipos de medidas del grado de relación que aparecen en esta pregunta; o sea, entre la correlación de Pearson, la Odds ratio y la V de Crámer.

2a: Las únicas OR significativas son 0.1 y 7. Y 0.1 implica un grado de relación de 10 niveles de protección. Y 10 es mayor que 7.

3c: En esta muestra el 26 tiene 8 valores inferiores y 2 superiores. Por eso, sólo en esta muestra ocupa el percentil 80.

4b: Una OR=4 es equivalente a una OR=0.25 porque ambas suponen 4 veces riesgo ó 4 veces protección. Y 0.5 supone únicamente 2 veces protección. Por lo tanto, una OR=4 implica mayor asociación que una OR=0.5.

Una OR mayor que 1 puede ser perfectamente no significativa.

No siempre que el observado y el esperado de una tabla de contingencia no coincidan la V de Crámer valdrá 1. Valdrá 1 sólo si existe el grado máximo posible de diferencia, dado el tipo de tabla que tengamos y el tamaño de muestra que tengamos.

El índice kappa puede tener valores negativos sólo si la discordancia es muy grande.

5b: No parece haber ajuste a una distribución normal, claramente. Luego, los valores de asimetría estandarizada y curtosis estandarizada caerán fuera del intervalo (-2, 2).

6a: Si el intervalo de confianza del 95% de la pendiente no incluye al 0 se trata de una pendiente significativa. No es cierto que no lo sea, de significativa, por incluir al 1.

Las otras afirmaciones son claramente ciertas. El intervalo de confianza de la OR no incluye al 1, por lo tanto: es significativo. La correlación también lo es por tener un p-valor inferior a 0.05. Y el índice kappa indica fuerte asociación porque es casi 1.

7d: El rango es 8. La moda 3. La mediana es 3. Y el rango intercuartílico es, claramente 6 puesto que el primer cuartil es 2 y el tercero es 8.

8d: Una r=-0.6 al hacer su cuadrado tenemos que es 0.36 y al pasarlo a porcentaje se transforma en un 36%.

En una Regresión lineal simple la variable dependiente es cuantitativa, no cualitativa.

El que el p-valor sea mayor que 0.05 no es indicativo de que observado y esperado coinciden. Evidentemente, si estos coinciden el p-valor será mayor que 0.05 (de hecho, será 1), pero el que el p-valor sea mayor que 0.05 no implica que necesariamente observado y esperado coincidan.

Si un intervalo de confianza del 95% de la media es (8, 12) el Error estándar será 1, no 2, puesto que la media muestral será 10 y dos veces el Error estándar nos debe dar 2. Luego el Error estándar debe ser 1.

9d: Una OR=0.2 indica un grado de protección de 5 porque 1/0.2 es igual a 5.

La Regresión lineal simple y=3x+4 tiene pendiente claramente positiva.

La V de Crámer sólo puede tener valores entre 0 y 1.

Una ji-cuadrado no cuantifica el grado de relación que hay entre dos variables cualitativas. Valora si hay o no relación.

10c: Como ni la asimetría estandarizada ni la curtosis estandarizada caen dentro del intervalo (-2, 2) nuestra variable, en este caso, no se ajusta a la distribución normal, por lo tanto a la hora de resumirla brevemente es preferible y recomendable hacerlo mediante la mediana y el rango intercuartílico.

La afirmación «a» seguro que tiene demasiado error por el no ajuste a la distribución normal.

No tienen por qué ser iguales la mediana y la media.

Toda muestra de una variable cuantitativa tiene desviación estándar, se ajuste o no a una distribución normal. Otra cosa es cómo se interprete en función del ajuste a la distribución normal de la variable estudiada.

Situación 61: Examen (Temas 1-9)

1. ¿Qué valor refleja un mayor nivel de relación entre dos variables?

a. r= 0.6 (p<0.05)

b. OR=10 (IC 95%: (4.37, 23.32))

c. V=0.85 (p<0.05)

d. No pueden compararse estos tres tipos de medición del grado de relación entre dos variables.

2. ¿Qué Odds ratio indica mayor relación entre dos variables dicotómicas?

a. 0.1 (p<0.05)

b. 7 (p<0.05)

c. 15 (p>0.05)

d. 0.05 (p>0.05)

3. Tenemos un individuo con un valor de IMC de 26 y nos dicen que, respecto a una muestra, este valor representa un percentil 80. ¿Cuál de las siguientes es la muestra referente?:

a. (19, 21, 21, 22, 23, 24, 24, 24, 25, 31)

b. (19, 21, 21, 22, 24, 24, 25, 27, 28, 31)

c. (20, 21, 21, 22, 24, 24, 24, 25, 27, 29)

d. (18, 21, 21, 22, 24, 24, 27, 29, 31, 38)

4. ¿Qué afirmación entre las siguientes es cierta?

a. Una Odds ratio mayor que 1 siempre es significativa.

b. Una Odds ratio de 4, significativa, es una medida que indica mayor asociación que una Odds ratio de 0.5 que también sea significativa.

c. La V de Crámer toma el valor de 1 si el observado y el esperado son diferentes.

d. El índice kappa puede tener valores negativos si la concordancia entre dos observadores es muy alta.

5. En una muestra como la siguiente: (4, 5, 5, 6, 6, 15, 16, 16, 17, 17, 80), la asimetría estandarizada y la curtosis estandarizada:

a. Deben de ser valores que caen fuera del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

b. Deben de ser valores que caen fuera del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

c. Deben de ser valores que caen dentro del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

d. Deben de ser valores que caen dentro del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

6. ¿Cuál de las siguientes afirmaciones no es cierta?

a. Un intervalo de confianza del 95% de una pendiente en una Regresión lineal simple que sea (0.75, 1.34) nos indica una pendiente no significativa porque el intervalo incluye al 1.

b. Una Odds ratio con un intervalo de confianza del 95% que sea (3.23, 7.67) indica una asociación significativa.

c. Una correlación r=0.23 (p=0.001) indica que estamos ante una correlación positiva significativa.

d. Un índice kappa de 0.98 indica una fuerte concordancia entre dos observadores.

7. Sea la muestra (9, 9, 1, 1, 3, 3, 3, 7). Podemos afirmar:

a. El rango es 9.

b. La moda es 9.

c. La mediana es 5.

d. El rango intercuartílico es 6.

8. ¿Cuál de las siguientes afirmaciones  es cierta?

a. En una Regresión lineal simple la variable dependiente es cualitativa.

b. En un Test de la ji-cuadrado si el p-valor es mayor que 0.05 indica que la tabla de contingencias observada y la esperada son iguales.

c. Un intervalo de confianza de la media del 95% que sea (8, 12) indica que el Error estándar es igual a 2.

d. Una correlación de Pearson de -0.6 entre dos variables nos indica que si hacemos una Regresión lineal simple entre ambas variables tendremos una Rdel 36%.

9. ¿Cuál de las siguientes afirmaciones es cierta?

a. Un modelo de Regresión lineal simple que sea y=3x+4 tiene una pendiente negativa.

b. Una V de Crámer de -1 indica que la relación entre las variables cualitativas es de tipo inverso.

c. La ji-cuadrado es una técnica que cuantifica el grado de relación que hay entre dos variables cualitativas.

d. Una Odds ratio de 0.2, significativa, nos indica que la exposición estudiada es un factor que nos protege 5 veces más que la no exposición.

10. En una muestra con curtosis estandarizada de 3.45 y asimetría estandarizada de -5.18:

a. Si la media muestral es 5 y la desviación estándar es 3 podremos decir que entre 2 y 8 tenemos el 68.5% de los valores.

b. La media muestral y la mediana serán iguales.

c. Si la queremos resumir brevemente mejor hacerlo mediante la mediana y el rango intercuartílico expresado mediante el primer y tercer cuartil.

d. Esta muestra no tienen desviación estándar porque no se ajusta a una distribución normal.

Solución Situación 60

Las preguntas eran:

1. Comprobar si hay relación significativa entre la variable Grupo (anorexia frente a control) y cada una de las otras variables del estudio.

2. Calcular la V de Crámer para cada una de las relaciones.

3. Calcular la Odds ratio para cada una de las relaciones.

En el siguiente cuadro aparecen todos los resultados:

G respecto a: ji-cuadrado p-valor V de Crámer OR IC 95%
P 10,1764 0,0014 0,3190 4,2051 (1,69, 10,45)
A 14,0359 0,0002 0,3746 6,2469 (2,26, 17,29)
B 5,1975 0,0226 0,2280 2,9531 (1,14, 7,65)
H 23,5200 <0,0001 0,4850 20,4444 (4,47, 93,47)
D 4,5737 0,0325 0,2139 2,8908 (1,07, 7,82)
S1 13,1494 0,0003 0,3626 4,6437 (1,98, 10,88)
S2 15,1744 <0,0001 0,3895 5,5238 (2,26, 13,48)
S3 16,3185 <0,0001 0,4040 10,4444 (2,85, 32,21)

En todos los factores analizados vemos, mediante la ji-cuadrado, una relación significativa entre la variable cualitatitva Anorexia-Control y cada uno de esos factores analizados: P, A, B, H, D y las respectivas sumas de factores: S1, S2 y S3.

La variable H es la que presenta una Odds ratio más elevada. Las mujeres con antecedentes parenterales de trastornos de la alimentación tienen 20 veces más posibilidades de tener anorexia que las que no tienen esos antecedentes, en base a la muestra que tenemos.

Observemos, también, que al ir sumando más de esos factores considerados se va incrementando el riesgo. La Odds ratio va creciendo. Desde S1 a S3 vamos incrementando la Odds ratio.

Es interesante constatar el hecho de que H, individualmente, tenga una Odds ratio superior a cualquiera de las variables que suman riesgos. La suma de riesgos es más general, porque suma cualquier combinación. Tienen, esas sumas, valores de Odds ratio más bajas pero también con intervalos de confianza más estrechos porque reúnen un número superior de casos y esto reduce el intervalo.

Evidentemente en cualquier relación lo preferente es encontrar relaciones significativas, pero una vez tenemos significación cuanto más estrecho sea el intervalo de confianza más perfilado tenemos el nivel de riesgo o de protección de la exposición analizada.

Solución Situación 59

1. Calcular las correlaciones de Pearson entre las cuatro variables:

IMG_8352

 

La Edad no está correlacionada significativamente con ninguna de las otras tres variables. Lo que indica que la gravedad de la situación no depende de la edad, sino de otros factores. Nos podemos encontrar cualquier nivel de gravedad en cualquier edad.

La correlación entre las variables Amenorrea, Densidad ósea y Leucocitos es significativa y elevada. La correlación es negativa entre Amenorrea y las otras dos variables, indicando que cuantos más meses de amenorrea tenga la paciente menor nivel de densidad ósea o de leucocitos tiene. La correlación entre Leucocitos y Densidad ósea es positiva, indicando que existe entre ella una relación directa.

2. Construir un modelo de Regresión lineal simple con el que pronosticar el nivel de densidad ósea a partir de los meses de amenorrea de la paciente:

IMG_8353

IMG_8354

 

Como la correlación entre Amenorrea y Densidad ósea es significativa podemos establecer entre ellas una Regresión lineal simple. Vemos cuál es la fórmula matemática que se acaba estimando: D=0.8234-0.0172*A.

La Res del 65.97%. No es muy elevado pero está por encima del 50% que es el umbral que se suele establecer para hablar de buen o mal modelo predictor. Por encima de este 50% ya podemos hablar de una determinación aceptable.

3. Construir un modelo de Regresión lineal simple con el que pronosticar el nivel de densidad ósea a partir de los valores de leucocitos de una paciente:

IMG_8355

IMG_8356

 

Como la correlación entre Densidad ósea y Leucocitos también es significativa podemos establecer también un modelo de Regresión lineal simple. Ahora la fórmula es D=0.3018+0.0001*L. Observemos que el programa estadístico nos da 0.001E-1, esto significa que es 0.001 multiplicado por 10 elevado a -1; o, lo que es lo mismo, multiplicado por 0.1.

La R2 es del 97.05%, por lo tanto estamos ante una enorme capacidad de determinación de la Densidad ósea a partir del valor de Leucocitos de una paciente.

Por lo tanto, a la hora de predecir la Densidad ósea de una paciente los meses de amenorrea es un buen procedimiento, pero, aún mejor es basarse, si es que se conoce, el valor de Leucocitos de la paciente.

Herramientas estadísticas en Medicina (Una hoja de ruta)

El objetivo de este artículo es confeccionar una hoja de ruta, un mapa, para moverse entre las principales técnicas estadísticas en Medicina. Con esa hoja de ruta pretendo orientar al usuario de la Estadística a moverse en el complejo bosque de esas técnicas analíticas, especialmente tal como suelen usarse en el ámbito de la Medicina.

El índice básico de esta hoja de ruta es el siguiente:

1. Estadística descriptiva.

2. Técnicas de comparación.

3. Técnicas de relación.

4. Determinación del tamaño de muestra.

En la gran mayoría de investigaciones en Medicina se usan, al mismo tiempo, estos cuatro tipos de técnicas. Veamos cada una de estas familias de técnicas. Veamos lo que analizan, cómo se usan habitualmente y veamos, también, sucesivos enlaces donde encontrar detalles más concretos para quien quiera ampliar información:

1. Estadística descriptiva

El objetivo fundamental de la Estadística descriptiva es cuantificar ciertas características a las variables con las que hemos trabajado (media, mediana, desviación estándar, rango intercuartílico, etc., en las variables cuantitativas, y frecuencia absoluta y frecuencia relativa en las variables cualitativas).

La decisión de cómo presentar, de cómo resumir, las variables cualitativas y, especialmente, las variables cuantitativas, en un estudio, en absoluto es un tema trivial y suelen cometerse importantes errores a este nivel.

Unas pautas para el resumen básico, según el tipo de variable, son las siguientes:

a. Variables cualitativas: Suelen resumirse sin demasiado problema mediante las frecuencias absolutas y la frecuencias relativas de los diferentes valores que esa variable puede tener.

b. Variables cuantitativas: Con la media y la desviación estándar, si la variable se ajusta a la distribución normal. Con la mediana y el rango intercuartílico, si la variable no se ajusta a la distribución normal.

Para más información consultar los artículos: La Estadística descriptiva en Medicina, para ver cómo suele presentarse la Estadística descriptiva en artículos de Medicina, y Media y desviación estándar o Mediana y rango intercuartílico para la explicación de cuándo resumir una variable cuantitativa mediante Media y desviación estándar o mediante Mediana y rango intercuartílico.

2. Técnicas de comparación

El objetivo de las Técnicas de comparación es comprobar si las diferencias apreciadas en los distintos grupos comparados son diferencias estadísticamente significativas. Esto nos lleva al que seguramente es el elemento nuclear de la Estadística: la noción de  «significación». En Estadística «significativo» significa que estamos ante un resultado que es muy poco probable que sea debido al azar, que estamos ante un resultado fiable. Ver los artículos: La Estadística como ciencia de lo significativo o La Estadística es como un partido de baloncesto o Introducción a las técnicas de comparación.

Entre las técnicas de comparación suele distinguirse entre Técnicas de comparación de dos grupos y Técnicas de comparación de más de dos grupos:

a. Comparación de dos grupos: En el tema dedicado a la Comparación de dos poblaciones se puede seguir el protocolo de decisión de la técnica a aplicar en un caso concreto. Es importante saber que disponemos de técnicas adaptadas a manejar datos que tengan una estructura adecuada. Es importante aplicar, pues, en cada caso, la técnica adecuada al caso. De esta forma optimizamos la decisión. Un resumen, en forma de diagrama de flujo, de los pasos seguidos para la elección de la técnica de comparación de dos poblaciones es el siguiente:

20140325-133316.jpg

b. Comparación de más de dos grupos: Para la comparación de más de dos grupos debemos introducirnos en el mundo ANOVA.

Es importante distinguir que hay dos momentos diferentes en los que se suele usar cualquiera de las técnicas de comparación en Medicina:

a. Comparación en la búsqueda de igualdad: donde se busca la igualdad de unos grupos, respecto a una serie de variables-descriptoras. Grupos que respecto a un tratamiento o la exposición a un riesgo están en posiciones diferentes.

b. Comparación en la búsqueda de diferencia: donde se buscan diferencias en ciertas variables-resultado entre los grupos sometidos a condiciones diferentes.

La siguiente tabla nos resume todo lo visto en el apartado 1 y 2:

IMG_8279

Observemos que en esta tabla se sintetiza Estadística descriptiva y Técnicas de comparación. Se expresan las variables cualitativas en frecuencia absoluta y frecuencia relativa y las variables cuantitativas mediante la media y desviación estándar o mediante la mediana y el rango intercuartílico. En las dos primeras columnas vemos los dos grupos a comparar en la búsqueda de igualdad, con el p-valor respectivo de esa comparación, con la técnica apropiada, en la tercera columna. En las columnas cuarta y quinta están los dos grupos a comparar en la búsqueda, ahora, de diferencia, con el p-valor respectivo en la sexta columna. Los dos primeros grupos comparados son según el tratamiento, los dos últimos grupos han sido creados según el resultado (éxito/fracaso). Es lógica la búsqueda de igualdad en la primera comparación y la búsqueda de diferencia en la segunda.

3. Técnicas de relación

En las técnicas de relación el objetivo es establecer relaciones entre variables. En el ámbito de las técnicas estadísticas que analizan las relaciones entre variables es habitual diferenciar tres situaciones posibles:

a. Relaciones entre dos variables cuantitativas.

b. Relaciones entre dos variables cualitativas.

c. Relaciones entre una variable cualitativa y una cuantitativa.

La siguiente figura resume estas tres situaciones posibles:

Foto 20-10-12 17 58 17

Observemos que tenemos tres filas y tres columnas. Las tres filas indican los tres posibles tipos de relación entre dos tipos de variables: Dos cuantitativas, dos cualitativas y una cualitativa y una cuantitativa. Las tres columnas indican tres tipos de situaciones en cuanto a la relación. En la columna del medio no hay relación entre las variables. En las columnas de la izquierda y de la derecha hay relación. Y en ambos lados digamos que se trata de una relación de tipo, de signo distinto.

En cada uno de estos tres ámbitos el objetivo será triple:

a. Detectar si hay o no relación estadísticamente significativa.

b. Cuantificar esa relación.

c. Matematizar esa relación, crear una función que exprese, matemáticamente, esa relación.

De todos los conceptos que se manejan en el ámbito de la relación entre variables los que son más frecuentemente usados en el ámbito de la Medicina son los siguientes:

a. Para detectar relación y cuantificarla, entre variables cuantitativas: la correlación, en sus diferentes versiones: Pearson, Spearman y Kendall.

b. Para matematizar la relación entre variables cuantitativas: la Regresión lineal simple. Para más de dos variables: la Regresión múltiple.

c. Para detectar relación entre variables cualitativas: el Test de la ji-cuadrado.

d. Para cuantificar la relación entre variables cualitativas: la Odds ratio.

e. Para detectar, cuantificar y matematizar la relación entre variables cualitativas y cuantitativas: la Regresión logística.

f. Cuando una de las variables es el tiempo hasta que sucede un determinado acontecimiento tenemos: el Análisis de supervivencia y cuando esta supervivencia queremos explicarla matemáticamente mediante otra u otras variables tenemos: la Regresión de Cox. En este ámbito aparece una nueva cuantificación de la relación: el Hazard ratio, que, aunque guarde una estrecha relación con la Odds ratio se trata de dos medidas diferentes que es importante saber situar. Para esa distinción ver el artículo: Odds ratio versus Hazard ratio.

4. Determinación del tamaño de muestra

La muestra es el punto de partida del análisis estadístico. Sin embargo, la elección misma de la muestra ya supone un análisis estadístico previo bastante complejo. El tamaño de muestra depende de una serie de factores que es muy importante entender bien:

a. De los errores que se esté dispuesto a cometer (Error de tipo 1 y Error de tipo 2). Al de tipo 1 se le suele denominar Error alfa y al de tipo 2 Error beta. Al valor 1-Error de tipo 2 (1-beta), expresado en porcentaje, es lo que se suele denominar la potencia del test. Como se decide igualdad versus diferencia o no relación versus relación, según lo que estemos trabajando y que, por lo tanto, es una decisión entre dos opciones, podemos cometer dos tipos de errores. Por ejemplo, en el caso de igualdad versus diferencia podemos decir que hay diferencia siendo iguales (Error tipo 1) o podemos decir que hay igualdad siendo diferentes (Error tipo 2). Lo que interesa es que estos dos errores sean pequeños, especialmente el primero. Es habitual, por ejemplo, que el primero se fije en 0.05 i el segundo en 0.2 (lo que supondría una potencia del 80%).

b. De la dispersión de las variables analizadas, usualmente expresada mediante la desviación estándar. El grado de dispersión que es algo que nos viene impuesto por la realidad estudiada influye en el tamaño de muestra necesario para decir cosas en ciencia. A mayor dispersión necesitamos más tamaño muestral para saber cómo es aquella realidad.

c. De la diferencia mínima que queramos detectar o del nivel de relación mínimo que queramos detectar. Esto es importante y complejo de establecer, en muchas ocasiones. Se trata de fijar el mínimo que se entiende como significativo, médicamente. Diferencia por debajo de la cual aunque viéramos una diferencia estadísticamente significativa sería irrelevante clínicamente. Por lo tanto, se pretende encontrar la muestra que necesitamos para que si acabamos viendo aquella diferencia mínima o relación mínima, o más, teniendo la desviación estándar especificada y, con el nivel de error fijado, podamos hablar de que se trata de una diferencia estadísticamente significativa.

Observemos un caso de declaración de muestreo en un artículo:

IMG_6860

IMG_6857

En este tipo de información donde se especifica el tamaño de muestra usado siempre se acaba concretando que ha sido en función de estos dos tipos de error, de la dispersión que se tiene y de la diferencia mínima o el grado de relación mínimo a detectar. Esto es una constante que conviene entender y saber aplicar.

Tenemos afortunadamente extraordinarios calculadores del tamaño muestral. Todos ellos, evidentemente, nos pedirán estos elementos para determinar la muestra que necesitamos.

Para más información consultar los siguientes artículos: La maquinaria de un contraste de hipótesisLa noción de potencia estadística,  Determinación del tamaño de muestra y Un ejemplo de la determinación del tamaño de muestra en Medicina.

Siempre tenemos en una investigación en Medicina si no todos los elementos comentados aquí, sí prácticamente todos. Es muy importante saberlos situar e interpretar. El análisis será mucho más ajustado y preciso si la mirada estadística es la adecuada.

Y, finalmente, ligado, por un lado, a la necesidad de aumentar el tamaño de muestra en Medicina y ligado también a la necesidad de evaluar la coherencia entre diferentes estudios análogos hecho por grupos de investigación distintos se ha desarrollado todo un nuevo repertorio de técnicas: el Metaanálisis.

Situación 60: Práctica (Temas 8 y 9)

Tenemos la siguiente base de datos de mujeres entre 15 y 35 años, 50 de ellas diagnosticas de anorexia nervosa y otras 50, controles, sin el diagnóstico de esa enfermedad. El objetivo es detectar factores de riesgo asociados a la anorexia. A las 100 mujeres se les ha pasado una encuesta anónima para, a partir de ella, poder establecer, mediante criterios que aquí no se comentan, una tendencia al perfeccionismo, si tenía una autovaloración negativa, si su contacto con los padres era bajo, si en sus padres había alguna historia de anorexia o bulimia y, finalmente, si había abuso de consumo de drogas. Las variables y sus codificaciones son las siguientes:

G=Grupo

a: anorexia

c: control (sin anorexia)

P=Perfeccionismo

1=sí

0=no

A=Autovaloración negativa

1=sí

0=no

B=Bajo contacto con los padres

1=sí

0=no

H=Historia de anorexia o bulimia parenteral

1=sí

0=no

D=Abuso de consumo de drogas

1=sí

0=no

S1=Suma de 1 ó más riesgos

1=La suma de las otras variables es 1 ó más

0=La suma de las otras variables es 0

S2=Suma de 2 ó más riesgos

1=La suma de las otras variables es 2 ó más

0=La suma de las otras variables es 0

S3=Suma de 3 ó más riesgos

1=La suma de las otras variables es 3 ó más

0=La suma de las otras variables es 0

La base de datos es la siguiente.

G P A B H D S1 S2 S3
a 1 1 0 1 1 1 1 1
a 0 0 1 0 1 1 1 0
a 0 0 0 0 0 0 0 0
a 1 1 1 1 0 1 1 1
a 1 1 1 1 0 1 1 1
a 1 1 0 1 0 1 1 1
a 0 1 0 0 0 1 0 0
a 1 1 1 1 0 1 1 1
a 1 1 0 1 1 1 1 1
a 0 0 0 0 1 1 0 0
a 0 0 0 0 0 0 0 0
a 1 0 0 1 0 1 1 0
a 0 0 1 0 0 1 0 0
a 0 0 0 0 0 0 0 0
a 1 1 1 0 0 1 1 1
a 0 0 1 1 1 1 1 1
a 0 0 0 0 1 1 0 0
a 1 1 1 1 1 1 1 1
a 0 0 1 0 0 1 0 0
a 1 0 0 1 0 1 1 0
a 0 0 1 1 0 1 1 0
a 0 0 0 0 0 0 0 0
a 1 0 0 1 0 1 1 0
a 0 0 0 0 1 1 0 0
a 1 1 0 0 0 1 1 0
a 0 0 0 0 0 0 0 0
a 0 0 0 0 0 0 0 0
a 1 1 0 0 0 1 1 0
a 0 0 0 0 0 0 0 0
a 1 1 1 1 0 1 1 1
a 1 1 1 1 1 1 1 1
a 0 0 1 0 0 1 0 0
a 1 0 0 1 0 1 1 0
a 0 1 0 0 1 1 1 0
a 1 1 0 1 0 1 1 1
a 0 1 1 0 1 1 1 1
a 0 0 0 0 0 0 0 0
a 1 1 1 1 1 1 1 1
a 1 1 0 1 0 1 1 1
a 0 0 0 0 0 0 0 0
a 1 1 0 1 0 1 1 1
a 0 0 0 0 1 1 0 0
a 0 0 0 0 0 0 0 0
a 1 1 1 1 1 1 1 1
a 1 1 0 1 0 1 1 1
a 0 0 0 0 0 0 0 0
a 1 1 1 1 1 1 1 1
a 0 0 0 0 0 0 0 0
a 0 0 0 0 0 0 0 0
a 1 1 1 1 1 1 1 1
c 0 0 0 0 0 0 0 0
c 0 0 1 0 0 1 0 0
c 1 0 0 0 0 1 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 1 1 0 0 0 1 1 0
c 0 1 0 0 0 1 0 0
c 0 0 1 0 0 1 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 1 0 0 1 0 1 1 0
c 0 0 0 0 0 0 0 0
c 0 0 1 0 1 1 1 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 1 0 1 0 1 1 1 1
c 0 0 0 0 0 0 0 0
c 0 0 1 0 1 1 1 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 1 1 1 0 0 1 1 1
c 0 1 0 0 1 1 1 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 1 0 0 0 0 1 0 0
c 1 0 0 0 0 1 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 1 0 0 0 0 1 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 1 1 0 1 1 1 1
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 0 0 0 0
c 0 0 0 0 1 1 0 0
c 0 0 0 0 0 0 0 0
c 1 0 1 0 0 1 1 0
c 0 1 0 0 1 1 1 0
c 0 0 0 1 0 1 0 0

1. Comprobar si hay relación significativa entre la variable Grupo (anorexia frente a control) y cada una de las otras variables del estudio.

2. Calcular la V de Crámer para cada una de las relaciones.

3. Calcular la Odds ratio para cada una de las relaciones.

4. Interpretar los resultados.

Situación 59: Práctica (Tema 7)

Tenemos una base de datos de mujeres con el diagnóstico de anorexia nervosa. Las variables que tenemos son: la edad, los meses de amenorrea, la densidad ósea y el nivel de leucocitos en sangre. Codificadas así:

E=Edad (años).

A=Amenorrea (meses).

D=Densidad ósea (g/cm2)

L=Leucocitos (cél/microL)

E A D L
16 5 0.70 4170
17 11 0.65 3630
25 13 0.60 2990
28 14 0.54 2530
23 11 0.57 2832
24 8 0.68 3914
18 9 0.68 3927
19 9 0.71 4234
23 17 0.54 2573
22 18 0.53 2458
28 12 0.57 2897
32 14 0.59 2917
18 11 0.55 2584
24 8 0.67 3711
16 9 0.72 4204
18 15 0.53 2362
27 17 0.51 2283
28 13 0.57 2728
29 15 0.59 3020
33 16 0.55 2620
25 13 0.58 2877
17 19 0.49 2074
27 11 0.58 2806
23 10 0.60 3042
24 8 0.71 4800
26 9 0.72 4223
25 14 0.66 3773
30 14 0.61 3243
25 8 0.69 4200
23 13 0.65 3536
25 16 0.59 3065
22 12 0.70 4500
21 16 0.62 3291
22 17 0.52 2269
24 12 0.55 2600
26 17 0.51 2271
23 16 0.50 2100
21 18 0.47 1830
18 11 0.56 2704
17 8 0.73 4410
19 17 0.60 3079
23 14 0.67 3770
22 18 0.52 2209
25 11 0.60 2910
22 14 0.56 2699
21 17 0.53 2465
23 18 0.47 1861
21 11 0.67 3882
19 10 0.65 3563
18 8 0.72 3950

1. Calcular las correlaciones de Pearson entre las cuatro variables.

2. Construir un modelo de Regresión lineal simple con el que pronosticar el nivel de densidad ósea a partir de los meses de amenorrea de la paciente.

3. Construir un modelo de Regresión lineal simple con el que pronosticar el nivel de densidad ósea a partir de los valores de leucocitos de una paciente.

4. Valorar los resultados.

Solución Situación 57

1. Hacer una Estadística descriptiva de la variable IMC:

Los estadísticos más importantes son los siguientes:

IMG_8112

El Box-Plot es el siguiente:

IMG_8113

2. Comprobar el ajuste de la variable IMC a la distribución normal mediante la Asimetría estandarizada y la Curtosis estandarizada y resumirla apropiadamente:

En los datos de Estadística descriptiva del apartado anterior puede verse el cálculo de la Asimetría estandarizada y la Curtosis estandarizada de esta variable. Como puede verse una (la Asimetría estandarizada) está fuera del intervalo (-2, 2). Con uno que esté fuera de ese intervalo ya podemos considerar que el ajuste a la normalidad no es de la suficiente calidad.

Por lo tanto, a la hora de resumir la variable, la mejor opción sería: Mediana y Rango intercuartílico; o sea: 24 (23, 26).

3. Calcular y valorar las correlaciones entre las tres variables cuantitativas: Edad, IMC y TVdiaria. Calcular esas mismas correlaciones entre las tres variables cuantitativas en hombres y en mujeres por separado:

En el total de individuos las correlaciones de Pearson son las siguientes:

IMG_8114

En hombres:

IMG_8116

En mujeres:

IMG_8117

Como puede observarse entre Edad e IMC siempre hay correlación significativa, positiva y bastante grande en cuanto a magnitud. Entre Edad y TvDiaria hay correlación positiva significativa en el total y cuando se hace por sexos esta correlación sólo es significativa en las mujeres, no en los hombres.

4. Hacer una Estadística descriptiva de las variables Antidepresivos y Trabaja:

IMG_8118

IMG_8119

IMG_8120

IMG_8121

5. Construir un intervalo de confianza del 95% de la media de la IMC en hombres y uno en mujeres:

Veamos primero el de mujeres. La Estadística descriptiva de la variable IMC en mujeres es:

IMG_8125

Por lo tanto, un intervalo de confianza de la media del 95%, en mujeres, sería (24.14-2×0.4, 24.14+2×0.4)=(23.34, 24.94). Porque cogemos la media muestral y le restamos y le sumamos dos veces el error estándar (0.4).

Veamos ahora lo mismo pero en hombres:

IMG_8126

Por lo tanto, un intervalo de confianza de la media del 95%, en hombres, sería (25.72-2×0.41, 25.72+2×0.41)=(24.9, 26.54).