Archivo del Autor: estadisticallopis

Situación 89: Tres problemas de ANOVA

1. Se pretende evaluar la absorción acústica de dos materiales (M1 y M2) y de tres longitudes diferentes de unas noanofibras (C=Cortas, M=Medias y L=Largas) incorporadas a cada uno de esos materiales. El objetivo es usar la mejor combinación, si la hay, para aislar edificios cercanos a carreteras. Para ello se realiza un experimento combinando cada material con cada longitud de nanofibras. Los porcentajes de disminución del sonidos son los siguientes:

Captura de pantalla 2015-11-26 a las 7.18.40

Proponer el modelo y resolverlo.

2. Se quiere evaluar la reducción de la contaminación ambiental por hongos en salas hospitalarias mediante dos mecanismos de desinfección diferentes. Para ellos se toman dos salas diferentes, en un mismo hospital, pero dos salas de un nivel de contaminación similar. Se elige, al azar, en cada una de esas dos salas, tres zonas donde realizar la desinfección y la posterior toma de muestra. En cada zona se evalúan cuatro recuentos de hongos para evaluar la reducción de la concentración inicial. Los datos de reducción obtenidos son los siguientes:

Captura de pantalla 2015-11-26 a las 7.19.02

Proponer el modelo y resolverlo. Evaluar cuál es la probabilidad de que el Desinfectante 1 dé un valor por encima de 30.

3. Se quiere saber la contribución a la variabilidad que introducen tanto la toma de la muestra ante el paciente como la intervención de los operarios en el laboratorio en el análisis de un determinado parámetro del líquido cefalorraquídeo. Para ello se hace a un mismo paciente dos tomas de muestra y cada una de ellas se divide en 8 submuestras. Se eligen al azar 4 de los operarios que trabajan habitualmente en ese laboratorio. Cada operario realiza el análisis a dos  submuestras de cada una de esas dos muestras. Los resultados obtenidos son los siguientes:

Captura de pantalla 2015-11-26 a las 7.19.17

Estimar cuál es la variabilidad total. ¿Es razonable si sólo estamos dispuestos a admitir un error de ±3.5?

 

Solución Situación 88

Se trata claramente de un ANOVA de dos factores cruzados, uno fijo (la técnica) y el otro aleatorio ( el operario). La comprobación de la normalidad y de la igualdad de varianzas no permite estar bajo las condiciones del modelo:

Captura de pantalla 2015-11-24 a las 17.02.32

La tabla ANOVA es la siguiente:

Captura de pantalla 2015-11-24 a las 17.02.41

Observemos que al ser un ANOVA de factores mixtos (uno fijo y uno aleatorio) los cociente de cuadrados medios son los que aparecen en la tabla.

Hay significación tanto en los métodos como en el operario. No así en la interacción.

Los parámetros del modelo son:

Captura de pantalla 2015-11-24 a las 17.02.53

El cálculo de las componentes de la varianza se realizan así:

IMG_2536

Si ahora quisiéramos calcular la probabilidad de que la T1 ó la T2 dé valores por encima, por ejemplo, de 22, deberíamos ver con qué distribución normal debemos trabajar. La media la tomaríamos estimando la media de cada una de las dos técnicas y respecto a la varianza total hay dos opciones, como se puede ver: Considerar la de la interacción como 0 ó como el valor negativo que surge de la estimación. Me he inclinado por la primera opción, como puede verse a continuación:

Captura de pantalla 2015-11-24 a las 17.03.16

En la técnica 1 un 8,3% de valores serán mayores de 22 y en la técnica 2 un 67,7%.

 

Situación 88: Problema de ANOVA

Supongamos que queremos ensayar dos técnicas concretas diferentes (T1 y T2) para evaluar un determinado parámetro sanguíneo y queremos, además, ver cómo influye, en la variación del resultado, el operario. Para ello se toman tres operarios al azar entre  los muchos del laboratorio. Se toma una misma muestra y cada operario hace la medición con las dos técnicas haciendo dos réplicas. Los resultados son los siguientes:

IMG_2535

Estudiar si hay diferencias significativas entre ambas técnicas y si hay variabilidad significativa entre operadores.

Ver a qué modelo de ANOVA se ajusta la situación.

Estimar los parámetros del modelo.

Calcular la probabilidad de que la técnica 1 y la técnica 2, por separado, dé un valor por encima de 22 en una muestra con las características de la tomada.

 

 

Solución Situación 87

En una revista científica he detectado este error curioso. Calculan tres correlaciones con sus correspondientes p-valores. Pero se equivocan en el sentido del símbolo de mayor. Obviamente  debía constar el símbolo de menor.

Escribir esto es decir que no sabemos si esas tres correlaciones son o no significativas. Sería como decirle a un alumno, como información de la nota de un examen, que ha sacado más de un 1. Se quedaría, igualmente, con la duda de si ha aprobado o ha suspendido. De poco le serviría esa información.

Artículo 14: Physical activity and risk of coronary heart disease and stroke in older adults

 

Se trata de un artículo de la revista Circulation que los autores realizan este magnífico resumen que muestro a continuación:

Captura de pantalla 2015-11-12 a las 11.12.14

De nuevo una magnífica oportunidad para practicar con diversos conceptos estadísticos.

Me parece, además, una enorme oportunidad para ver la capacidad comunicativa que han conseguidos los autores a la hora de sintetizar la información.

Este artículo es una magnífica oportunidad, de nuevo, para ver la importancia enorme que tiene la Regresión de Cox y, por lo tanto, la Hazard ratio, en Medicina. Observemos también que se ha ajustado, para evitar confusores, con las variables expuestas abajo y a la izquierda de la tabla.

Artículo 13: A randomized trial of intensive versus standard blood-pressure control

Este un artículo donde básicamente se comparan dos procedimientos de control de la presión arterial y se comparan esos dos procedimientos a través de una serie de variables resultados. El Abstract es el siguiente:

Captura de pantalla 2015-11-11 a las 15.41.15

La estadística descriptiva de los dos grupos comparados es la siguiente:

Captura de pantalla 2015-11-11 a las 15.41.42

Captura de pantalla 2015-11-11 a las 15.41.55

La evolución a lo largo del tiempo de estos dos métodos de control es la siguiente:

Captura de pantalla 2015-11-11 a las 15.42.14

Finalmente, podemos ver cuáles son las Hazard ratio de las curvas de supervivencia comparadas:

Captura de pantalla 2015-11-11 a las 15.42.25

Podemos ver a continuación las funciones de riesgo con las que se calcula la Hazard ratio:

Captura de pantalla 2015-11-11 a las 15.42.37

Artículo 12: The relationship between sweetened beverage consumption and risk of heart failure in men

Selecciono este artículo como un interesante ejemplo de aplicación de la Regresión logística. El abstract es el siguiente:

Captura de pantalla 2015-11-09 a las 20.42.05

La estadística descriptiva de los grupos estudiados:

Captura de pantalla 2015-11-09 a las 20.42.32

La curva de supervivencia aplicada aquí como tiempo hasta insuficiencia cardíaca si es que se produce:

Captura de pantalla 2015-11-09 a las 20.42.47

Y finalmente el cálculo de la Hazard ratio:

Captura de pantalla 2015-11-09 a las 20.42.59

 

Artículo 11: One-year outcome following biological or mechanical valve replacement for infective endocarditis

El siguiente artículo es una comparación entre las prótesis valvulares mecánicas y biológicas. Es interesante para ver la Regresión de Cox.

El abstract es el siguiente:

Captura de pantalla 2015-11-08 a las 10.02.42

La Estadística descriptiva es la siguiente:

Captura de pantalla 2015-11-08 a las 10.03.13

Se han hecho diferentes regresiones de Cox a partir de las curvas de supervivencia hasta el año. Las hazard ratio son las siguientes:

Captura de pantalla 2015-11-08 a las 10.03.47

Recordemos que la Hazard ratio lo que hace el medir la relación de riesgos, en este caso de muerte, durante el primer año, en la variable estudiada. Para compararlo con la Odds ratio puede consultarse el artículo Odds ratio versus Hazard ratio.

Obsérvese una curiosidad: En Odds ratio y en Hazard ratio la significación suele darse en términos de intervalo de confianza no mediante un p-valor. De hecho, la información es redundante. Si el intervalo no contiene al 1 el p-valor será menor que 0.05 y si lo contiene el p-valor será mayor que 0.05. Aquí curiosamente nos dan las dos cosas. Puede observarse que cuanto más se acerca el intervalo al 1 más se acerca el p-valor al 0.05. En este estudio se han seleccionado únicamente las relaciones significativas, por eso ningún intervalo contiene al 1 ni ningún p-valor es mayor que 0.05.

Obsérvese la siguiente tabla de otro estudio también de endocarditis donde se puede apreciar perfectamente esta redundancia que comento:

Captura de pantalla 2015-11-08 a las 10.34.05

Y finalmente veamos las curvas de supervivencia de los dos tipos de prótesis:

Captura de pantalla 2015-11-08 a las 10.04.20

Y estas son las curvas de supervivencia con la que se calcula la Hazard ratio de prótesis biológicas respecto a mecánicas que es 1,298. Recordemos que la Hazard ratio es una relación basada en las funciones de riesgo. La biológicas tienen mayor riesgo de muerte y por eso su curva de supervivencia va por debajo. No confundirse con esto.