Archivo por meses: enero 2013

Solución Situación 15

IMG_4919IMG_4905

Explicaciones:

1. Una correlación incluso tan grande como 0.9 podría no ser significativa si el tamaño de muestra fuera muy pequeño. El Error estándar es una desviación estándar. Es la desviación estándar de una predicción. Y la Odds ratio es una medida de la relación entre dos variables cualitativas o entre una cualitativa y una cuantitativa.

2. Una Odds ratio nunca es menor que cero. La pendiente de una recta de regresión puede ser, evidentemente, positiva o negativa. Si el intervalo de confianza del 95% de una Odds ratio contiene al 1 se trata, entonces de una Odds ratio no significativa. Y una Odds ratio de 1 indica una no relación entre la variables que estemos relacionando.

3.El Kappa es un índice para evaluar el grado de concordancia entre dos observadores, no es una media del grado de relación entre variables cuantitativas. Si la r es significativa y positiva va asociada a una pendiente positiva, nunca a una pendiente negativa.Una r singnificativa puede ir asociada tanto a una pendiente positiva como negativa. Si un intervalo de confianza del 95% de la pendiente de una Regresión lineal simple no contiene al 0, como ocurre en el intervalo (0.5, 1.9) indica que la pendiente es significativa y si tenemos una pendiente significativa es porque tenemos una correlación r significativa.

4. El área desde -7 a -1 la podemos desglosar en dos zonas: Desde -7 hasta -3 se trata de la Media más menos 2 DE, que es 68.5. A esto hay que sumar el área que hay desde -3 hasta -1 que es 0.1575-0.025=0.1325, porque a la derecha de -3 el área es 0.1575 pero hay que restarle el área que hay a la derecha de -1, que es 0.025. Al final si sumamos 0.685 y 0.1325 tenemos un área de 0.8175, que con tres decimales es 0.817.

5.El Error estándar es 5/raiz(25) que es 1. Entonces la media más menos dos Errores estándar da el intervalo (48, 52).

6. Si se revisa el Tema que introduce a las técnicas de comparación queda claro que cuanta mayor dispersión tengamos en un estudio más dificultad tendremos para detectar diferencias. En cambio, con un mayor tamaño y con mayor diferencia entre las medias muestrales más posibilidades tendremos de detectar diferencias.

7. Si nuestro p-valor es igual a 0.0001 rechazamos la Hipótesis nula, no la aceptamos. La pregunta especifica que este p-valor es de un contraste cualquiera, ello no implica que no haya normalidad. Únicamente indicaría eso si el contraste fuera sobre la normalidad, pero no en general. Y ese valor de 0.001 no indica la probabilidad de equivocarnos al aceptar la Hipótesis alternativa. La probabilidad de equivocarnos aceptando la Hipótesis alternativa queda concretada por el nivel de significación elegido, para el contraste, inicialmente, antes de empezar el estudio, por ejemplo: 0.05. El p-valor nos sirve únicamente par ver si estamos por encima o por debajo de ese nivel de significación, no es una probabilidad de error. Si el contraste es sobre la Odds ratio y el p-valor es 0.0001 efectivamente rechazaremos la Hipótesis nula de que la Odds ratio poblacional es 1.

8.Si son variables continuas, como sucede en nuestro caso, si son muestras independientes, como evidentemente sucede también en nuestro caso y una de las dos muestras no es normal hay que hacer un Test de Mann-Withney para comparar dos poblaciones.

9.Si tenemos muestras, en Estadística, nunca podemos asegurar que una es mayor que otra, siempre hay una probabilidad de error, pero es que menos en nuestro caso donde no tenemos una diferencia significativa. La diferencia no es significativa, por lo tanto, nada de decir que la media B es mayor que la de A. Tampoco podemos decir que la media de B sea superior a la de A pero que nos falta tamaño muestral para confirmarlo. Falta tamaño muestral pero no para confirmar nada, sino para ver cuál es mayor porque en este momento no podemos decir nada. La afirmación correcta es decir que prácticamente seguro que serán diferentes pero con la información de que disponemos todavía no podemos decir cuál es mayor a nivel poblacional, porque la diferencia que vemos ahora es muestral y no es una diferencia significativa, como marca este p-valor de 0.45.

10. Un valor muestral y un valor poblacional tienen digamos naturaleza completamente distinta. El muestral es cambiante, cambia según la muestra, el poblacional es fijo, es un valor desconocido pero fijo. Es verdad que una mediana muestral se aproxima bien a la mediana poblacional si la variable estudiada sigue la distribución normal, y en general de hecho, pero esto no quiere decir que sean iguales. La normalidad de una variable significa que la mediana de una muestra sea igual a la mediana de la población. Si fuera así la Estadística sería infalible, claro. Tampoco se cumple si la media muestral es la media del primer y tercer cuartil.

Solución Situación 14

IMG_4901

IMG_4902

Explicaciones:

1. La cierta es la c, cuanta mayor correlación hay entre las variables independientes más colinealidad entre ellas y más aumenta el error estándar de las estimaciones (Ver Tema dedicado a la Regresión múltiple).

2. Como la Odds ratio en una Regresión logística es ea, donde a es el coeficiente que multiplica a la variable independiente estudiada, entonces si a<0 entonces  ea<1. Por lo tanto, la respuesta a es la correcta.

3. Una correlación significativa irá asociada a una pendiente positiva o negativa según sea la correlación positiva o negativa. La respuesta c es la correcta.

4. La respuesta correcta es la a. Si el intervalo del coeficiente es (-5, 7) esto indica que la Odds ratio puede tener valores positivos y negativos y que, por lo tanto, un intervalo de confianza de ella incluye al 1.

5. La c es la correcta. Si la correlación es 0.78 con un p-valor inferior a 0.05 evidentemente estamos ante una correlación significativa.

6. La respuesta d es la correcta. Ninguna de las tres es cierta. Ni es válida para la Regresión simple, porque precisamente lo que hace es seleccionar variables cuando tenemos dos o más variables independientes, ni nos da medianas, ni sirve para construir intervalos de confianza de la media.

7. La b es la correcta. Este intervalo de confianza de la Odds ratio incluye al 1, luego estamos ante una Odds ratio no significativa. Mantendremos la Hipótesis nula de OR=1.

8. Un valor de ji-cuadrado de 4.33 si no sabemos ni el tamaño de muestra, ni el número de filas, ni el número de columnas de las tabla de contingencias, no podemos saber si es grande o pequeño, no podemos hablar de significación. Falta información. La d es la correcta.

9. Un intervalo de confianza del 95% de la pendiente no incluye al cero, luego la pendiente es significativa. La pendiente y la correlación en una Regresión lineal simple van de la mano. La significación de una indica la significación de la otra. Estamos, pues, ante una correlación significativa. La respuesta correcta es la c. La b no, porque nos dice que la correlación es significativa, y esto no es así: como la pendiente es positiva la correlación también será positiva.

10. Cuando hablamos de una correlación mayor que otra hablamos siempre, primero, de que sea una correlación significativa, y, luego, en términos de valor absoluto. Observemos que la primera correlación queda descartada porque no es significativa. Entre las otras tres la que tiene un valor absoluto mayor es la correlación -0.56. La respuesta correcta es, pues, la b.

Test de McNemar

El objetivo es comparar dos proporciones en datos apareados, en datos que han sufrido dos tratamiento o dos condiciones que se quieren comparar. La situación es, pues, como la expresada en el siguiente gráfico, con el siguiente contraste de proporciones y con el estadístico de test siguiente:

IMG_4977

Para ver un ejemplo de su aplicación: Ejemplo

Planteamiento de situaciones para aplicar el ANOVA

1) Se quiere saber si existen diferencias entre tres localidades concretas (1, 2 y 3) en el peso del insecto Tribolium castaneum. Se recogen muestras de estas tres localidades, obteniéndose los siguientes resultados:

IMG_4924

Se quiere ver si hay diferencias significativas en cuanto al peso de este insecto entre las tres localidades.

1 bis) Se quiere saber si existen diferencias entre localidades en cuanto al peso del insecto Tribolium castaneum. Se recogen muestras de tres localidades elegidas al azar, entre las muchas donde se encuentra este organismo, obteniéndose los siguientes resultados:

IMG_4924

Se quiere ver si hay diferencias significativas en cuanto al peso de este insecto entre localidades.

2) De las siete posibles discordancias entre alelos de HLA se ha realizado un estudio del tiempo hasta el rechazo de un trasplante de riñón. Los resultados obtenidos son los siguientes:

IMG_4925

(Cada columna tiene en su cabecera el número de discordancias entre los seis alelos (de 0 a 6), debajo constan el tiempo hasta el rechazo, expresado en años)

¿Podemos decir que hay diferencias significativas entres los distintos niveles de discordancias?

3) Se ha realizado un estudio clínico para ver si las vitaminas A y E mejoran la resistencia de la mucosa ante la afonía. Para ello se han seleccionado 12 profesores con problemas de afonía y con un nivel de resistencia de la mucosa muy similar. Se han distribuido en cuatro grupos. Durante tres meses un grupo tomó placebo, otro sólo vitamina A, otro grupo sólo vitamina E y finalmente el cuarto grupo tomó vitamina A y vitamina E conjuntamente. Se midió un índice de resistencia de la mucosa que va del 0 al 100. Los resultados obtenidos fueron los siguientes:

IMG_4926

¿Qué conclusiones podemos obtener de estos datos?

4) El asma bronquial es una enfermedad alérgica cuya virulencia depende de la estación. Se desean comparar tres fármacos antihistamínicos A, B, C en las cuatro estaciones del año. Se toma una muestra de 48 personas con asma crónico de intensidad análoga, que se divide en 12 grupos, uno para cada fármaco y estación, a razón de 4 enfermos por grupo. Los resultados se evaluaron en una escala objetiva que iba de 0 a 100 y fueron los siguientes:

IMG_4927

¿Qué conclusiones podemos obtener de estos datos?

4 bis) El asma bronquial es una enfermedad alérgica cuya virulencia depende de la estación. Se desean comparar los fármacos antihistamínicos para ver si hay una variabilidad significativa entre ellos. Se elige una muestra de tres antihistamínicos (A, B y C). Se toma una muestra de 48 personas con asma crónico de intensidad análoga, que se divide en 12 grupos, uno para cada fármaco y estación, a razón de 4 enfermos por grupo. Los resultados se evaluaron en una escala objetiva que iba de 0 a 100 y fueron los siguientes:

IMG_4927

¿Qué conclusiones podemos obtener de estos datos?

5) En una planta de producción trabajan 50 empleados y hay 25 máquinas. Existen dos turnos de trabajo. Es muy importante la rapidez en la que se elaboran unas piezas. Se quiere valorar si existe diferencia en el tiempo de producción según empleado, según máquina y, también, se quiere saber si los empleados trabajan más o menos rápido según la máquina con la que trabajen. Se eligen tres empleados al azar y tres máquinas también al azar. Se mide el tiempo, en segundos, que tardan en elaborar tres piezas cada empleado en cada máquina. Los resultados son los siguientes:

IMG_4928

¿Qué conclusiones podemos obtener de estos datos?

6) Se quiere estudiar la contaminación por dióxido de azufre durante el verano en una zona del Montseny. El análisis se hace en tres días tomados al azar en el mes de Julio y tres días también tomados al azar en el mes de Agosto. En cada día designado se toman cuatro registros de la variable y los resultados son los siguientes:

IMG_4970

¿Qué podemos concluir a partir de estos datos?

¿Qué cambios se producirían en el planteamiento si los tres días de Julio y los tres de Agosto se han tomado buscando que fueran: uno soleado, otro parcialmente nuboso y otro completamente nuboso?

7) Los cigarrillos producen cantidades apreciables de monóxido de carbono. Cuando se inhala el humo del cigarrillo, el monóxido de carbono se combina con la hemoglobina para formar carboxihemoglobina. En un estudio reciente ( Carbon monoxide and exercise tolerance in chronic bronchitis and emphysema, Brit.Med.J. 283(1981) 877-880, Calvery,M.A. y otros) los investigadores deseaban determinar si una concentración apreciable de carboxihemoglobina reduce la tolerancia al ejercicio en aquellos pacientes que sufren de bronquitis crónica y enfisema. Se seleccionaron 7 pacientes y en un ambiente controlado, se les pidió que caminaran durante 12 minutos respirando cada una de las siguientes combinaciones gaseosas: aire, oxígeno,aire más monóxido de carbono y oxígeno más monóxido de carbono (respectivamente A,B,C,D). La cantidad de monóxido de carbono respirado fue suficiente para elevar la concentración de carboxihemoglobina de cada sujeto en 9%. Para controlar el consumo de monóxido de carbono, se pidió a los siete fumadores que dejaran de fumar 12 horas antes del experimento. Los datos representan las distancias caminadas por los sujetos (en m.) en los 12 minutos para cada condición experimental.

IMG_4929

Estudiar si las diferencias entre las mezclas gaseosas son significativas.

8) Se ha medido la longitud del ala en dos especies de Drosophilla : melanogaster y simulans, mantenidas en condiciones de laboratorio. Las mediciones se hicieron en poblaciones capturadas en dos áreas de interés especial Los resultados fueron los siguientes :

IMG_4930

¿Qué conclusiones podemos obtener de estos datos?

 9) Se desea comparar el efecto de dos fármacos antidepresivos concretos. Se eligen 4 hospitales concretos que también nos interesa comparar. Cada hospital ensaya sólo un fármaco. Dentro de cada hospital se eligen 5 pacientes al azar. Se mide el grado de efectividad del fármaco de acuerdo a una variable que recoge la mejoría del estado después de la administración del fármaco. Se considera normalidad para la variable observada y homocedasticidad. Los datos obtenidos son:

IMG_4931

¿Qué conclusiones podemos obtener de estos datos?

10) Se toman 15 exámenes al azar de una misma materia de las PAAU  y  se eligen, también al azar, 3 correctores. Estos 15 exámenes se dividen al azar en tres grupos de 5. De cada uno de estos exámenes se hace una copia. Después, cada grupo de cinco exámenes, con sus copias, se mezcla junto con 200 exámenes más que tiene que corregir cada corrector, de modo que cada corrector habrá corregido dos veces cada uno de los cinco exámenes seleccionados al azar para él, sin saberlo, evidentemente. Las notas que los profesores han proporcionado de los 15 exámenes seleccionados han sido las siguientes:

IMG_4932

¿Qué conclusiones podemos obtener de estos datos?

11) En una zona que ha padecido recientemente una fuerte contaminación se desea estudiar la concentración de un determinado elemento. Después de ciertos análisis se supone una media de alrededor de 30 unidades. Sin embargo, una concentración superior a 37 unidades supondría un tóxico letal para la fauna que entrara en contacto. Algún científico desplazado para el estudio opina que sólo un 1% de la zona puede presentar tal concentración. No contentos con dicha afirmación, deseamos realizar un experimento con el fin de contrastar las opiniones del científico. Para ello se toman muestras de 3 zonas tomadas aleatoriamente en la zona global afectada. De cada zona se toman muestras de 2 subzonas y se realiza análisis y contraanálisis, puesto que sospecha de una cierta variabilidad en la toma de la medida. Los datos obtenidos son:

IMG_4933

¿Qué conclusiones podemos obtener de estos datos?

12) Se ensayan tres tipos de motor de coche (A, B, C), con tres tipos de ruedas (P, Q, R) y con tres tipos de asfalto (M, N, O) para ver qué factor tiene una mayor influencia en  el consumo de un tipo de gasolina durante 100 km a una velocidad constante. Para ello si diseña un experimento en cuadrados latinos y se obtienen los siguientes resultados:

IMG_4934

¿Qué conclusiones podemos obtener de estos datos?

 13) Tenemos 30 alumnos que al final de sus estudios de primaria y antes de comenzar la ESO se les hace una prueba homologada de nivel de inglés escrito y de nivel de inglés oral. A continuación se distribuyen en tres grupos en un centro de bachillerato donde se va a realizar un experimento didáctico durante toda la ESO. Los primeros 10 (el grupo 1) van a un grupo Control donde realizarán la formación de inglés clásica en una asignatura anual de inglés cada uno de los cuatro cursos. El grupo 2 se integra en un grupo donde se realizan dos horas más semanales de inglés, pero mediante el método clásico. El grupo 3 se integra en un grupo donde cada año van a tener una asignatura (Biología, Física, Matemáticas, etc.) en inglés. Aunque en el centro son muchos los alumnos distribuidos de esta forma se ha hecho un seguimiento focalizado de estos 30 alumnos. (En realidad, esto se podría hacer con todos los alumnos pero lo supongo así para que el número de datos a manejar sea más pequeño y se pueda apreciar, mirando los datos, lo que las técnicas van mostrando).

Estos alumnos integrados en sus grupos respectivos van a ser sometidos a un examen de inglés oral al final de cada curso: IO1, IO2, IO3 e IO4.

De los 10 alumnos de cada grupo se han tomado 5 con un nivel de aprobado únicamente de primaria y otros 5 con un nivel de notable o sobresaliente de primaria. Son los dos grupos de la columna encabezada como Nivel.

Los datos son los siguientes:

Captura de pantalla 2015-10-01 a las 7.36.21

¿Qué conclusiones podemos obtener?

Test exacto de Fisher

El Test exacto de Fisher es un contraste de hipótesis muy interesante por sus muchas aplicaciones y porque es un muy útil escenario para aprender la lógica interna de un contraste de hipótesis.

Se aplica en las siguientes situaciones: 1) En la comparación de dos grupos respecto a una variable dicotómica. 2) En la valoración de la relación entre dos variables cualitativas dicotómicas cada una de ellas.

En ambos casos, que son equivalentes (son dos formulaciones distintas de lo mismo), los datos pueden organizarse en una tabla de contingencias de 2×2 ó mediante dos porcentajes a comparar, uno de cada grupo.

El primer caso se resuelve habitualmente con un Test de comparación de dos proporciones (Ver Herbario de técnicas y ver también el Tema dedicado a la comparación de dos poblaciones), el segundo caso se resuelve con un Test de la ji-cuadrado de tablas de contingencias. El problema que tienen ambos test es que necesitan de tamaños muestrales relativamente grandes.

El Test de comparación de proporciones, para funcionar bien, requeriría un tamaño muestral mínimo de 30 por grupo y que el producto del tamaño muestral por el tanto por uno esperado  bajo la hipótesis nula del suceso que se analiza sea superior o igual a 5 en ambas muestras (esto último suele enunciarse como que el valor esperado por grupo es de 5 observaciones del suceso analizado, como mínimo). Un ejemplo: Tenemos una muestra de 50 por cada uno de los dos grupos. En una muestra tenemos sólo un caso del suceso analizado y en la otra tenemos 4 casos. Si la hipótesis nula fuera cierta esperaríamos ver 5 casos de cada 100 y los mismos en cada grupo; o sea, un 0.05 por uno. Si multiplicamos este 0.05 por 50 nos da 2.5 sucesos esperados por grupo. Como es menor que 5 estamos fuera de las condiciones de aplicación de este Test de comparación de proporciones y deberíamos aplicar el Test exacto de Fisher.

El Test de la ji-cuadrado en una tabla 2×2 requiere que las cuatro celdillas tengan más de 5 observaciones esperadas. Ambos Test utilizan un estadístico de test cuya distribución, bajo la Hipótesis nula, es la que suponemos que es, siempre y cuando se cumplan estos requerimientos en cuanto al tamaño muestral.

Por lo tanto, si tenemos muestras pequeñas, muestras que no cumplen estos requerimientos muestrales, tanto en un caso como en el otro, debemos decantarnos por la alternativa que nos ofrece este Test exacto de Fisher.

Supongamos el siguiente problema: Estamos comparando dos grupos de individuos y mirando cuántos, en cada grupo, tienen una determinada enfermedad y cuántos no la tienen. Y supongamos que tenemos los siguientes datos:

IMG_4955

Observemos que los datos quedan organizados en forma de tabla de contingencias y que, al mismo tiempo, puede verse como un problema de comparación de dos proporciones, de dos porcentajes.

El Test exacto de Fisher se basa en la distribución hipergeométrica. Esta distribución es la que sigue una situación en la que hay N de posibles observaciones, distribuida en dos tipos distintos, en proporción r y N-r y donde realizaremos n observaciones sin repetición. La incertidumbre es ver cuántas de estas n observaciones que tenemos son de un tipo o del otro.

La distribución hipergeométrica paradigmática es la de extracciones de una urna con bolas (N) de dos colores en una determinada proporción (r y N-r), de la que se extraen bolas (n) sin reemplazamiento y se pretende ver la probabilidad de una determinada combinación (Ver en la sección de Complementos la explicación de la distribución).

Veamos ahora, a partir de los datos obtenidos, qué valores posibles hubiéramos podido tener que nos mostraran aún más diferencias entre los dos porcentajes o un patrón donde pudiéramos ver mayor relación entre grupo y enfermedad, respetando las sumas por filas y por columnas:

IMG_4956

Observemos que la primera es nuestra tabla y la siguiente es la única tabla posible que agudiza más las diferencias o la relación entre las variables en el mismo sentido del visto en la muestra inicial.

Si los datos que tuviéramos fueran estos otros:

IMG_4957

Ahora las tablas posibles más extremas que la vista, y que respetaran las sumas por filas y por columnas, serían las siguientes:

IMG_4958

Ahora tenemos tres tablas para evaluar.

El Test exacto de Fisher hace precisamente esto: buscar, a partir de unos datos, qué combinaciones serían más extremas que la vista. Extremas en cuanto a detectar más diferencia entre los porcentajes o más asociación entre los valores de las dos variables cualitativas que estamos relacionando.

A partir de este listado el Test calcula las probabilidades de cada una de esas situaciones: de la que tenemos y de las más extremas, mediante la distribución hipergeométrica.

Si es un Test bilateral; o sea, que contrastamos igualdad de porcentajes versus diferencia, o no relación versus relación, multiplicaremos por dos esa suma de probabilidades para tener el p-valor. Si el Test es unilateral; o sea, que estamos contrastando igualdad versus menor o versus mayor, o estamos contrastando no relación versus relación en un sentido determinado (con una Odds ratio menor o una Odds ratio mayor que 1, pero únicamente uno de los dos lados), el p-valor será sólo el de la suma de las probabilidades de las tablas extremas construidas, siempre, claro, hacia el lado donde tiene más peso la Hipótesis alternativa.

Al construir las tablas extremas, y calcular la suma de sus probabilidades, lo que hacemos es ver, de alguna forma, la posición que ocupa lo que vemos respecto a lo que podríamos ver bajo la Hipótesis nula. Entre todo lo que podríamos ver, si fuera cierta la Hipótesis nula, estamos valorando cuál es la probabilidad de ver lo que vemos más lo más extremo que tendría más posibilidades de verse bajo la Hipótesis alternativa. Esto es el p-valor. Y aquí está, en esencia, la noción de p-valor que manejamos en Estadística.

Los software estadísticos calculan estas probabilidades y nos proporcionan el p-valor según este criterio.

Veamos cómo calcularíamos estas probabilidades en las dos situaciones vistas anteriormente. Si aplicamos la función de densidad de la Distribución Hipergeométrica tendremos las siguientes probabilidades de cada una de las tablas mostradas anteriormente en las dos situaciones vistas:

IMG_4959

IMG_4960

Se calcula tanto el p-valor para el test unilateral como para el bilateral. El unilateral se entiende, claro, hacia el lado donde ya está inclinado el valor muestral.

Para calcular estos valores se dispone de tablas de esta distribución. Se trata de tablas muy largas, debido a que se trata de una distribución con tres parámetro y esto complica la elaboración de tablas, evidentemente.

En la siguiente tabla se muestra un pequeño fragmento de la tabla de la Hipergeométrica. Es un fragmento necesario para visualizar nuestros cálculos. Se trata de una N=15 porque el total de observaciones es 15. Como tenemos 6 y 9 valores entre enfermos y no enfermos la r será igual a 6, y la n será igual a 10, puesto que el grupo 1 está formado por 10. La tabla es de probabilidades acumuladas desde x=0 hasta el valor de interés. Por lo tanto, en nuestro caso, la primera suma de probabilidades que era 0,047 la observamos justo en el lugar de la tabla marcado en color azul. La segunda suma correspondiente al segundo caso, la suma de probabilidades (0,2868) la encontramos en el lugar marcado con el color rojo:

IMG_4961

El Test exacto de Fisher en Medicina

El Test exacto de Fisher, explicado con detalle en el Herbario de técnicas, es aplicado muy frecuentemente en Medicina.

Si son dos grupos los que se deben comparar para ver la diferencia de proporciones de una variable dicotómica o si lo que se quiere es ver la relación entre dos variables dicotómicas, y el tamaño muestral es pequeño, se impone el uso de esta técnica. Es frecuente encontrarse con pocos datos en Medicina y, por lo tanto, con la necesidad de aplicar este Test.

Veamos un caso interesante de aplicación de este Test en un artículo reciente y, además, en un artículo espectacular, sin lugar a dudas.

El artículo está publicado en Enero de 2013 en el New England Journal of Medicine y se titula Duodenal Infusion of Donor Feces for Recurrent Clostridium difficile.

La tabla de datos fundamental del estudio es la siguiente:

IMG_4962

Voy a aplicar el Test exacto de Fisher a uno de los casos que aparecen en este gráfico: a los datos comparativos de los pacientes tratados con «Infusión de donante de heces global» respecto a los tratados con Vancomicina. A partir de la información que nos dan podemos deducir que la tabla de 2×2 que tienen en este caso es la siguiente:

IMG_4965

Estamos en un caso de aplicación del Test. Tenemos dos grupos: Pacientes tratados de dos formas distintas. Y una variable dicotómica: Se curan sin recidivas versus Otros casos.

Y si aplicamos el Test exacto de Fisher (Ver Herbario de técnicas) hemos de proceder buscando todas las tablas que, respetando el recuento de la suma por filas y por columnas, se decanten más hacia la Hipótesis alternativa, extremen más las diferencias. Veamos el cálculo:

IMG_4966

Únicamente son dos las tablas a condiserar: la de los propios datos y la de debajo.

Como no he visto tablas para una N=29, he hecho los cálculos basándome en la Distribución Hipergeométrica (Ver Complementos).

El p-valor se calcula sumando estas dos probabilidades dando 0,000584. Como dice en el artículo se trata de un p-valor inferior a 0,001. Diferencias, pues, significativas.

Este es un caso claro de test unilateral, por eso no multiplicamos por 2 esa probabilidad, como haríamos si el test fuera bilateral. Observemos que se ensaya un método sorprendente: la infusión de heces de donante a un paciente con infección por Clostridium difficile. Únicamente tiene sentido una Hipótesis alternativa que vaya a favor del nuevo método. Es por esto que el test es unilateral. Si hacemos una prueba alternativa como ésta es para mejorar el tratamiento convencional.

La distribución hipergeométrica

La distribución hipergeométrica es la distribución que sigue la siguiente situación de incertidumbre: Tenemos N posibles observaciones, distribuidas en dos tipos distintos, en proporción r y N-r, y donde realizaremos n observaciones sin repetición. La incertidumbre es ver cuántas de estas n observaciones que tenemos son de un tipo o del otro.

La distribución hipergeométrica paradigmática es la de extracciones de una urna con bolas (N) de dos colores en una determinada proporción (r y N-r), de la que se extraen bolas (n) sin reemplazamiento y se pretende ver la probabilidad de una determinada combinación.

La función de densidad y la función de distribución de la distribución hipergeométrica es la siguiente:

IMG_4953

Veamos un ejemplo con la situación paradigmática de urna y bolas de dos colores:

IMG_4967

Existen tablas para valores concretos de N, de r y de n. Pero ocupan muchas páginas por la necesidad de ir combinando tres parámetros al mismo tiempo.

Para ver cómo funcionan las tablas aquí va la primera página. En ella se contemplan las situaciones en las que N es igual a 2, a 3, a 4, a 5 y a 6. El 7 no está completo:

IMG_4968

Debe tenerse en cuenta que son tablas donde aparece el acumulado.

Para practicar un poco cuelgo el fragmento de la tabla donde poder calcular las probabilidades del ejemplo anterior. Nuestro caso tenía los siguientes parámetros: N=10, r=4 y n=4. Está enmarcada la zona de las probabilidades buscadas, para x=0, x=1, x=2, x=3 y x=4:

IMG_4969

Para x=0, como puede verse, la probabilidad es 0,0714. Para x=1 hay que restarle a 0,4524 el valor de x=0. Será pues: 0,4524-0,0714=0,381. Para x=2 hay que restarle a 0,8810 el valor de x=1. Sólo este, porque en él ya está contemplado el valor x=0. Será pues: 0,8810-0,4524=0,4286. Y así podemos ir obteniendo las probabilidades de cada una de las posibles situaciones, obteniendo los valores vistos en el ejemplo anterior.