Archivo de la categoría: PROBLEMAS

Solución Situación 38

Se trata de un análisis con dos factores. Uno fijo (la forma de medida) y otro aleatorio (el factor medidor). Es por lo tanto un caso de ANOVA de dos factores a efectos mixtos. Un factor fijo cruzado con un factor aleatorio.

Debemos comprobar la normalidad de los residuos (con el test de Shapiro-Wilk). Debemos comprobar la igualdad de varianzas (con el test de Bartlett). Supongamos que ha sido comprobado y estamos bajo estas condiciones. De hecho, si miramos los datos, podemos comprobar que con muchas posibilidades se cumplirán esas condiciones. No hay ni aspecto de no normalidad, ni de heterogeneidad de varianzas, en cada uno de las ocho condiciones experimentales. Otra cosa sería que en algún grupo se vieran valores mucho más dispersos que en los otros, o una asimetría clara que hiciera pensar en un alejamiento de la distribución normal.

Si miramos los datos con atención podemos comprobar que hay una variabilidad residual, la que hay en cada una de las ocho condiciones experimentales. Una variabilidad residual que no es muy grande respecto a la que se aprecia en el conjunto de los datos.

Si miramos los datos veremos que los dos niveles del factor fijo (tipo de medida: fotoeléctrica o con cinta métrica) no presentan diferencias que parezcan muy relevantes.

Si miramos con atención los datos también podemos ver que los medidores sí que aportan una variabilidad considerable.

Y, finalmente, podemos apreciar, también, a simple vista, que no hay interacción: no parece que los resultados de un medidor cambien mucho si la medición la hace mediante un método u otro. El medidor que tiene tendencia a dar valores bajos los da bajos con ambos métodos. Y el medidor que tiende a dar valores altos los da altos con ambos métodos.

Veamos que todo esto está en consonancia con el análisis:

La tabla ANOVA es la siguiente:

IMG_6990

Comprobar que aquí los cocientes de cuadrados medios se han hecho tal como dispone el ANOVA de dos factores a efectos aleatorios. El factor fijo va dividido por la interacción y el factor aleatorio por el residuo.

El factor fijo, tipo de medida, no presenta diferencias significativas (p-valor=0.2582), como puede apreciarse también en los intervalos de confianza del 95%:

IMG_6992

El factor medidor, que es aleatorio, porque hemos elegido una muestra de alumnos para ver si, en general, el medidor introduce variabilidad, sí que es un factor significativo. No hace falta representar sus intervalos de confianza porque, al tratarse de una muestra de niveles, lo que nos interesa de esos alumnos es estimar la componente de la varianza que introduce el medidor en general.

Tampoco hay interacción. El gráfico de interacción también lo muestra:

IMG_6994

Aunque hay un ligero cruce de líneas entre el alumno 3 y 4 no se trata de una interacción significativa, como muestra el p-valor de 0.2021.

Los parámetros del modelo son la constante, el efecto del factor fijo, que no es significativo, y las tres componentes de la varianza: la de medidor, la de la interacción, que tampoco es significativa, y la residual.

Los valores de estos parámetros son:

IMG_6995

Este 1662.71 es el valor de la constante, la mu del modelo. La alfa1 sería -0.875 y la alfa2 sería 0.875. Pero esto es una estimación. Hemos de tener en cuenta que el contraste de hipótesis nos muestra que este efecto no es significativo.

Finalmente las componentes de la varianza. La estimación es la siguiente:

IMG_6997

La componente de la varianza residual es el valor del cuadrado medio residual de la tabla ANOVA; o sea, 5.5. Las demás se calculan, como puede verse, a partir de la esperanza de los cuadrados medios del factor Alumno y de la esperanza de los cuadrados medios de la interacción. Ver de nuevo el fichero ANOVA de dos factores a efectos mixtos.

Se trata de estimaciones. El de la interacción, como hemos visto antes, no es una componente significativa.

Todo ello confirma que, realmente, a partir de estos datos del experimento, la variabilidad de la medición de la altura, es fundamentalmente una variabilidad introducida por el medidor. Que los dos sistemas de medida evaluados presentan diferentes importantes, ni las propias repeticiones del medidor. La variabilidad es entre medidores. Se maneja de forma muy distinta al paciente, por parte del medidor, a la hora de poner en posición al paciente para medirlo.

Solución Situación 39

1d: El primer cuartil es 4 y el tercer cuartil es 8.5. Por lo tanto, el rango intercuartílico es 4.5. La mediana no es 9. Es 6.5.

2d: Siempre que tenemos un p-valor es que hemos realizado un Contraste de hipótesis. En este apartado se muestra un p-valor menor que 0.05, por lo que rechazaremos la Hipótesis nula. En un contraste de hipótesis el mecanismo siempre es el mismo: Hipótesis nula versus Hipótesis alternativa. Si el p-valor es superior o igual a 0.05 mantenemos la Hipótesis nula. Si el p-valor es menor que 0.05 entonces rechazamos la Hipótesis nula y aceptamos la Hipótesis alternativa.

El p-valor muchas veces se da simplemente como mayor o menor que 0.05. En el fondo es lo que básicamente nos interesa: Saber si debemos mantener la Hipótesis nula, previamente tomada como cierta, o si, por el contrario, debemos pasarnos a la Hipótesis alternativa. Por eso, en absoluto es cierto el apartado a.

El apartado b tampoco es cierto. Cuando una correlación es significativa sabemos inmediatamente si es positiva o negativa.

El apartado c también es incorrecto. El criterio de decisión es justo el contrario del que se especifica ahí.

3b: Para que el índice de Gini sea 0 todos los valores de la muestra deben ser iguales. En este caso la curva de Lorenz coincide con la diagonal y, por eso, el índice de Gini es 0. Y esto representa que la desviación estándar es también 0.

El valor máximo del coeficiente de Gini es 1, no 0.5.

El apartado c es incorrecto. Esa muestra nos daría un índice de Gini próximo a 1, no a 0.

Ni en el índice de Gini ni en la desviación estándar pueden tener valores negativos.

4c: En este apartado c, la correlación 0.3 es mayor que la correlación 0.5, sencillamente porque esta última no es significativa y, por lo tanto, debemos pensar que no tenemos argumentos para descartar que poblacionalmente la correlación no sea 0.

El apartado a es incorrecto porque una r=0.9 es una correlación con más magnitud que una r=0.5 pero para decir que sea más significativa deberíamos tener los p-valores, cosa que no tenemos.

La cantidad de correlación lo marca la magnitud. Por lo tanto, 0.5 no es mayor que -0.6.

El apartado d es incorrecto, también. Como ninguna de esas dos correlaciones es significativa, ambas correlaciones son 0 y, por lo tanto, ninguna es mayor que la otra. No tenemos información muestral suficiente, de momento, para decir cuál es mayor.

5d: Al tratarse de un intervalo de confianza de la media debemos calcular el Error estándar, que es 10/raíz(100); o sea, 1. Por lo tanto, un intervalo de confianza del 99.5 sería la media más menos 3 errores estándar; o sea, (47, 53).

Situación 39: Examen (Temas 1-5)

1. En la muestra (8, 9, 5, 3), ¿qué afirmación es cierta?

a) El primer cuartil es 8.5.

b) El tercer cuartil es 4.5.

c) La mediana es 9.

d) El rango intercuartílico es 4.5.

2. Si la correlación entre dos variables es r=0.56 (p<0.05), ¿qué afirmación es cierta?

a) No sabemos si la correlación es significativa porque no tenemos el valor exacto del p-valor.

b) La correlación es significa pero no sabemos si es positiva o negativa.

c) La correlación no es significativa porque el p-valor es menor que 0.05.

d) En este contraste de hipótesis hemos rechazado la Hipótesis nula y hemos aceptado la Hipótesis alternativa, por ser el p-valor inferior a 0.05.

3. ¿Qué afirmación entre las siguientes es cierta?

a) El índice de Gini es máximo cuando es 0.5.

b) Un índice de Gini de 0 equivale a una Desviación estándar también de 0.

c) La curva de Lorenz de la muestra (1, 1, 1, 1000) nos daría un índice de Gini muy próximo a 0.

d) En el índice de Gini, contrariamente a lo que sucede con la desviación estándar, podemos tener valores negativos.

4. ¿Qué afirmación es cierta?

a) r=0.9 es una correlación más significativa que una correlación r=0.5.

b) r=0.5 es una correlación mayor que r= – 0.6.

c) r=0.3 (p=0.003) es una correlación mayor que una r=0.5 (p=0.56).

d) r=0.6 (p=0.48) es una correlación menor que una r=0.7 (p=0.45)

5. Tenemos una muestra de tamaño 100 de una variable que se ajusta bien a una distribución normal. La media muestral es 50 y la desviación estándar es 10. ¿Qué afirmación es cierta?

a) Un Intervalo de confianza del 95% de la media sería: (49, 51).

b) Un intervalo de confianza del 95% de valores individuales de la variable sería: (40, 60).

c) Un intervalo de confianza del 95% de la media sería: (30, 70).

d) Un intervalo de confianza del 99.5% de la media sería: (47, 53).

Solución

Solución Situación 37

1. La respuesta correcta es la “d”. Porque no es cierto que la mediana siempre sea mayor que el primer cuartil. Un ejemplo: (1, 1, 1, 5). En esta muestra la mediana es 1 y el primer cuartil es también 1. Por lo tanto, puede que la mediana no sea mayor que el primer cuartil. Puede ser, en ciertas muestras, valores iguales, como sucede en ésta.

La respuesta “a” es correcta. Un ejemplo: (1, 1, 5, 5). Aquí rango y rango intercuartílico son iguales: 4.

La respuesta “b” también es correcta. Si la varianza es 1, la desviación estándar, que es la raíz cuadrada de la varianza, también es 1.

La respuesta “c” también es correcta. Un ejemplo: (1, 2, 2, 2, 2, 2, 2, 3). En esta muestra el primer cuartil y el tercer cuartil son iguales: 2.

2. Si ordenamos la muestra de menor a mayor tenemos: (-1, -1, -1, -1, 1, 1, 1, 1). Como no todos los valores muestrales son iguales la desviación estándar no es cero. Desviación estándar sólo es 0 en las muestras cuyos todos sus valores son iguales.

El rango es 2, no 1. Porque el máximo de la muestra es 1 y el mínimo es -1. Y 1-(-1)=1+1=2.

La media muestral y la mediana muestral son iguales porque valen 0 los dos descriptores muestrales.

La respuesta correcta es, pues, la respuesta “c” porque el primer cuartil vale -1 y el tercer cuartil vale 1 y, por lo tanto, el rango intercuartílico, que es tercer cuartil menos primer cuartil es igual al rango: 2.

3. Nuestra muestra tiene los siguientes descriptores: La media es 25. La mediana es 1.5. El rango es 97. Y la Desviación estándar no es cero porque para ser cero todos los valores de la muestra deberían ser iguales y esto no sucede. Por lo tanto, la respuesta correcta es  la “c”.

4. La respuesta correcta es la “d”.

La desviación estándar no puede ser negativa. Surge de un promedio de cuadrados, por lo que nunca puede ser negativa. El valor más bajo posible es 0, cuando todos los valores sean iguales.

La media no tiene por qué ser mayor que la mediana en toda muestra. Veamos una muestra en la que no esto no sucede: (1, 30, 30, 39). En esta muestra la media es 25 y la mediana es 30. Luego n ella la media no es mayor que la mediana, sino que es menor.

El rango no siempre es mayor que el rango intercuartílico. Lo que no puede es ser menor pero puede ser igual a él. Por esto la respuesta correcta es la “d” porque en ella se especifica que el rango es siempre mayor o igual al rango intercuartílico, cosa que es cierta por definición de rango y de rango intercuartílico.

5. La respuesta correcta es la “c”.

Las medias no son iguales. En la primera muestra es 2.5 y en la segunda es 6.5. Las medianas tampoco son iguales porque son los mismos valores que las medias: 2.5 y 6.5. Los percentiles 25 también son distintos. En la primera muestra es 1.5 y en la segunda es 5.5.

Las desviaciones estándar de ambas muestras son iguales. Esto sí. Observemos que tienen la misma dispersión. Respecto a sus respectivas medias muestrales (2.5 y 6.5) los valores de las dos muestras ocupan una posición relativa exactamente igual. Es esto lo que marca la dispersión de la muestra.

Situación 37: Preguntas de Estadística descriptiva

1. ¿Cuál es la afirmación incorrecta?

a. En una muestra el rango y el rango intercuartílico pueden coincidir.

b. En una muestra podría coincidir la varianza y la desviación estándar.

c. En una muestra el primer cuartil y tercer cuartil pueden ser iguales.

d. La mediana siempre es un valor mayor que el primer cuartil.

2. En la muestra (1, -1, 1, -1, 1, -1, 1, -1),

a. La desviación estándar es cero.

b. El rango es 1.

c. El rango intercuartílico es 2.

d. La media muestral y la mediana son diferentes.

3. En la muestra (0, 1, 2, 97)

a. La media es 1.5.

b. La mediana es 25.

c. El rango es 97.

d. La desviación estándar es 0.

4. ¿Cuál de las siguientes afirmaciones es cierta?

a. La desviación estándar puede ser negativa.

b. La media muestral siempre es mayor que la mediana.

c. El rango siempre es mayor que el rango intercuartílico.

d. El rango es siempre mayor o igual al rango intercuartílico.

5. En las muestras: (1, 2, 3, 4) y (5, 6, 7, 8):

a. Las medias son iguales.

b. Las medianas son iguales.

c. Las desviaciones estándar son iguales.

d. Los percentiles 25 son iguales.

Solución

Solución Situación 36

Se trata de una pregunta que creo debería estar mejor planteada, porque tal como está formulada puede llevar a dudar incluso a los propios profesionales de la Estadística. Voy a continuación a explicar el porqué. Creo, además, que seguir esta argumentación puede ayudar a solidificar conceptos esenciales en Estadística.

La respuesta correcta, a mi modo de ver, es la 2 (ANOVA). De hecho, si se entiende que se quiere comparar los cuatro grupos de pacientes que se han establecido es, de las cinco respuestas posibles, la única opción realmente factible porque las otras cuatro técnicas son técnicas de comparación de dos poblaciones y nosotros tenemos aquí cuatro poblaciones, cuatro grupos. La pO2 de los dos momentos temporales puede hacer pensar que estamos ante datos apareados pero si los valores de antes y después se restan estamos, entonces, ante una única variable: la variable resta, la variable cambio de pO2 entre antes y después del tratamiento con NO. Por lo tanto, visto así, tenemos cuatro grupos a comparar con muestras independientes. Si es que lo que se pretende en este estudio es comparar los cuatro tipos de pacientes para ver si el cambio de pO2 es el mismo o no entre ellos.

A veces, puede llevar a engaño, en estos tests, el problema del tamaño de muestra. Es éste un tema que suele llevar a muchas confusiones. Es verdad que se acostumbra a simplificar estableciendo una frontera habitualmente en un tamaño de muestra de 30, pero esto no es correcto.

Hay tests estadísticos que no dependen del tamaño de muestra porque si la muestra sigue una distribución normal ya podemos aplicar el test: es el caso de la t de Student o del ANOVA. Si no sigue la normalidad sí que aplicaremos tests no paramétricos: el test de Mann-Whitney o el test Kruskal-Wallis, pero no si el tamaño de muestra es menor de 30. Esto del tamaño de muestra es aplicable a tests donde la distribución del estadístico en el caso de ser cierta la Hipótesis nula es asintóticamente conocida y este asintóticamente quiere decir para tamaños de muestra grandes. Es el caso, por ejemplo, del test de la ji-cuadrado, por ejemplo, o del propio test Kruskal-Wallis. Cada test tiene, además, un tamaño de muestra a partir del cual se considera suficientemente grande como para considerar que ya se cumple la distribución teórica supuesta. El 30 es un número que funciona bastantes veces i por eso se toma muchas veces como frontera, pero no siempre es así.

Por lo tanto, en el caso que se plantea la única opción factible es el ANOVA y para aplicarse debería comprobarse la normalidad de la variable resta de la pO2 de cada una de las cuatro poblaciones y la homogeneidad (la igualdad) de varianzas de las cuatro poblaciones. Si se cumplen ambas condiciones se puede aplicar con tranquilidad el ANOVA, sino debería aplicarse el test de Kruskal-Wallis. Como no se da esta última opción la técnica a aplicar es el ANOVA.

Todo esto que digo es lo que a mí me parece más lógico a argumentar ante esta pregunta. Sin embargo, me cabe una duda. En ningún momento se está diciendo que se quiere comparar estos cuatro grupos. Se dice que se quiere comparar si ante el tratamiento con NO hay diferencias, no si esas diferencias son distintas según el grupo de pacientes considerados. Esto me hace pensar que tal vez quien ha puesto esta pregunta lo que pretende es decir que se han tomado cuatro grupos de pacientes con HTP de UCI tratados con NO porque esa es la realidad hospitalaria con la que se han encontrado, y que se quiere mirar el efecto de ese tratamiento a esos pacientes, pero en ningún caso se pretende evaluar la diferencia que pueda darse entre esos cuatro grupos. De hecho, puede ayudar a llevar a esta conclusión el que en ningún momento se diga que se quiere comparar esos cuatro grupos. Y, por el contrario, se dice que lo que se quiere ver es si hay diferencia en la pO2 entre antes y después del tratamiento.

Si esto fuera lo que pretendía el que ha puesto esta pregunta estamos ante datos apareados pero tenemos un problema: entonces hay dos respuestas posibles. El Test de Wilcoxon y el test de la t de Student de datos apareados son posibles. Deberíamos saber si la variable resta de pO2 en los 24 pacientes sigue o no la distribución normal. En absoluto debe pensarse que el ser la muestra de tamaño 24 (que es menor que 30) impide la aplicación de la técnica paramétrica (la t de Student de datos apareados), como he comentado antes. El test de la t de Student es un test exacto, no asintótico. Es exacto si se sigue la distribución normal. Por lo tanto, si el que ha puesto la pregunta está pensando en esto falta información para elegir entre estas dos opciones posibles.

Por lo tanto, para mí la pregunta necesitaría formularse mejor mediante dos opciones: 1) Dejar claro que se quiere ver si hay diferencias significativas entre la respuesta al NO según se pertenezca a un grupo u otro de esos cuatro pacientes. 2) Si lo que se quiere es ver únicamente si hay un cambio significativo en el pO2 después del tratamiento con NO en los pacientes con HTP en UCI, especificándose los cuatro tipos de pacientes únicamente a nivel informativo, debería concretarse si la variable resta se ajusta o no a la distribución normal porque si no se especifica tal cosa hay dos respuestas posibles.

Para leer cosas que complementen a lo visto aquí ver el Tema 14: Comparación de dos poblaciones.

Para ver otro ámbito en el que suele llevar a confusiones el tener un determinado tamaño de muestra en Estadística ver el artículo: La Estadística descriptiva en Medicina.

Situación 36: Una pregunta del MIR

En un ensayo clínico se pretende evaluar la respuesta al Óxido nítrico (NO) en niños con Hipertensión pulmonar (HTP). Se incluyeron 24 pacientes de la UCI, entre 1996 y 1997, que recibieron NO inhalado. Las indicaciones se categorizaron en 4 grupos: 1) Tratamiento con monitorización directa de la Presión arterial pulmonar (PAP). 2) Tratamiento sin monitorización directa. 3)  Con un nivel de presión mayor de 15 mmHg. 4) En uso preventivo. Se controlaron TA, PAP, gases en sangre antes y después, meta Hb, control ambiental NO cada 4h y ecocardio pre y post NO. En el análisis estadístico se compararon pO2 antes y después del NO. ¿Qué test se utilizó?

1. t de Student de muestras independientes

2. ANOVA

3. Wilcoxon

4. t de Student apareados

5. Mann Whitney

Solución

Solución Situación 33

Si se hace una selección entre las variables originales (las distintas asignaturas) y las dos componentes principales observamos que la que consigue una mejor relación con la variables sexo es la Historia. Es la que separa mejor ambas poblaciones.

Incluso si se hace un Stepwise con todas estas variables se acaba seleccionado la variable Historia, también, como mejor pronosticador.

En el siguiente gráfico aparece la relación del Sexo con la primera componente principal (la que agrupa las notas de letras) y la Historia. Como puede observarse la Historia consigue una relación con mayor pendiente, lo que indica que se segregan mejor los valores de un sexo y otro respecto a las notas de Historia.

IMG_6129

Observemos que viendo tanto la primera componente, como la variable Historia, las notas bajas de letras o de Historia son buenas pronosticadoras de Sexo Hombre. En cambio, notas altas de letras o de Historia son buenas pronosticadores de Sexo Mujer.

Solución Situación 35

1a: Hay dos correlaciones significativas: 0.6 y 0.2. Evidentemente, 0.6 es mayor que 0.2.

2a: Sólo una Odds ratio es significativa: 0.25. Las otras no son significativamente distintas de 1.

3c: El error estándar es 0.5 porque 10/raíz(400) es 0.5. Dos veces 0.5 es 1, que es lo que hay que restar y sumar a la media para construir un intervalo de confianza del 95%.

4b: Como -7 es igual a -5-2 y -3 es igual a -5+2, el intervalo que va de -7 a -3 es la media menos más una desviación estándar. Esto en la distribución normal significa un área de 0.68.

5d: La mediana no es 2, es 1.5.

 

Situación 35: Examen (Temas 1-9)

1. ¿Qué correlación es mayor?

a. r= 0.6 IC 95%: (0.3, 0.99)

b. r= 0.7 (p>0.05)

c. r= -0.7 IC 95%: (-0.99, 0.1)

d. r= 0.2 (p<0.05)

2. ¿Qué Odds ratio es mayor; o sea, cuál indica más relación entre dos variables dicotómicas?

a. 0.25 (p<0.05)

b. 2 (p>0.05)

c. 10 (p>0.05)

d. 15 (p>0.05)

3. Si una muestra de tamaño 400, que se ajusta bien a una distribución normal, tiene una media muestral de 40 y una desviación estándar de 10, un intervalo de confianza del 95% de la media poblacional sería:

a. (38, 42)

b. (0, 80)

c. (39, 41)

d. (35, 45)

4. En una distribución normal N(-5,2) el área que hay entre -7 y -3 es aproximadamente de:

a. 0.05

b. 0.685

c 0.95

d. 0.995

5. En la muestra siguiente (8, 1, 1, 1, 1, 2, 2, 10) no es cierto:

a. El rango es 9.

b. El rango intercuartílico es 4.

c. El máximo es 10.

d. La mediana es 2.

Solución