Archivos Mensuales: junio 2013

Soluciones a las situaciones de comparación de dos poblaciones

Es importante, muy importante, ver que en los dos documentos donde se plantean Situaciones de comparación de dos poblaciones, tanto en Ciencias de la salud como en Ciencias humanas, los datos son los mismos. Es importante ver el paralelismos entre los 8 problemas, porque se trata de 8 situaciones distintas pero que nos llevan a los mismos datos y a las mismas soluciones estadísticas. Veamos esas soluciones (Es muy necesario tener en todo momento presente el cuadro de técnicas que lo encontraréis en el tema dedicado a la comparación de dos poblaciones):

1. La variable es dicotómica y las muestras son, en este caso, independientes. Como el tamaño de muestra es superior a 30 y el valor esperado por grupo es superior a 5 podemos aplicar el test de comparación de proporciones. Tenemos 14 valores de 50 en un grupo y 5 de 50 en el otro. Como el tamaño de muestra es el mismo en ambos grupos, si fuese cierta la Hipótesis nula de igualdad de proporciones esperaríamos ver 9,5 observaciones de 50 en cada grupo. Como 9,5 es mayor que 5 estamos en las condiciones de aplicación del Test de proporciones. Los resultados son los siguientes:

IMG_5835

2. La variable es dicotómica y las muestras son independientes. Como el tamaño de muestra es inferior a 30 aquí conviene usar el Test exacto de Fisher. El resultado es el siguiente:

IMG_5845

3. La variable es dicotómica y las muestras son, ahora, relacionadas. El Test a aplicar es el Test de McNemar. El resultado de aplicarlo es el siguiente:

IMG_5846

Pero observemos que si aplicáramos mal el test, si aplicáramos incorrectamente un Test de proporciones el resultado sería esto otro:

IMG_5835

4. Variables continuas, ahora, muestras independientes. Hace falta comprobar si hay normalidad y si la hay (que la hay, en este caso) hace falta comprobar la igualdad o no de varianzas o de desiviaciones estándar. Si hay igualdad, como sucede, efectivamente, debe aplicarse el Test de la t de Student de muestras independientes y varianzas iguales. Todos estos pasos se exponen a continuación:

IMG_5836

5. Variables continuas, muestras independientes. Hace falta comprobar si hay normalidad y si la hay (que la hay, en este caso) hace falta comprobar la igualdad o no de varianzas o de desviaciones estándar. Si no hay igualdad, que es lo que sucede en este caso, debe aplicarse el Test de la t de Student de muestras independientes y varianzas desiguales. Todos estos pasos se exponen a continuación:

IMG_5837

6. Variables continuas, muestras independientes. Hace falta comprobar si hay normalidad y si alguna de las dos muestras no se ajusta a la distribución normal (que es lo que sucede en este caso) pasamos ya directamente a aplicar el Test de Mann-Withney. Todos estos pasos se exponen a continuación:

IMG_5855

7. Variables continuas, muestras relacionadas. En primer lugar hay que comprobar la normalidad de la variable Diferencia de las dos. Si hay normalidad, que es lo que sucede en este caso, pasamos a aplicar el Test de la t de Student de datos apareados. Veamos los pasos comentados:

IMG_5839

8. Variables continuas, muestras relacionadas. En primer lugar hay que comprobar la normalidad de la variable Diferencia de las dos. Si no hay normalidad, que es lo que sucede en este caso, pasamos a aplicar uno de los dos siguientes test: el Test de los signos o el Test de Wilcoxon. Veamos los pasos comentados:

IMG_5840

Situaciones de comparación de dos poblaciones en Ciencias humanas

1) Se ha pedido la definición de la palabra “Enfiteusis” a 50 estudiantes de Filología y a 50 personas no universitarias.  La muestra se ha tomado igualando edades y proporción de sexos. Entre los estudiantes de Filología 14 de los 50 han definido correctamente la palabra, entre los no universitarios sólo 5 de 50 lo han hecho correctamente. A partir de este estudio y de esta muestra, ¿se puede decir que hay diferencias, estadísticamente significativas, entre estas dos poblaciones de personas en cuanto al conocimiento del significado de esta palabra?

2) Se ha preguntado a un grupo de mujeres y de hombres si estaban de acuerdo con una determinada acción de política lingüística llevada a cabo por el gobierno. Entre las mujeres 5 de 20 personas estaban de acuerdo con la iniciativa, entre los hombres sólo 3 de 20 estaban de acuerdo con la iniciativa. ¿Se puede decir que hay diferencias significativas entre sexos en cuanto a la opinión sobre tal iniciativa?

3) Un centro que da certificados oficiales de inglés y que pretende elaborar dos exámenes distintos, pero equivalentes, realiza el siguiente estudio piloto. A un grupo de 100 estudiantes de inglés se les ha examinado mediante los dos modelos de examen. Cada estudiante hacía, pues, los dos exámenes. En primer lugar, a 50 de ellos se les hacía el examen A y a los otros 50 se les hacía el examen B. Una vez hecho el examen se les dejaba, a todos ellos, dos horas de descanso y, luego, cada alumno hacía el otro modelo de examen que no había hecho antes. Cada examen se evaluaba entre el 0 y el 10 pero, en realidad, se quería ver si la nota era o no superior a 5 porque lo que se quería ver era si el porcentaje de aprobados sería el mismo, o no, con los dos modelos de examen. Los resultados obtenidos fueron los siguientes: El examen A lo aprobaron el 60% y el B el lo aprobaron el 48%, con este desglose por subgrupos de valores de la variable:

IMG_5825

¿Se puede decir que el porcentaje de aprobados mediante un examen era distinto significativamente al del otro examen?

4) Se ha realizado un estudio pedagógico donde se quiere comparar la asimilación de unos conceptos mediante dos métodos distintos. Para ello se toman, al azar, 18 alumnos de 4º de ESO y se dividen en dos grupos de 9 cada uno. Durante dos semanas se les enseña un tema mediante las dos formas distintas que se quiera comparar. Una vez finalizado el proceso se les pasa, a todos ellos, un examen común sobre ese tema. Los notas son las siguientes:

IMG_5852

¿Podemos decir que hay diferencias significativas en cuanto a las dos formas de plantear el tema en cuanto al nivel conseguido por los alumnos?

5) Estamos comparando la riqueza conceptual de un grupo de alumnos de 3º de Primaria según sean niños o niñas. Para ello tomamos a 8 niños y a 7 niñas y durante 10 minutos deben anotar palabras relacionadas con el mundo de la Justicia. Una vez pasado el tiempo el número de palabras anotadas que realmente tenían que ver con este mundo eran los siguientes:

IMG_5828

¿Podemos afirmar que las diferencias son estadísticamente significativas?

6) Hemos tomado 14 alumnos al azar de bachillerato (8 chicos y 6 chicas) que tenían WhatsApp y hemos preguntando en cuántos grupos estaban inscritos. Los resultados obtenidos son los siguientes:

IMG_5853

¿Podemos afirmar que las diferencias son estadísticamente significativas?

7) En una facultad universitaria se ha realizado un examen de nivel de conocimientos básicos de inglés en el primer curso y, después, en cuarto, al acabar los estudios. El estudio se ha hecho con los mismos alumnos que fueron elegidos al azar y se les examinó el primer curso y cuando llegaron a cuarto curso. Se trataba de ver si durante sus estudios universitarios los alumnos aparcaban su formación de inglés, la intensificaban o el nivel de conocimientos quedaba estable. Los resultados fueron los siguientes: 

IMG_5831

¿Qué conclusiones podemos sacar de este estudio?

8) Hemos seleccionado a 9 alumnos de bachillerato para realizar el siguiente estudio. La primera semana del primer curso se le pide que anoten palabras que formen parte del campo semántico de “Miopía”. Hacemos lo mismo, con los mismos alumnos, y con la misma palabra, la última semana del segundo curso. Los resultados obtenidos son los siguientes:

IMG_5833

¿Podemos afirmar que hay diferencias estadísticamente significativas entre los dos tiempos?

Soluciones

Solución Situación 31

1c: Sólo hay dos correlaciones, de las cuatro, significativas. De las dos la mayor es la que tiene mayor magnitud; o sea, mayor valor absoluto. En este caso la r=-0.7

2a: Sólo dos Odds ratios son significativas. Una OR es de 0.25 y la otra de 2. Pero en el ámbito de las Odds ratios 0.25 indica más relación que 2. Está más alejado del 1. El 0.25 por un lado del 1 es equivalente a 4 por el otro lado (1/0.25=4). Y 2 por un lado del 1 es equivalente a 0.5 por el otro lado (1/2=0.5).

3b: A la izquierda del 8 en la muestra hay dos valores de los cinco que en total constituye el tamaño muestral. Y 2 de 5 supone un 40%.

4c: Es una comparación de una variable dicotómica en muestras independientes con un tamaño de muestra inferior a 30, por lo tanto debemos aplicar el Test exacto de Fisher.

5c: El Test de Shapiro-Wilk es un test de bondad de ajuste a una normal. La muestra sigue un ritmo de normalidad y, además, el tamaño de muestra es pequeño (más a favor, pues, de la Hipótesis nula). Como la Hipótesis nula de este test es “Normalidad” el p-valor más lógico es un valor superior a 0.05.

6c: Para saber el p-valor, que es lo que necesitamos para valorar la significación de esta diferencia de proporciones, en este caso únicamente faltan los tamaños muestrales puesto que las desviaciones estándar las sabemos: están en el propio porcentaje muestral observado. Recordemos que en una variable dicotómica la varianza es p(1-p). Puede observarse en el test de comparación de dos proporciones que con los datos del problema sólo nos faltan los dos tamaños muestrales para saber su valor y poder, así, realizar el test y valorar la significación de esa diferencia.

7b: La sensibilidad de un método diagnóstico es la probabilidad de que un enfermo dé positivo en tal prueba diagnóstica. Por lo tanto, si una prueba tiene una sensibilidad del 95% significa que tiene un 5% de error, y su error será no dar positivo a pacientes que tienen la enfermedad. Por lo tanto, se tratará de falsos negativos.

8b: Si quisiéramos tener un error de tipo 2 de 0.1 significaría que la potencia sería del 90%, lo que significaría subir la potencia. Esto se logra aumentando el tamaño de muestra.

9a: Si no rechazamos la Hipótesis nula no podemos cometer el error de tipo 1. Con esta diferencia tan grande de porcentajes entre ambas muestras, al no rechazar la Hipótesis nula lo más probable es que estemos cometiendo un error de tipo 2; o sea, que tengamos baja potencia.

10c: Que el p-valor sea 1 no nos indica que las medias de las poblaciones sean iguales, nos indica que no podemos rechazar que son iguales, pero en absoluto nos afirma que sean iguales. Nos indica que no tenemos suficiente información como para decir cuál es mayor y cuál es menor. Es como en un partido de baloncesto: sabes que uno de los dos equipos va a ganar, pero mientras no tienes una situación en la que puedas decir, con poca probabilidad de equivocarte, quién va a ganar, vas a mantener la hipótesis de empate, aunque sepas que, en realidad, no es cierta. Por otro lado, un p-valor igual a 1 también nos indica que las medias muestrales son iguales porque en el estadístico de test el numerador consiste en la diferencia de medias y si ésta es 0 el p-valor es 1. Respecto a la afirmación “a” es la definición de p-valor.

Situación 31: Examen (Temas 1-14)

1. ¿Qué correlación es mayor?

a. r= 0.8 IC 95%: (-0.3, 0.99)

b. r= 0.5 IC 95%: (0.4, 0.6)

c. r= -0.7 IC 95%: (-0.8, -0.6)

d. r= 0.9

2. ¿Qué Odds ratio es mayor; o sea, cuál indica más relación entre dos variables dicotómicas?

a. 0.25 (p<0.05)

b. 2 (p<0.05)

c. 10 (p>0.05)

d. 15 (p>0.05)

3. Tenemos una muestra como la siguiente: (5, 7, 9, 12, 16). Y obtenemos un valor de un nuevo individuo que queremos situar relativamente respecto a los demás. Ese valor es 8. Ese valor tiene un percentil:

a. 8

b. 40

c. 60

d. Necesitamos una muestra más grande para tener el percentil

4. Estamos estudiando dos anestésicos mediante la evaluación del dolor postoperatorio de pacientes que son operados de apendicitis. Medimos el valor de dolor a las 24 horas en 20 pacientes operados mediante el anestésico A y 20 pacientes operados con el anestésico B. La variable dolor la medimos del 0 al 10 pero la transformaremos en valores: “Mayor o igual a 5” y “Menor que 5”. El Test a aplicar será:

a. El Test de proporciones.

b. El Test de McNemar.

c. El Test exacto de Fisher.

d El Test de los signos.

5. En una muestra como la siguiente: (4.2, 8.1, 9.2, 9.3, 10.1, 10.4, 10.5, 11.2, 12.4, 13.1, 13.4, 15.2, 18.5) si aplicamos un Test de Shapiro-Wilk el p-valor más lógico que podemos obtener es:

a. 0.00002

b. 0.03

c. 0.78

d. El Test de Shapiro-Wilk no proporciona un p-valor.

6. Queremos hacer un Test de comparación de proporciones para comprobar si el porcentaje de mujeres estudiantes de medicina es distinto significativamente al porcentaje de mujeres que estudian matemáticas. Para ello cogemos una muestra en una facultad de Medicina y otra en una facultad de Matemáticas. En la facultad de Medicina el 70% son mujeres en la muestra. En la facultad de Matemáticas sólo el 40% son mujeres. Podemos, a partir de estos datos, decir:

a. El p-valor será menor que 0.05.

b. El p-valor no lo podemos saber porque nos hace falta saber las desviaciones estándar de las dos muestras.

c. El p-valor no lo podemos saber porque nos hace falta saber los tamaños de muestrales de ambas muestras.

d. b y c son correctas.

7. Si la sensibilidad de una prueba diagnóstica en Medicina es del 95% podemos afirmar:

a. Que la especificidad es del 5%.

b. Que hay un 5% de falsos negativos.

c Que el valor predictivo positivo será bajo.

d. Ninguna de las tres anteriores es cierta.

8. En un estudio clínico en el que se quiere comparar un fármaco con un placebo se ha decidido tomar dos muestras de tamaño 100 para poder distinguir una diferencia mínima de 2 de la variable estudiada. Con ello sabemos que tenemos una potencia del 80% y un error de tipo 1 de 0.05. Si quisiéramos cambiar el estudio y pasar a tener un error de tipo 2 de 0.1 deberíamos:

a. Disminuir el tamaño de muestra.

b. Aumentar el tamaño de muestra.

c. El tamaño de muestra no cambiaría.

d. Ninguna de las tres respuestas anteriores es cierta.

9. Si estamos comparando la respuesta positiva a un determinado fármaco respecto a un placebo y tenemos que con el fármaco responden positivamente un 80% y con el placebo un 40%, con un tamaño de muestra muy pequeño y el contraste de hipótesis de igualdad de proporciones nos dice que no podemos rechazar la hipótesis nula, podemos afirmar:

a. Que estamos cometiendo un error de tipo II.

b. Que estamos cometiendo un error de tipo I.

c. Que tenemos una potencia muy elevada.

d. Que estamos cometiendo un error pero que no sabemos de qué tipo.

10. ¿Qué afirmación, entre las siguientes, no es correcta?:

a. El p-valor es la probabilidad de la zona crítica constuida a partir del valor del estadístico de test utilizado.

b. En un Test de la t de Student de comparación de medias si el p-valor es 1 las medias muestrales de las dos muestras son iguales.

c. En un Test de la t de Student de comparación de medias si el p-valor es 1 las medias poblacionales de las dos poblaciones son iguales.

d. En un Test de la t de Student de comparación de medias si el p-valor es 1 nos indica que la información que tenemos en las dos muestras no nos permite rechazar la Hipótesis nula de igualdad de medias poblacionales.

Solución

Solución Situación 30

1c: Se trata de dos variables cuantitativas. De las cuatro respuestas la única que es una medida de la relación entre dos variables cuantitativas es la correlación de Pearson.

2d: Ahora tenemos una relación entre una variable dicotómica y una variable cuantitativa. La única medida de esta relación de entre las cuatro respuestas es la Odds ratio, que es la fundamentalmente usada en estos casos, en el contexto de una regresión logística.

3d: Si se observan los datos se ve claramente que hay relación y, además, una relación directa, una relación que nos debe llevar a una correlación positiva claramente. Por lo tanto, la respuesta a y la b descartadas. La respuesta c nos da una correlación positiva, efectivamente, y muy grande (r=0,99), pero no significativa. Una correlación tan grande con un tamaño muestral tan grande es imposible que no nos dé una relación significativa. Por lo tanto, descartada la respuesta c, también. Nos queda la respuesta d que es efectivamente la correlación significativa que tienen estas dos variables.

4c: Si se observa el gráfico es suficiente para comprobar que la respuesta c es incorrecta. Restar el tercer cuartel menos la mediana (el segundo cuartil) nos debe dar un valor algo inferior a 0,3, por lo tanto no nos puede dar 0,42.

5d: Si se observan ambos gráficos, ambas regresiones logísticas podemos ver que los valores están más segregados, más separados, en el caso de la variable “Relación adjetivos/sustantivos”, lo que se visualiza también porque tiene una curva con más pendiente. Esto significa que con la variable “Relación adjetivos/sustantivos” construiríamos un mecanismo más eficaz de clasificación de un texto en la categoría de “Ciencias” o “Letras”, un mecanismo con menos errores de mala clasificación.

Situaciones de comparación de dos poblaciones en Ciencias de la salud

1) Se ha estudiado la prevalencia de una patología oftalmológica entre personas usuarias de más de 5 horas diarias de ordenador durante más de 10 años y personas que no usan habitualmente el ordenador (menos de 30 minutos diarios). En el grupo de los usuarios de ordenador 14 de 50 tienen esa patología y en la muestra de los no usuarios únicamente 5 de 50 la tienen. ¿Se puede decir que hay diferencias, estadísticamente significativas, entre estos dos grupos de personas, en cuanto a la prevalencia de esta patología?

2) Se ha aplicado un tratamiento a mujeres y a hombres, En las mujeres 5 de 20 personas respondían favorablemente al tratamiento, en los hombres 3 de 20 eran los que respondían favorablemente. ¿Se puede decir que hay diferencias significativas entre sexos en cuanto a la respuesta a este tratamiento?

3) Se han aplicado dos tratamientos a un grupo de 100 enfermos con una enfermedad crónica (Artritis reumatoide). Cada paciente recibía los dos tratamientos. En primer lugar, a 50 de ellos se les daba el tratamiento A y a los otros 50 se les daba el tratamiento B durante un mes. Se dejaba entonces a todos ellos un mes sin tratamiento y, el mes siguiente, se le daba a cada paciente el otro tratamiento. La variable contemplada era si el grado de dolor medio (evaluado entre el 0 y el 10), durante el mes del tratamiento, anotado en una encuesta semanal, era o no superior a 5. Los resultados obtenidos fueron los siguientes:

IMG_5825

¿Se puede decir que el porcentaje de los que tienen igual o más de 5 de dolor es distinto según el tratamiento A o el B?

4) Se quiere comparar la resistencia de dos materiales odontológicos. Para ello se toman 18 piezas dentales de un mismo tipo y se aplica, a 9 de ellas, un material y a las 9 restantes el otro material. Mediante unas pruebas se evalúa la resistencia de estos materiales. La resistencia se mide según alguna unidad característica y los valores obtenidos son los siguientes:

IMG_5852

¿Podemos decir que hay diferencias estadísticamente significativas en cuanto a la resistencia de ambos materiales?

5) Estamos comparando el grado de dolor que 8 niños y 7 niñas tienen durante el procedimiento de ponerles un empaste. Se trata de una escala que va del 0 al 10. Le preguntamos al niño o niña justo al empezar el procedimiento, en medio y al final que nos diga el grado de dolor que tiene y al final sumamos los tres resultados. Los resultados que obtenemos son los siguientes:

IMG_5828

¿Podemos afirmar que las diferencias son estadísticamente significativas?

6) Estamos comparando el dolor postoperatorio de dos cirugías menores diferentes aplicadas a diferentes individuos. De la Cirugía A tenemos 8 pacientes. De la B tenemos sólo 6.  Esta comparación la haremos mediante el número de Ibuprofenos 600mg que han tenido que tomar los pacientes para calmar el dolor durante el postoperatorio. Los resultados obtenidos son los siguientes:

IMG_5854

¿Podemos afirmar que las diferencias son estadísticamente significativas?

7) Se ha estudiado la presión diastólica de una serie de pacientes hipertensos antes y después de tomar un fármaco que pretende reducir dicha presión. Los resultados obtenidos son los siguientes:

IMG_5832

¿Podemos decir que hay un descenso significativo de la presión, mediante la toma de ese antihipertensivo?

8) Estamos estudiando el número de veces que han ido al dentista 9 niños hasta los 7 años y en número de veces que han ido, los mismos niños, desde los 8 a los 14 años:

IMG_5847

¿Podemos afirmar que hay diferencias significativas entre los dos tiempos?

Soluciones