Archivo de la categoría: COMPLEMENTOS

Explotación de una base de datos 1: Base de datos

En este artículo veremos la base de datos con la que vamos a trabajar en este conjunto de ficheros con el nombre «Explotación de una base de datos», mediante los cuales iremos aplicando diferentes técnicas estadísticas, es la siguiente.

Los códigos de las etiquetas son los siguientes:

Etiqueta Contenido Tipo
S Sexo Cualitativa (h-m)
E Edad Cuantitativa
DI Días de ingreso Cuantitativa
C Cirugía Cualitativa (Sí o No)
D 1:Medicina interna
2:Traumatología
3:Urología
4:Oftalmología
P1 Estado de las habitaciones Likert
P2 Comida Likert
P3 Atención del personal no sanitario Likert
P4 Atención del personal auxiliar sanitario Likert
P5 Atención del personal de enfermeria Likert
P6 Atención del personal médico Likert
P7 Información recibida Likert
P8 Solución del problema Cualitativa (Sí o No)
VG Valoración general Cuantitativa (0-10)

Las variables Likert han sido etiquetadas de la siguiente forma:

1 Totalmente en desacuerdo
2 En desacuerdo
3 Ni de acuerdo ni en desacuerdo
4 De acuerdo
5 Totalmente de acuerdo

La base de datos es la siguiente:

S E DI C D P1 P2 P3 P4 P5 P6 P7 P8 VG
h 52 2 NO 1 3 4 4 4 4 2 1 SI 7
h 78 4 NO 2 2 3 3 4 4 5 4 SI 8
h 34 3 NO 3 2 2 4 4 4 1 2 NO 6
h 45 6 SI 4 4 3 3 3 3 4 4 SI 6
h 47 8 SI 1 5 5 2 2 2 3 3 SI 5
h 59 2 NO 4 4 3 3 3 3 3 2 NO 6
h 67 2 SI 4 4 4 4 4 4 5 4 NO 8
h 32 3 SI 3 3 2 2 2 3 2 1 NO 4
h 56 34 SI 2 5 5 5 5 5 2 2 SI 9
h 78 45 SI 1 5 4 1 2 2 5 4 SI 6
m 43 3 NO 3 2 2 2 3 2 3 4 NO 4
m 42 4 NO 1 2 2 2 2 2 2 2 NO 4
m 38 5 SI 1 4 5 5 5 5 5 4 SI 10
m 75 5 NO 2 3 3 3 4 4 3 2 SI 7
m 27 2 NO 4 3 3 3 3 3 4 3 SI 6
m 34 8 SI 2 5 4 1 1 2 5 4 SI 5
m 32 23 SI 1 5 4 1 2 2 1 2 SI 4
m 43 2 NO 3 3 4 4 3 3 3 4 SI 7
m 45 2 SI 4 2 2 4 4 4 2 2 SI 6
m 55 5 NO 2 2 2 4 5 5 4 3 NO 8
h 59 2 NO 2 4 3 4 3 3 3 2 NO 6
h 67 2 SI 4 4 4 5 4 4 5 4 NO 8
h 32 3 SI 3 3 2 2 3 3 2 1 NO 4
h 56 34 SI 1 5 5 5 4 5 2 2 SI 9
h 78 45 SI 2 5 4 1 1 2 5 4 SI 6
m 43 3 NO 3 2 2 2 3 4 4 4 NO 6
m 42 4 NO 2 2 2 2 2 2 2 2 NO 4
m 38 5 SI 2 4 5 5 5 5 5 4 SI 9
m 77 5 NO 2 3 3 3 4 4 4 2 SI 7
m 29 2 NO 4 3 3 3 3 3 4 3 SI 6
m 36 8 SI 2 5 4 1 1 2 4 4 SI 5
m 64 23 SI 1 5 4 1 2 2 2 2 SI 4
m 29 2 NO 4 3 3 3 3 3 4 3 SI 6
m 36 8 SI 2 5 4 1 1 2 5 4 SI 5
m 71 21 SI 1 5 4 1 2 2 1 2 SI 6
m 45 2 NO 3 3 4 4 3 3 3 4 SI 6
m 47 4 NO 4 2 2 4 4 4 2 2 SI 6
m 57 5 NO 2 2 2 5 5 5 4 3 SI 8
h 61 2 NO 4 4 3 3 3 3 3 2 NO 6
h 69 2 NO 4 4 4 4 4 4 5 4 SI 8
h 34 3 NO 3 3 2 2 2 3 2 1 NO 4
h 61 2 NO 2 4 3 3 3 3 3 2 NO 6
h 69 2 NO 4 4 4 4 4 4 5 4 SI 8
h 34 3 NO 3 3 2 2 2 3 2 1 NO 4
h 68 23 SI 2 5 5 4 5 4 2 2 SI 7
h 80 30 SI 1 5 4 1 2 2 5 4 SI 6
m 45 3 NO 3 2 2 2 3 4 4 4 NO 6
m 44 4 NO 2 2 2 2 2 2 2 2 NO 4
m 40 5 SI 1 4 5 5 5 5 5 4 SI 10
m 77 5 NO 1 3 3 3 4 4 3 2 SI 7
m 27 2 NO 4 3 3 3 3 3 4 3 SI 6
m 35 8 SI 2 5 4 1 1 2 5 4 SI 5
m 64 21 SI 1 5 4 1 2 2 1 2 SI 5
m 25 2 NO 3 3 4 4 5 5 3 4 SI 7
m 66 4 SI 4 2 2 4 4 4 2 2 SI 6
m 57 5 NO 2 2 2 5 5 5 4 3 NO 8
h 71 2 NO 4 4 3 3 3 3 3 2 NO 6
h 69 2 SI 4 4 4 4 4 4 5 4 SI 8
h 22 3 NO 3 3 2 2 2 3 2 1 NO 4
h 78 78 SI 2 5 5 5 5 5 2 2 SI 9
h 80 4 NO 2 2 3 3 4 4 5 4 SI 8
h 36 3 NO 2 2 2 4 4 4 2 2 NO 7
h 47 6 SI 1 4 3 3 3 3 4 4 SI 6
h 46 8 SI 1 5 5 2 2 2 3 3 SI 5
h 61 2 NO 4 4 3 3 3 3 3 2 NO 5
h 69 2 NO 4 4 4 4 4 4 5 4 NO 8
h 34 3 NO 3 3 2 2 3 3 2 1 NO 4
h 58 34 SI 1 5 5 5 4 5 2 2 SI 9
h 80 45 SI 1 5 4 1 2 2 5 4 SI 6
m 45 3 NO 2 2 2 2 3 4 4 4 NO 6
m 44 4 NO 3 2 2 2 2 2 2 2 NO 3
h 61 2 NO 4 4 3 3 3 3 3 2 NO 6
h 69 2 NO 4 4 4 4 4 4 5 4 NO 8
h 75 3 NO 3 3 2 2 2 3 2 1 NO 4
h 68 34 SI 1 5 5 5 5 5 2 2 SI 9
h 73 45 SI 1 5 4 1 2 2 5 4 SI 6
m 45 3 NO 3 2 2 2 3 4 4 4 NO 6
m 44 4 NO 2 2 2 2 2 2 2 2 NO 4
m 40 5 SI 1 4 5 5 5 5 5 4 SI 9
m 77 6 NO 1 3 3 3 4 4 3 2 SI 7
m 29 3 NO 4 3 3 3 3 3 4 3 SI 6
m 76 9 SI 2 5 4 1 1 2 5 4 SI 5
m 66 31 SI 1 5 4 1 2 2 1 2 SI 6
m 45 2 NO 3 3 4 4 5 4 3 4 SI 8
m 47 4 NO 4 2 2 4 4 4 2 2 SI 6
h 69 2 NO 4 4 4 4 4 4 5 4 NO 8
h 34 3 NO 3 3 2 2 2 3 2 1 NO 4
h 58 21 SI 1 5 5 5 5 5 2 2 SI 9
h 80 24 SI 1 5 4 1 2 2 5 4 SI 6
m 45 3 NO 3 2 2 2 3 4 4 4 NO 6
m 44 3 NO 2 2 2 2 3 2 2 3 NO 4
m 40 4 SI 2 4 5 5 5 5 5 4 SI 9
m 77 4 NO 1 3 3 3 4 4 3 3 SI 7
h 34 4 NO 3 3 2 2 2 3 2 2 NO 4
h 78 33 SI 1 5 5 4 5 5 2 1 SI 8
h 84 40 SI 1 5 4 1 2 2 5 4 SI 6
m 45 2 NO 3 2 2 2 3 4 4 3 NO 6
m 44 3 NO 2 2 2 2 2 2 2 2 NO 4
m 40 4 SI 2 4 5 4 5 4 5 4 SI 9
m 28 3 NO 3 1 2 2 4 3 4 4 NO 6

Datos clásicos de Fisher del género Iris

Sepal length Sepal width Petal length Petal width Species
5.1 3.5 1.4 0.1 I. setosa
4.9 3.0 1.4 0.2 I. setosa
4.7 3.2 1.3 0.2 I. setosa
4.6 3.1 1.5 0.2 I. setosa
5.0 3.6 1.4 0.2 I. setosa
5.4 3.9 1.7 0.4 I. setosa
4.6 3.4 1.4 0.3 I. setosa
5.0 3.4 1.5 0.2 I. setosa
4.4 2.9 1.4 0.2 I. setosa
4.9 3.1 1.5 0.1 I. setosa
5.4 3.7 1.5 0.2 I. setosa
4.8 3.4 1.6 0.2 I. setosa
4.8 3.0 1.4 0.1 I. setosa
4.3 3.0 1.1 0.1 I. setosa
5.8 4.0 1.2 0.2 I. setosa
5.7 4.4 1.5 0.4 I. setosa
5.4 3.9 1.3 0.4 I. setosa
5.1 3.5 1.4 0.3 I. setosa
5.7 3.8 1.7 0.3 I. setosa
5.1 3.8 1.5 0.3 I. setosa
5.4 3.4 1.7 0.2 I. setosa
5.1 3.7 1.5 0.4 I. setosa
4.6 3.6 1.0 0.2 I. setosa
5.1 3.3 1.7 0.5 I. setosa
4.8 3.4 1.9 0.2 I. setosa
5.0 3.0 1.6 0.2 I. setosa
5.0 3.4 1.6 0.4 I. setosa
5.2 3.5 1.5 0.2 I. setosa
5.2 3.4 1.4 0.2 I. setosa
4.7 3.2 1.6 0.2 I. setosa
4.8 3.1 1.6 0.2 I. setosa
5.4 3.4 1.5 0.4 I. setosa
5.2 4.1 1.5 0.1 I. setosa
5.5 4.2 1.4 0.2 I. setosa
4.9 3.1 1.5 0.2 I. setosa
5.0 3.2 1.2 0.2 I. setosa
5.5 3.5 1.3 0.2 I. setosa
4.9 3.6 1.4 0.1 I. setosa
4.4 3.0 1.3 0.2 I. setosa
5.1 3.4 1.5 0.2 I. setosa
5.0 3.5 1.3 0.3 I. setosa
4.5 2.3 1.3 0.3 I. setosa
4.4 3.2 1.3 0.2 I. setosa
5.0 3.5 1.6 0.6 I. setosa
5.1 3.8 1.9 0.4 I. setosa
4.8 3.0 1.4 0.3 I. setosa
5.1 3.8 1.6 0.2 I. setosa
4.6 3.2 1.4 0.2 I. setosa
5.3 3.7 1.5 0.2 I. setosa
5.0 3.3 1.4 0.2 I. setosa
7.0 3.2 4.7 1.4 I. versicolor
6.4 3.2 4.5 1.5 I. versicolor
6.9 3.1 4.9 1.5 I. versicolor
5.5 2.3 4.0 1.3 I. versicolor
6.5 2.8 4.6 1.5 I. versicolor
5.7 2.8 4.5 1.3 I. versicolor
6.3 3.3 4.7 1.6 I. versicolor
4.9 2.4 3.3 1.0 I. versicolor
6.6 2.9 4.6 1.3 I. versicolor
5.2 2.7 3.9 1.4 I. versicolor
5.0 2.0 3.5 1.0 I. versicolor
5.9 3.0 4.2 1.5 I. versicolor
6.0 2.2 4.0 1.0 I. versicolor
6.1 2.9 4.7 1.4 I. versicolor
5.6 2.9 3.6 1.3 I. versicolor
6.7 3.1 4.4 1.4 I. versicolor
5.6 3.0 4.5 1.5 I. versicolor
5.8 2.7 4.1 1.0 I. versicolor
6.2 2.2 4.5 1.5 I. versicolor
5.6 2.5 3.9 1.1 I. versicolor
5.9 3.2 4.8 1.8 I. versicolor
6.1 2.8 4.0 1.3 I. versicolor
6.3 2.5 4.9 1.5 I. versicolor
6.1 2.8 4.7 1.2 I. versicolor
6.4 2.9 4.3 1.3 I. versicolor
6.6 3.0 4.4 1.4 I. versicolor
6.8 2.8 4.8 1.4 I. versicolor
6.7 3.0 5.0 1.7 I. versicolor
6.0 2.9 4.5 1.5 I. versicolor
5.7 2.6 3.5 1.0 I. versicolor
5.5 2.4 3.8 1.1 I. versicolor
5.5 2.4 3.7 1.0 I. versicolor
5.8 2.7 3.9 1.2 I. versicolor
6.0 2.7 5.1 1.6 I. versicolor
5.4 3.0 4.5 1.5 I. versicolor
6.0 3.4 4.5 1.6 I. versicolor
6.7 3.1 4.7 1.5 I. versicolor
6.3 2.3 4.4 1.3 I. versicolor
5.6 3.0 4.1 1.3 I. versicolor
5.5 2.5 4.0 1.3 I. versicolor
5.5 2.6 4.4 1.2 I. versicolor
6.1 3.0 4.6 1.4 I. versicolor
5.8 2.6 4.0 1.2 I. versicolor
5.0 2.3 3.3 1.0 I. versicolor
5.6 2.7 4.2 1.3 I. versicolor
5.7 3.0 4.2 1.2 I. versicolor
5.7 2.9 4.2 1.3 I. versicolor
6.2 2.9 4.3 1.3 I. versicolor
5.1 2.5 3.0 1.1 I. versicolor
5.7 2.8 4.1 1.3 I. versicolor
6.3 3.3 6.0 2.5 I. virginica
5.8 2.7 5.1 1.9 I. virginica
7.1 3.0 5.9 2.1 I. virginica
6.3 2.9 5.6 1.8 I. virginica
6.5 3.0 5.8 2.2 I. virginica
7.6 3.0 6.6 2.1 I. virginica
4.9 2.5 4.5 1.7 I. virginica
7.3 2.9 6.3 1.8 I. virginica
6.7 2.5 5.8 1.8 I. virginica
7.2 3.6 6.1 2.5 I. virginica
6.5 3.2 5.1 2.0 I. virginica
6.4 2.7 5.3 1.9 I. virginica
6.8 3.0 5.5 2.1 I. virginica
5.7 2.5 5.0 2.0 I. virginica
5.8 2.8 5.1 2.4 I. virginica
6.4 3.2 5.3 2.3 I. virginica
6.5 3.0 5.5 1.8 I. virginica
7.7 3.8 6.7 2.2 I. virginica
7.7 2.6 6.9 2.3 I. virginica
6.0 2.2 5.0 1.5 I. virginica
6.9 3.2 5.7 2.3 I. virginica
5.6 2.8 4.9 2.0 I. virginica
7.7 2.8 6.7 2.0 I. virginica
6.3 2.7 4.9 1.8 I. virginica
6.7 3.3 5.7 2.1 I. virginica
7.2 3.2 6.0 1.8 I. virginica
6.2 2.8 4.8 1.8 I. virginica
6.1 3.0 4.9 1.8 I. virginica
6.4 2.8 5.6 2.1 I. virginica
7.2 3.0 5.8 1.6 I. virginica
7.4 2.8 6.1 1.9 I. virginica
7.9 3.8 6.4 2.0 I. virginica
6.4 2.8 5.6 2.2 I. virginica
6.3 2.8 5.1 1.5 I. virginica
6.1 2.6 5.6 1.4 I. virginica
7.7 3.0 6.1 2.3 I. virginica
6.3 3.4 5.6 2.4 I. virginica
6.4 3.1 5.5 1.8 I. virginica
6.0 3.0 4.8 1.8 I. virginica
6.9 3.1 5.4 2.1 I. virginica
6.7 3.1 5.6 2.4 I. virginica
6.9 3.1 5.1 2.3 I. virgnica
5.8 2.7 5.1 1.9 I. virginica
6.8 3.2 5.9 2.3 I. virginica
6.7 3.3 5.7 2.5 I. virginica
6.7 3.0 5.2 2.3 I. virginica
6.3 2.5 5.0 1.9 I. virginica
6.5 3.0 5.2 2.0 I. virginica
6.2 3.4 5.4 2.3 I. virginica
5.9 3.0 5.1 1.8 I. virginica

¿Media y Desviación estándar o Mediana y Rango intercuartílico?

En el Tema 2: Estadística descriptiva ya hemos visto que son muchos los estadísticos, los descriptores, que podemos calcular a una muestra de una variable cuantitativa. Pero es muy habitual resumir una muestra mediante sólo dos descriptores. Lo más habitual es hacerlo mediante la Media y la Desviación estándar. En estos casos se suele escribir mediante la estructura  Media±Desviación estándar. Es muy habitual en revistas científicas ver descripciones de una variable en términos, por ejemplo, como de 10±3, 134±23 ó 2345±123. Sin embargo, esta generalización que se viene usando es problemática. Veamos por qué.

Si una variable se ajusta bien a una distribución normal lo más conveniente es describir esa variable, efectivamente, mediante la Media y la Desviación estándar, porque con estos dos valores tenemos perfectamente caracterizada la distribución de la población que hay detrás de la muestra que tenemos.

Si una variable, por el contrario, no se ajusta a una distribución normal es muy problemático describirla en estos términos, de esta forma. Es mucho más razonable describirla mediante la Mediana y el Rango intercuartílico.

La tendencia habitual si se tiene una variable descrita en los términos de la Media±Desviación estándar es a hacer aquellas típicas inferencias que sólo son ciertas si la variable se ajusta bien a la distribución normal: M±1DE supone el 68.5% aproximadamente de la población, M±2DE supone el 95% aproximadamente de la población y M±3DE supone el 99.5% aproximadamente de la población. Si la variable no se ajusta a una distribución normal esas inferencias en absoluto son ciertas. Para evitar esta muy habitual inferencia inconsciente es mejor trabajar, evidentemente, en estos casos de no ajuste a la normalidad, con la Mediana y el Rango intercuartílico que son medidas que digamos están más próximas a la descripción propiamente dicha y no tienen tantas connotaciones inferenciales como las tienen la Media y la Desviación estándar.

No es un problema, como suele pensarse en ocasiones, de tamaño de muestra. Hay una creencia establecida, por parte de muchos usuarios de la Estadística, que si una muestra es pequeña deben usarse descriptores tipo mediana y percentiles y si la muestra es grande puede usarse y debe usarse la media y la desviación estándar. Esto no es así. El uso de unos u otros descriptores no depende del tamaño muestral, depende de la normalidad de la muestra, de su ajuste a la campana de Gauss.

Veamos dos ejemplos que nos pueden ayudar:

El primero es una muestra de tamaño 1000 de personas adultas a las que se les ha medido la variable Altura. Veamos unos cuantos descriptores calculados a esa muestra, el Box-Plot y un interesante gráfico donde simplemente se representan todos los valores de la muestra en su posición respecto a la recta de números de abajo. Los valores se elevan con la intención que se visualice mejor la distribución de valores. Observemos que en este caso dar la Media y la Desviación estándar es muy correcto. Los valores muestrales se ajustan bien a una normal. Vemos perfectamente que si a la media le sumamos y restamos 1DE ó 2DE vemos que efectivamente quedan, dentro de esos dos intervalos, el 68.5 y el 95% de valores. Vaya, que estos valores son factibles y razonables:

IMG_7100

La Asimetría estandarizada de esta muestra es -0.46 y la Curtosis estandarizada es 0.19. Esto es una forma más objetiva de valorar el ajuste a la distribución normal. Ambos valores están dentro del intervalo que va del -2 al 2.

El segundo ejemplo es una muestra de las edades de 1129 alumnos de la Universidad de Barcelona. Ahora observemos que si representamos esa muestra mediante la Media y la Desviación estándar corremos el peligro de que si hacemos esos intervalos nos encontremos con errores importantísimos. La media son 22.2 años y la DE es 3.89. Si ahora construimos los típicos intervalos nos encontramos con inferencias que no son reales. Simplemente por la no normalidad de los datos:

IMG_7101

La Asimetría estandarizada de esta muestra es 67.26 y la Curtosis estandarizada es 269.24. Esto es una forma más objetiva de valorar el ajuste a la distribución normal. Ambos valores están fuera claramente del intervalo que va del -2 al 2. Por lo tanto, claramente se trata de una variable que no se ajusta a la distribución normal.

La Desviación estándar es un magnífico descriptor, pero peligroso. Debe usarse con cuidado. Demasiadas veces el no introducido con los problemas que aquí comento comete errores de inferir a partir de ella cosas que sólo son ciertas si la variable se ajusta a una distribución normal. Es por eso que estos casos suele recomendarse el uso de la median y el rango intercuartílico. En este último caso podríamos describir la variable Edad mediante los valores: 22 (20-23). Observemos que aunque se habla en estos casos de Mediana y Rango intercuartílico, en realidad, más que darse el Rango intercuartílico propiamente, suele darse primer y tercer cuartil. De esta forma se está dando el rango intercuartílico y los dos valores concretos a partir de los cuales se calcula. Por lo tanto, se está dando más información.

Es por lo tanto muy importante saber en qué momentos tiene sentido usar uno u otro sistema descriptivo. Y es muy importante, también, saber usar bien la desviación estándar, saber qué papel juega, saber cuándo puede tener mucho protagonismo y cuándo debe quedar más en un segundo plano.

Resumiendo:

1. Si la variable se ajusta bien a la distribución normal el cálculo de la Media y la Desviación estándar es la mejor opción puesto que mediante ellos se tiene perfectamente caracterizada la distribución de la población de donde se ha tomado la muestra.

2. Si la variable no se ajusta bien a una distribución normal es conveniente dar la Mediana y el Rango intercuartílico. La media y la desviación estándar, en este caso, pueden llevar a inferencias rutinarias peligrosas. De hecho, la desviación estándar es muy buen descriptor pero peligroso. Bien usado perfecto, pero mal usado puede llevar a inferencias muy alejadas de la realidad.

Observemos en la siguiente tabla de un artículo de medicina cómo se presenta la información en una Estadística descriptiva. Las variables cualitativas con la frecuencia absoluta y, entre paréntesis, la frecuencia relativa. Las variables cuantitativas cuando no se dice lo contrario se expresa la media más menos la desviación estándar y, en muchas ocasiones, indicándolo, se expresa con la mediana y el rango intercuartílico (IQR). Observemos, también, que, a veces, se presenta el rango, expresado mediante el mínimo y el máximo:

Captura de pantalla 2015-10-15 a las 10.11.53

Captura de pantalla 2015-10-15 a las 10.12.20

Soluciones a las situaciones de comparación de dos poblaciones

Es importante, muy importante, ver que en los dos documentos donde se plantean Situaciones de comparación de dos poblaciones, tanto en Ciencias de la salud como en Ciencias humanas, los datos son los mismos. Es importante ver el paralelismos entre los 8 problemas, porque se trata de 8 situaciones distintas pero que nos llevan a los mismos datos y a las mismas soluciones estadísticas. Veamos esas soluciones (Es muy necesario tener en todo momento presente el cuadro de técnicas que lo encontraréis en el tema dedicado a la comparación de dos poblaciones):

1. La variable es dicotómica y las muestras son, en este caso, independientes. Como el tamaño de muestra es superior a 30 y el valor esperado por grupo es superior a 5 podemos aplicar el test de comparación de proporciones. Tenemos 14 valores de 50 en un grupo y 5 de 50 en el otro. Como el tamaño de muestra es el mismo en ambos grupos, si fuese cierta la Hipótesis nula de igualdad de proporciones esperaríamos ver 9,5 observaciones de 50 en cada grupo. Como 9,5 es mayor que 5 estamos en las condiciones de aplicación del Test de proporciones. Los resultados son los siguientes:

IMG_5835

2. La variable es dicotómica y las muestras son independientes. Como el tamaño de muestra es inferior a 30 aquí conviene usar el Test exacto de Fisher. El resultado es el siguiente:

IMG_5845

3. La variable es dicotómica y las muestras son, ahora, relacionadas. El Test a aplicar es el Test de McNemar. El resultado de aplicarlo es el siguiente:

IMG_5846

Pero observemos que si aplicáramos mal el test, si aplicáramos incorrectamente un Test de proporciones el resultado sería esto otro:

IMG_5835

4. Variables continuas, ahora, muestras independientes. Hace falta comprobar si hay normalidad y si la hay (que la hay, en este caso) hace falta comprobar la igualdad o no de varianzas o de desiviaciones estándar. Si hay igualdad, como sucede, efectivamente, debe aplicarse el Test de la t de Student de muestras independientes y varianzas iguales. Todos estos pasos se exponen a continuación:

IMG_5836

5. Variables continuas, muestras independientes. Hace falta comprobar si hay normalidad y si la hay (que la hay, en este caso) hace falta comprobar la igualdad o no de varianzas o de desviaciones estándar. Si no hay igualdad, que es lo que sucede en este caso, debe aplicarse el Test de la t de Student de muestras independientes y varianzas desiguales. Todos estos pasos se exponen a continuación:

IMG_5837

6. Variables continuas, muestras independientes. Hace falta comprobar si hay normalidad y si alguna de las dos muestras no se ajusta a la distribución normal (que es lo que sucede en este caso) pasamos ya directamente a aplicar el Test de Mann-Withney. Todos estos pasos se exponen a continuación:

IMG_5855

7. Variables continuas, muestras relacionadas. En primer lugar hay que comprobar la normalidad de la variable Diferencia de las dos. Si hay normalidad, que es lo que sucede en este caso, pasamos a aplicar el Test de la t de Student de datos apareados. Veamos los pasos comentados:

IMG_5839

8. Variables continuas, muestras relacionadas. En primer lugar hay que comprobar la normalidad de la variable Diferencia de las dos. Si no hay normalidad, que es lo que sucede en este caso, pasamos a aplicar uno de los dos siguientes test: el Test de los signos o el Test de Wilcoxon. Veamos los pasos comentados:

IMG_5840

Situaciones de comparación de dos poblaciones en Ciencias humanas

1) Se ha pedido la definición de la palabra «Enfiteusis» a 50 estudiantes de Filología y a 50 personas no universitarias.  La muestra se ha tomado igualando edades y proporción de sexos. Entre los estudiantes de Filología 14 de los 50 han definido correctamente la palabra, entre los no universitarios sólo 5 de 50 lo han hecho correctamente. A partir de este estudio y de esta muestra, ¿se puede decir que hay diferencias, estadísticamente significativas, entre estas dos poblaciones de personas en cuanto al conocimiento del significado de esta palabra?

2) Se ha preguntado a un grupo de mujeres y de hombres si estaban de acuerdo con una determinada acción de política lingüística llevada a cabo por el gobierno. Entre las mujeres 5 de 20 personas estaban de acuerdo con la iniciativa, entre los hombres sólo 3 de 20 estaban de acuerdo con la iniciativa. ¿Se puede decir que hay diferencias significativas entre sexos en cuanto a la opinión sobre tal iniciativa?

3) Un centro que da certificados oficiales de inglés y que pretende elaborar dos exámenes distintos, pero equivalentes, realiza el siguiente estudio piloto. A un grupo de 100 estudiantes de inglés se les ha examinado mediante los dos modelos de examen. Cada estudiante hacía, pues, los dos exámenes. En primer lugar, a 50 de ellos se les hacía el examen A y a los otros 50 se les hacía el examen B. Una vez hecho el examen se les dejaba, a todos ellos, dos horas de descanso y, luego, cada alumno hacía el otro modelo de examen que no había hecho antes. Cada examen se evaluaba entre el 0 y el 10 pero, en realidad, se quería ver si la nota era o no superior a 5 porque lo que se quería ver era si el porcentaje de aprobados sería el mismo, o no, con los dos modelos de examen. Los resultados obtenidos fueron los siguientes: El examen A lo aprobaron el 60% y el B el lo aprobaron el 48%, con este desglose por subgrupos de valores de la variable:

IMG_5825

¿Se puede decir que el porcentaje de aprobados mediante un examen era distinto significativamente al del otro examen?

4) Se ha realizado un estudio pedagógico donde se quiere comparar la asimilación de unos conceptos mediante dos métodos distintos. Para ello se toman, al azar, 18 alumnos de 4º de ESO y se dividen en dos grupos de 9 cada uno. Durante dos semanas se les enseña un tema mediante las dos formas distintas que se quiera comparar. Una vez finalizado el proceso se les pasa, a todos ellos, un examen común sobre ese tema. Los notas son las siguientes:

IMG_5852

¿Podemos decir que hay diferencias significativas en cuanto a las dos formas de plantear el tema en cuanto al nivel conseguido por los alumnos?

5) Estamos comparando la riqueza conceptual de un grupo de alumnos de 3º de Primaria según sean niños o niñas. Para ello tomamos a 8 niños y a 7 niñas y durante 10 minutos deben anotar palabras relacionadas con el mundo de la Justicia. Una vez pasado el tiempo el número de palabras anotadas que realmente tenían que ver con este mundo eran los siguientes:

IMG_5828

¿Podemos afirmar que las diferencias son estadísticamente significativas?

6) Hemos tomado 14 alumnos al azar de bachillerato (8 chicos y 6 chicas) que tenían WhatsApp y hemos preguntando en cuántos grupos estaban inscritos. Los resultados obtenidos son los siguientes:

IMG_5853

¿Podemos afirmar que las diferencias son estadísticamente significativas?

7) En una facultad universitaria se ha realizado un examen de nivel de conocimientos básicos de inglés en el primer curso y, después, en cuarto, al acabar los estudios. El estudio se ha hecho con los mismos alumnos que fueron elegidos al azar y se les examinó el primer curso y cuando llegaron a cuarto curso. Se trataba de ver si durante sus estudios universitarios los alumnos aparcaban su formación de inglés, la intensificaban o el nivel de conocimientos quedaba estable. Los resultados fueron los siguientes: 

IMG_5831

¿Qué conclusiones podemos sacar de este estudio?

8) Hemos seleccionado a 9 alumnos de bachillerato para realizar el siguiente estudio. La primera semana del primer curso se le pide que anoten palabras que formen parte del campo semántico de «Miopía». Hacemos lo mismo, con los mismos alumnos, y con la misma palabra, la última semana del segundo curso. Los resultados obtenidos son los siguientes:

IMG_5833

¿Podemos afirmar que hay diferencias estadísticamente significativas entre los dos tiempos?

Soluciones

Situaciones de comparación de dos poblaciones en Ciencias de la salud

1) Se ha estudiado la prevalencia de una patología oftalmológica entre personas usuarias de más de 5 horas diarias de ordenador durante más de 10 años y personas que no usan habitualmente el ordenador (menos de 30 minutos diarios). En el grupo de los usuarios de ordenador 14 de 50 tienen esa patología y en la muestra de los no usuarios únicamente 5 de 50 la tienen. ¿Se puede decir que hay diferencias, estadísticamente significativas, entre estos dos grupos de personas, en cuanto a la prevalencia de esta patología?

2) Se ha aplicado un tratamiento a mujeres y a hombres, En las mujeres 5 de 20 personas respondían favorablemente al tratamiento, en los hombres 3 de 20 eran los que respondían favorablemente. ¿Se puede decir que hay diferencias significativas entre sexos en cuanto a la respuesta a este tratamiento?

3) Se han aplicado dos tratamientos a un grupo de 100 enfermos con una enfermedad crónica (Artritis reumatoide). Cada paciente recibía los dos tratamientos. En primer lugar, a 50 de ellos se les daba el tratamiento A y a los otros 50 se les daba el tratamiento B durante un mes. Se dejaba entonces a todos ellos un mes sin tratamiento y, el mes siguiente, se le daba a cada paciente el otro tratamiento. La variable contemplada era si el grado de dolor medio (evaluado entre el 0 y el 10), durante el mes del tratamiento, anotado en una encuesta semanal, era o no superior a 5. Los resultados obtenidos fueron los siguientes:

IMG_5825

¿Se puede decir que el porcentaje de los que tienen igual o más de 5 de dolor es distinto según el tratamiento A o el B?

4) Se quiere comparar la resistencia de dos materiales odontológicos. Para ello se toman 18 piezas dentales de un mismo tipo y se aplica, a 9 de ellas, un material y a las 9 restantes el otro material. Mediante unas pruebas se evalúa la resistencia de estos materiales. La resistencia se mide según alguna unidad característica y los valores obtenidos son los siguientes:

IMG_5852

¿Podemos decir que hay diferencias estadísticamente significativas en cuanto a la resistencia de ambos materiales?

5) Estamos comparando el grado de dolor que 8 niños y 7 niñas tienen durante el procedimiento de ponerles un empaste. Se trata de una escala que va del 0 al 10. Le preguntamos al niño o niña justo al empezar el procedimiento, en medio y al final que nos diga el grado de dolor que tiene y al final sumamos los tres resultados. Los resultados que obtenemos son los siguientes:

IMG_5828

¿Podemos afirmar que las diferencias son estadísticamente significativas?

6) Estamos comparando el dolor postoperatorio de dos cirugías menores diferentes aplicadas a diferentes individuos. De la Cirugía A tenemos 8 pacientes. De la B tenemos sólo 6.  Esta comparación la haremos mediante el número de Ibuprofenos 600mg que han tenido que tomar los pacientes para calmar el dolor durante el postoperatorio. Los resultados obtenidos son los siguientes:

IMG_5854

¿Podemos afirmar que las diferencias son estadísticamente significativas?

7) Se ha estudiado la presión diastólica de una serie de pacientes hipertensos antes y después de tomar un fármaco que pretende reducir dicha presión. Los resultados obtenidos son los siguientes:

IMG_5832

¿Podemos decir que hay un descenso significativo de la presión, mediante la toma de ese antihipertensivo?

8) Estamos estudiando el número de veces que han ido al dentista 9 niños hasta los 7 años y en número de veces que han ido, los mismos niños, desde los 8 a los 14 años:

IMG_5847

¿Podemos afirmar que hay diferencias significativas entre los dos tiempos?

Soluciones

Introducción al contraste de hipótesis

Supongamos que queremos jugarnos dinero entre tú que lees y yo que escribo mediante una moneda. Si sale cara ganas tú. Si sale cruz gano yo. Cada vez que alguien gane le dará 100 euros a su oponente. ¡Esto va en serio, hay que concentrarse!

Yo pongo la moneda para jugar. Pero te dejo que elijas con cuál de las dos monedas que yo propongo quieres jugar: La moneda 1 ó la moneda 2.

Supongamos que, previamente, ante notario, hemos hecho una serie de lanzamientos independientes de cada una de las dos monedas. Con la moneda 1 hemos hecho 1000 lanzamientos y han salido 550 caras y 450 cruces. Con la moneda 2 hemos hecho sólo 10 lanzamientos, porque nos ha faltado tiempo, y han salido 8 caras y 2 cruces.

Repito: tú puedes elegir la moneda. La moneda 1 ó la moneda 2. Recuerda que tú ganas con cara, yo gano con cruz. ¿Cuál eliges? ¿La 1? ¿La 2? ¿Cuál?

Cuando he planteado esto en mis clases la mayoría de gente elige la moneda 2. Esta relación de 8 caras y 2 cruces es tentadora para quien gana con cara. En cambio, la moneda 1 parece poco apetecible. Las caras salen ganando pero por muy poco. Sólo 550 respecto a 450.

Pero yo de ti escogería la moneda 1. Preferiría que escogieras la moneda 2 para mi beneficio, pero a ti te conviene, sin lugar a dudas, la moneda 1.

Veamos por qué. Veámoslo, además, planteado como un contraste de hipótesis.

En un caso como éste la Hipótesis nula contemplaría la afirmación de que la moneda es equilibrada, de que la probabilidad de cara y cruz es la misma: 0.5. En cambio, en la Hipótesis alternativa tendríamos la afirmación de que la moneda no es equilibrada, de que la probabilidad de cara y cruz no es 0.5, de que la moneda está trucada.

Supongamos que cogiéramos una moneda sacada de fábrica, una moneda que seguro que es equilibrada, una moneda que se ajusta perfectamente a lo que dice la Hipótesis nula. Y que hiciéramos 100000 experimentos de lanzar esa moneda 10 veces. O sea, que hiciéramos un millón de lanzamientos independientes agrupándolos de 10 en 10 para que queden como 100000 experimentos de lanzar 10 veces esa moneda equilibrada. En cada uno de esos 100000 experimentos de lanzar la moneda 10 veces anotaríamos el número de caras que obtuviéramos.

Esto nos llevaría su tiempo, claro. Pero nos daría una idea de los resultados que podríamos obtener bajo la Hipótesis nula, con la moneda 2, siendo cierta la Hipótesis nula.

Pero, aún más largo, supongamos que cogiéramos, también, esa misma moneda y hiciéramos 100000 experimentos pero ahora de lanzar esa moneda 1000 veces en cada experimento. O sea, que hiciéramos cien millones de lanzamientos independientes agrupándolos de 1000 en 1000 para que quedaran como 100000 experimentos de lanzar 1000 veces esa moneda equilibrada. En cada uno de esos 100000 experimentos de lanzar la moneda 1000 veces anotaríamos, de nuevo, el número de caras que obtuviéramos.

Como puede verse, esto nos llevaría mucho tiempo. Mucho.

Pero, ahora, gracias a la informática, gracias a la simulación, se puede hacer en un minuto. En un minuto podemos imitar perfectamente lo que pasaría en la realidad si cogiéramos una moneda recién salida de fábrica donde ingenieros certificaran que es correcta, y que hiciéramos todos esos experimentos que acabamos de comentar.

Si se hace esto con la moneda 2 vemos que los resultados que obtenemos del número de caras en 10 lanzamientos realizado 100000 veces es el siguiente:

IMG_5766

Observemos que el más frecuente es el 5 (5 caras y 5 cruces) con 24712 veces. Pero observemos que un valor de 8 caras y 2 cruces o 2 caras y 8 cruces sale un número no despreciable de veces (4328 y 4437 veces, respectivamente). Lo que significa que si es cierta la Hipótesis nula es razonable ver estas combinaciones; o sea, que no es muy improbable ver lo que vemos con la moneda 2 y que sea cierta la Hipótesis nula. En una moneda equilibrada ver lo que vemos en la moneda equilibrada tiene la suficiente probabilidad como para no dudar de ese equilibrio si en una moneda vemos ese resultado.

Si se hace esto mismo con la moneda 1 vemos que los resultados que obtenemos del número de caras en 1000 lanzamientos realizados 100000 veces es ahora el siguiente:

IMG_5767

Observemos ahora que el valor 550 no sale ni una sola vez. En 100000 experimentos de lanzar una moneda equilibrada 1000 veces en ninguna ocasión ha salido un resultado tan o más desequilibrado del visto en la moneda 1, o sea: 550 caras y 450 cruces. Por lo tanto, en este caso ver lo que vemos en la moneda 1 es muy poco probable si fuera cierta la Hipótesis nula. Por eso en este caso podríamos rechazarla y pasarnos a la Hipótesis alternativa, que afirma que la probabilidad de cara y cruz no es 0.5/0.5, que la moneda no está equilibrada. Y como la estimación es que la cara es más probable que la cruz si se gana con cara interesa elegir la moneda 1. A la larga ganarás más porque saldrá más veces.

Es muy importante entender esto porque en realidad todos los contrastes de hipótesis en Estadística se rigen por mecanismos de este tipo. Observemos que en este segundo caso, con la moneda 1, rechazamos la Hipótesis nula que afirma el equilibrio de la moneda (probabilidad 0.5/0.5) porque lo que vemos en esa moneda, nuestra experiencia con esa moneda, nos proporciona un valor de caras y cruces que es muy poco probable verlo en una moneda equilibrada. Lo observado está muy alejado de lo esperado en el caso de ser cierta la Hipótesis nula. Aquí está la clave. En ver la posición relativa de lo que ves respecto a lo que deberías ver en el caso de ser cierta la Hipótesis nula. De hecho, el p-valor de un contraste de hipótesis es un número entre el 0 y el 1 que cuantifica esta posición relativa. Si es grande (y por grande en Estadística significa que es mayor que 0.05) quiere decir que lo que vemos en nuestra muestra es algo bastante probable de ver si la Hipótesis nula fuera cierta. Sin embargo, si ese p-valor es pequeño (menor que 0.05) quiere decir que lo que vemos está muy alejado de lo que deberíamos ver en el caso de ser cierto lo que afirma la Hipótesis nula.

Por esto el p-valor para la moneda 2 sería un p-valor superior a 0.05 y, sin embargo, para la moneda 1 sería un p-valor inferior a 0.05.

Todo esto, evidentemente, es con la información que tenemos. Los contrastes de hipótesis se realizan con la información que se tiene. Por encima de todo en ciencia interesa ser coherente con el nivel de información que se tiene. Esto es muy importante.

Ejemplo de inferencia de dos muestras relacionadas

Se ha realizado un estudio para ver el efecto del ejercicio físico sobre el nivel de colesterol en sangre. Han participado 11 individuos en el estudio. Se analizó el nivel de colesterol de cada uno de ellos antes y después de ser sometidos, durante un tiempo, a un reglado proceso de ejercicios físicos.

Los datos obtenidos antes y después han sido los siguientes:

1 182 198

2 232 210

3 191 194

4 200 220

5 148 138

6 249 220

7 276 219

8 213 161

9 241 210

10 480 313

11 262 226

¿Podemos aceptar, con un nivel de significación del 5%, que el programa de ejercicios ha conseguido disminuir el nivel de colesterol?

Solución:

IMG_5439

IMG_5440

Ejemplo de inferencia en dos muestras independientes

Se ha medido el pH del cordón umbilical de 22 recién nacidos de mujeres normales y de mujeres con preeclampsia, obteniéndose los siguientes valores:

Recién nacios de mujeres normales:

7.28 7.31 7.34 7.34 7.32 7.23 7.31 7.32 7.29 7.35 7.32 7.34 7.35 7.26 7.18 7.34 7.27 7.34 7.29 7.26 7.32 7.26

Recién nacidos de mujeres con preeclampsia:

7.26 7.27 7.27 7.35 7.29 7.28 7.31 7.29 7.34 7.21 7.39 7.28 7.30 7.24 7.20 7.28 7.30 7.35 7.31 7.32 7.37 7.26

Con un nivel de significación del 0.05, ¿existe diferencia significativa entre el pH de los recién nacidos de las dos poblaciones de mujeres?

Solución:

IMG_5434

IMG_5442

Ejemplo de inferencia en una población

Veamos en el siguiente ejemplo un problema donde se ve al mismo tiempo la construcción de un intervalo de confianza, el contraste de hipótesis y la determinación del tamaño de muestra:

Las autoridades sanitarias fijan la cantidad de 14 UFP/100mL (UFP = unidades formadoras de placas) como la concentración máxima de un determinado virus entérico en aguas residuales de cualquier punto del estado. Se realiza un control en aguas depuradas de 10 granjas que generan purines.  La variable cantidad de UFP/100mL por granja supongamos que se ajusta bien a una distribución Normal. Por otro lado, las granjas están suficientemente alejadas para asumir que los resultados individuales son mutuamente independientes.

La muestra de valores obtenidos ha sido:

(14.3, 15.3, 13.8, 15.4, 15.5, 14.6, 13.9, 15.0, 14.6, 13.8)

1. Calcular un intervalo de confianza del 95% de la concentración media del virus en las aguas que vierten a las granjas.

2. Interpretar el resultado en función del valor fijado por la administración.

3. Con un nivel de significación α = 0.05, ¿se puede aceptar que la concentración del virus supera las 14 UFP/100mL?

4. Con un nivel de significación α = 0.05, ¿se puede aceptar que la desviación estándar de la concentración del virus es de 0.7?

5. ¿Cuáles son los cambios en las diferentes cantidades que intervienen en el problema (media y desviación estándar muestral, estadístico de test, p-valor) si se mide la concentración en litros en lugar de 100ml?

6. Si la muestra se interpreta como un ensayo piloto, qué tamaño de muestra sería necesario para garantizar un nivel de significación del 5%, una potencia del 90% y una diferencia mínima significativa respecto de la media (o una diferencia mínima a detectar) de 0.5 unidades?.

Veamos ahora la solución paso a paso:

IMG_5425

IMG_5426

IMG_5821

Para calcular el tamaño de muestra utilizamos la fórmula expuesta en el tema de dedicado a la Determinación del tamaño de muestra.

Observemos que la determinación de este tamaño de muestra está hecho como si fuera el test bilateral. Si el test es unilateral, que es como parece que debe plantearse este problema, en realidad, la solución sería la siguiente:

IMG_8917

Es interesante ver la comparación entre estos dos procedimientos para ver cómo se aplicaría la fórmula para un test bilateral y para un test unilateral.