A nuestra base de datos adjunta en el artículo Explotación de una base de datos 1: Base de datos le podemos calcular muchas cosas de Estadística descriptiva. Veamos algunos ejemplos:
1. Hacer una Estadística descriptiva de las variables cuantitativas: Edad, Días de ingreso y Valoración general.
2. Hacer una Estadística descriptiva de las variables cualitativas: Sexo, Cirugía, Departamento y P8.
3. Hacer una Estadística descriptiva de las variables P1 y P6 como ejemplos de dos de las siete variables Likert.
4. Representar de la forma más apropiada y resumida, con Media y Desviación estándar o Mediana y Rango intercuartílico, las variables Edad, Días de ingreso y Valoración general.
SOLUCIONES:
1. Hacer una Estadística descriptiva de las variables cuantitativas: Edad, Días de ingreso y Valoración general:
La variable Edad tiene los siguientes valores de los más importantes estadísticos descriptores:
El Box-Plot:
La variable Días de ingreso tiene los siguientes valores de los más importantes estadísticos descriptores:
Y el Box-Plot:
La variable «Valoración general» tiene los siguientes valores de los más importantes estadísticos descriptores:
Y el Box-Plot:
2. Hacer una Estadística descriptiva de las variables cualitativas: Sexo, Cirugía, Departamento y P8:
Para la variable cualitativa «Sexo» la tabla de frecuencias es:
Y el diagrama de frecuencias:
Para la variable cualitativa «Cirugía» la tabla de frecuencias es:
Y el diagrama de frecuencias:
Para la variable «Departamento»:
Y el diagrama de frecuencias:
Para la variable P8:
Y el diagrama de frecuencias:
3. Hacer una Estadística descriptiva de las variables P1 y P6 como ejemplos de dos de las siete variables Likert:
Para la variable P1:
Para la variable P6:
4. Representar de la forma más apropiada y resumida, con Media y Desviación estándar o Mediana y Rango intercuartílico, las variables Edad, Días de ingreso y Valoración general:
De las tres variables la única que tiene una suficiente aproximación a la normalidad (Asimetría estandarizada y Curtosis estandarizada entre -2 y 2) es la variable «Valoración general», por lo tanto esta sería la única que se podría representar mediante la Media y la Desviación estándar. Las otras dos sería más apropiado hacerlo mediante la Mediana y el Rango intercuartílico. O sea, sería de esta forma:
Edad: 47 (40, 69)
Días de ingreso: 4 (2, 8)
Valoración general: 6,3 ± 1,66
Hola,
Quisiera hacerte una pregunta, pero lo primero es agradecerte por tu tiempo y dedicación en esta tarea de hacer la estadística comprensible. Estoy intentando reproducir este ejemplo con el programa SPSS y una hoja Excel y obtengo resultados diferentes a los tuyos en el análisis de la asimetría y la curtosis de las variables. Por ejemplo, en la Edad la asimetría me da 0,151 y la curtosis -1,268 ¿A qué se puede deber? Y ¿Qué programa utilizas en los cálculos? Un saludo.
Hola Xabi, has calculado la asimetría y la curtosis. Yo calculo la estandarizada. La estandarizada es una medida que se tranforma a media cero y desviación 1. De esta forma podemos establecer un mismo criterio de alejamiento o no al ajuste a una distribución normal. Un criterio que es si ambos valores están entre -2 y 2 se ajusta a la normal. De lo contrario no hay ajuste. De otra forma las cosas cambiarían según la escala de la variable. Estandarizar lo iguala todo. Lo lleva todo a una misma escala.
Gracias, y en cuanto a la utilización de un software estadístico ¿cuál me recomiendas?
Xabi, el SPSS es fantástico. Pero si quieres trabajar con un software libre puedes usar el G-Stat 2.0 de la Universitat Autònoma de Barcelona, o el R.