Archivo de la categoría: COMPLEMENTOS

Base de datos de Trastorno bipolar

La siguiente base de datos de pacientes de con Trastorno bipolar y controles tiene la siguientes variables:

P=Número de Paciente

G=Grupo (Control, Bipolar)

S=Sexo (h=hombre, m=mujer)

E=Edad

ES=Estudios superiores (Sí, No)

D=Diabetes mellitus (Sí, No)

V=Autovaloración negativa (Sí, No)

F=Antecedentes de bipolaridad en familia directa (Sí, No)

CI=Coeficiente de inteligencia

A=Número de amigos considerados como íntimos

Captura de pantalla 2016-01-31 a las 10.32.42

  1. Estadística descriptiva e Intervalos de confianza:

a) Hacer una estadística descriptiva de la variable Sexo en la muestra de pacientes con Trastorno bipolar y otra en el grupo control.

b) Hacer una estadística descriptiva de la variable Número de amigos en la muestra de pacientes con Trastorno bipolar y otra en el grupo control.

c) Hacer una descriptiva reducida, en dos o tres valores fundamentales, de la variable Coeficiente de inteligencia, en cada uno de los dos grupos del estudio.

d) Hacer una predicción, mediante un intervalo de confianza, del porcentaje de Antecedentes de bipolaridad en familia directa en pacientes con diagnóstico de Trastorno bipolar.

e) Hacer una predicción, mediante un intervalo de confianza, del coeficiente de inteligencia medio poblacional de los pacientes con Trastorno bipolar y otra predicción en el grupo de las personas que no lo tienen.

Soluciones:

a) En el grupo control:

img_3141

img_3142

En el grupo con trastorno bipolar:

img_3143

img_3144

b) Es una variable cuantitativa, y así la describo, pero es de esas variables que podría describirse como cualitativa por el pequeño número de valores posibles que maneja.

En el grupo control:

img_3145

img_3146

En el grupo con trastorno bipolar:

img_3147

img_3148

 c) Para describir brevemente una variable cuantitativa basta ver si hay o no ajuste a la distribución normal.

En el grupo control una descriptiva sería:

img_3149-1

Como tanto la Asimetría estandarizada como la Curtosis estandarizada están entre -2 y +2 podemos resumir esa variable en ese grupo con la media y la Desviación estándar; o sea, 105.78±11.67.

En el grupo de transtorno bipolar la descriptiva es:

img_3150-1

Como tanto la Asimetría estandarizada como la Curtosis estandarizada están fuera del intervalo -2 y +2 debemos resumir esa variable con la mediana y el primer y tercer cuartil; o sea: 101 (95-107).

d) Entre los pacientes con trastorno bipolar los que tienen antecedentes son un 54%:

img_3151-2

Para construir el intervalo de confianza del valor del porcentaje poblacional debemos calcularlo o mediante la fórmula que aparece en el tema 3 ó mediante un software.

Mediante el software calculamos:

img_3152-2

En concreto sale que ese intervalo, expresado en porcentajes, es: (39.32%, 68.19%).

Mediante la fórmula del tema 3:

img_3154

Los resultados no son exactamente iguales porque aunque la fórmula se use el 2, el valor correcto es 1,96 lo que hace que el intervalo exacto, que es el que calcula todo software, sea un poco más estrecho.

e) Para construir un IC del 95% de la media del coeficiente de inteligencia basta tener la media y sumarle y restarle dos veces el error estándar, porque estamos ante una predicción y porque el intervalo es del 95%.

En el grupo control:

Media=105.78

EE=1.65

IC95% de la media: (102.48, 109.08)

En el grupo del trastorno bipolar:

Media=102.2

EE=1.33

IC95% de la media: (99.54, 104.86)

2. Técnicas de relación:

a) Calcular la correlación entre la variable Edad y la variable Coeficiente de inteligencia.

b) ¿Hay relación entre el sexo y tener o no trastorno bipolar?

c) Estudiar si son factores de riesgo o de protección para tener Trastorno bipolar las siguientes variables: Diabetes, Autovaloración negativa, Antecedentes de trastorno bipolar.

Soluciones:

a) Si se calcula la correlación de Pearson se obtiene una R=-0.2593 (p=0.009). Por lo tanto, hay una correlación negativa significativa. Es cierto que una variable (la Edad) no se ajusta bien a la distribución normal y podría calcularse la correlación de Spearman, pero la anormalidad es muy poca y no es tan problemático su incumplimiento a la hora de calcular una correlación de Pearson. No obstante, calcular la de Spearman es perfectamente correcto.

Vista esta correlación deberíamos decir que la gente más joven es ligeramente más inteligente, al ser la correlación negativa. Sin embargo, se trata de una correlación muy débil.

b) Si se hace una ji-cuadrado se detecta una relación estadísticamente significativa (p=0.037 entre sexo y Trastorno bipolar. Los que indica una asociación entre el sexo y esa patología.

c) Las Odds ratio y su intervalo de confianza del 95% son las siguientes:

Diabetes: OR=0.64 (0.12, 2.91)

Autovaloración negativa: OR= 3.54 (1.37, 9.38)

Antecedentes familiares: OR= 6.16 (2.23, 18.05)

Por lo tanto, la diabetes no es un factor ni de riesgo ni de protección. La autovaloración negativa es un factor de riesgo. Tener antecedentes familiares es un factor de riesgo. Observemos que con antecedentes tendrías 6 veces más probabilidad de tener ese trastorno que sin tenerlos.

3. Técnicas de comparación:

a) Hacer una comparación de las medias de la variable Edad entre el grupo control y el grupo de pacientes con trastorno bipolar.

b) Hacer una comparación de los porcentajes de mujeres entre el grupo control y el grupo de pacientes con trastorno bipolar.

c) Hacer una ANOVA de dos factores con interacción de la variable Coeficiente de inteligencia y los factores grupo (Control y Trastorno bipolar) y sexo (Hombre y Mujer).

Soluciones:

a) La variable es continua, las muestras son independientes. Si se aplica el test de Shapiro-Wilk para comprobar la normalidad la muestra del grupo control da un p-valor superior a 0.05 y la muestra del grupo del transtorno bipolar da un p-valor inferior a 0.05. Como no ambas muestras se ajustan a la distribución normal debemos aplicar el Test de Mann-Whitney. Si aplicamos este test el p-valor es superior a 0.05, por lo que la mediana de edad de ambos grupos no es distinta significativamente.

b) La variable es dicotómica. La muestras son independientes. El tamaño de muestras es superior a 30 y el valor esperado por grupo mayor que 5. Debemos aplicar un test de proporciones. Da un p-valor de 0.032, lo que indica que la proporción de mujeres en ambos grupos es distinta significativamente.

c) El ANOVA de dos factores da un p-valor menor que 0.05, en cada uno de los dos factores, y un p-valor superior a 0.05 en la interacción. Como se trata de dos factores con dos niveles cada uno es evidente que únicamente tenemos dos grupos homogéneos en cada uno de los dos factores.

El concepto de influencia estadística

En la imagen que se adjunta a continuación:

IMG_1325

se puede ver un extraordinario ejemplo del concepto de INFLUENCIA en Estadística. Observad cómo hay una enorme infuencia en la recta de Regresión por parte de los países Korea y Singapore. Cualquier otro punto (país) lo podemos quitar y la recta no cambiaría, por lo que son puntos con poca influencia. Sin embargo, si quitáramos esos dos puntos, especialmente el de Singapore la recta cambiaría muchísimo. Tanto cambiaría que pasaría a no tener pendiente y tendríamos que decir que no hay relación entre estas dos variables estudiadas. Eso es la influencia estadística. En una muestra no todos los puntos tienen la misma influencia. En ocasiones, algunos valores tiene una elevadísima influencia. Por otro lado, esto ocurre en muchos otros ámbitos: Por ejemplo, en el Barça la influencia de Messi es como la de Singapore en ese gráfico. Sin él el Barça no sería lo mismo.

Otro caso de influencia es la siguiente muestra: (0, 1, 2, 3, 94). Para la media muestral de esta muestra, que es 20, no tienen la misma influencia los cinco valores. Es evidente que el 94 tiene una mucho mayor influencia.

Detectar influencias es muy importante en estadística. Existen diferentes mecanimos para detectar influencias. Un ejemplo es el Criterio de Cook para detectar influencia estadística en regresión.

Base de datos de Demencias 5: Comparación de poblaciones

A partir de la base de datos de demencias contestar a las siguientes preguntas:

1. Comparar, mediante la técnica estadística adecuada al caso, el porcentaje de diabéticos entre los enfermos con demencia Alzhéimer y los enfermos con demencia vascular.

2. Comparar, mediante la técnica estadística adecuada al caso, el volumen del hipocampo a los tres años de diagnóstico entre los enfermos con demencia Alzéimer y los enfermos con demencia vascular.

3. Comparar, mediante la técnica estadística adecuada al caso, si hay diferencia significativa entre el Mini-Mental en el diagnóstico y a los tres años del diagnóstico en los enfermos con demencia vascular.

4. Comparar, mediante la técnica estadística adecuada al caso, si hay diferencia significativa entre el Mini-Mental en el diagnóstico y a los tres años del diagnóstico en los enfermos con demencia Alzhéimer.

5. Comparar, mediante la técnica estadística adecuada al caso, el Mini-Mental a los tres años de diagnóstico entre los enfermos con demencia Alzéimer y los enfermos con demencia vascular.

6. Comparar, mediante la técnica estadística adecuada al caso, el porcentaje de pacientes diagnosticados de demencia que pierden 4 ó más unidades de Mini-Mental a los tres años de diagnóstico entre los hombres y las mujeres.

7. Comparar el volumen del hipocampo a los tres años de diagnóstico entre los tres tipos de demencia estudiados.

 Soluciones:

1.

La variable estudiada es dicotómica.

Alzhéimer: 38% de diabéticos.

Vascular: 58% de diabéticos.

Como el tamaño de muestra por grupo es mayor que 30 y el valor esperado por grupo mayor que 5 aplicamos un test de proporciones.

Test de proporciones: p=0.045

Hay diferencias estadísticamente significativas.

2.

Shapiro-Wilk en Alzhéimer: p=0.193

Shapiro-Wilk en Vascular: p=0.074

Test de Fisher-Snedecor: p=0.79

Test de la t de Student de varianzas iguales: p<0.0001

Por lo tanto, hay diferencias significativas. El volumen es significativamente menor en los enfermos con Alzhéimer.

3.

Shapiro-Wilk de la diferencia: p<0.0001

Al no haber normalidad de la diferencia aplicamos el test de Wilcoxon.

Test de Wilcoxon: p<0.0001

Hay una bajada significativa del Mini-Mental.

4

Shapiro-Wilk de la diferencia: p<0.0001

Al no haber normalidad de la diferencia aplicamos el test de Wilcoxon.

Test de Wilcoxon: p<0.0001

Hay una bajada significativa del Mini-Mental.

5.

Shapiro-Wilk en Alzhéimer: p=0.0149

Shapiro-Wilk en Vascular: p=0.0298

Test de Mann-Whitney: p<0.05

Por lo tanto, hay diferencias significativas. El Mini-Mental a los tres años de diagnóstico es significativamente distinto entre los enfermos con Alzhéimer y demencia vascular..

6.

Hombres: 36/53=0.679

Mujeres: 66/97=0.68

Test de proporciones: p=0.989

No hay diferencias estadísticamente significativas.

7.

Como es una comparación de tres grupos debemos aplicar un ANOVA de un factor con tres niveles.

ANOVA de un factor: p<0.0001

Como hay diferencias significativas debemos de ver cuáles son esas diferencias. Para ello aplicamos un Test de comparaciones múltiples. Si aplicamos el test LSD obtenemos tres grupos homogéneos. Cada enfermedad estudiada es, por lo tanto, diferente de las otras dos en cuanto al volumen del hipocampo a los tres años de diagnóstico. La media de Alzhéimer es 3.88, la de demencia mixta es 4.05 y la de demencia vascular 5.61.

Tres problemas de error de tipo I, error de tipo II, potencia y de determinación del tamaño de muestra

1. Sea X una variable que se ajusta bien a una distribución Normal  de media m y desviación típica 2.

a) Construimos un test donde la hipótesis nula es m=2 y la hipótesis alternativa m>2 y definimos una región crítica como: W= «muestras de tamaño 3 de modo que la suma supere las 7 unidades». Obtener el error tipo I.

b) Determinar el tamaño de muestra necesario para detectar una diferencia de 0.5 unidades con error tipo I igual a 0.05 y error tipo II igual a 0.15.

Solución:

IMG_1169

Observemos que para determinar el tamaño de muestra vamos a trabajar con la variable suma de tres observaciones y con la media muestral de esa variable. Buscar el tamaño de muestra es buscar cuál será el valor de la desviación estándar de la variable media muestral (del denominado error estándar), o sea, buscar cuál es el valor de la amplitud de esa campana de Gauss para que al construir una zona crítica de área 0.05, dibujada con color verde, el área que indica el error de tipo II sea 0.15. Observemos que las dos campanas de Gauss dibujadas, una con media 6 y la otra con media 6.5, es porque la diferencia mínima que se pretende detectar es de 0.5.

IMG_1202

Los valores 1.645 y 1.038 se obtienen de las tablas de la N(0, 1).

2. Sea X una variable discreta. Construimos un test donde la hipótesis nula es que la distribución de X es una Poisson de parámetro 2 mientras que la hipótesis alternativa afirma que es una distribución geométrica (Pascal) de parámetro 0.1.

Se define un criterio de decisión del siguiente modo: Se toma una muestra de tamaño 2 y se acepta la hipótesis alternativa si ninguno de los dos valores obtenidos en la muestra es 0.

Obtener error tipo I y error tipo II.

Solución:

IMG_1200

Observemos que lo importante aquí es saber delimitar cuál es la zona crítica W, la zona que se usará como criterio de decisión. Para el cálculo tanto del error de tipo I como de la potencia (y después del error de tipo II) debemos calcular el área de esa zona crítica si es cierta la hipótesis nula (para el cálculo del error de tipo I) y si es cierta la hipótesis alternativa (para el cálculo de la potencia).

3. Se desea realizar un contraste en que la hipótesis nula es que una variable sigue una distribución Poisson de parámetro 3, mientras que la alternativa es que esa variable tiene por densidad la siguiente función: f(x)=1/9 si x=0, 1, …, 8. Si el criterio de decisión consiste en aceptar la hipótesis alternativa si, al tomar dos valores muestrales, en condiciones independientes, los dos valores son iguales o mayores a 6 unidades, se pide el error tipo I  y la potencia.

Solución:

IMG_1201

Observemos que lo importante aquí, de nuevo, es saber delimitar cuál es la zona crítica W, la zona que se usará como criterio de decisión. Para el cálculo tanto del error de tipo I como de la potencia debemos calcular el área de esa zona crítica si es cierta la hipótesis nula (para el cálculo del error de tipo I) y si es cierta la hipótesis alternativa (para el cálculo de la potencia).

Base de datos de Demencias 4: Relación entre variables cualitativas

A partir de la base de datos de Demencias contestar a las siguientes preguntas:

1. ¿Hay alguna relación significativa entre la variable Grupo y alguna otra de las variables cualitativas? Si en algún caso la hay, calcular la V de Crámer.

2. ¿Hay relación significativa entre la variable Nivel de estudios y las variables sexo, diabetes, hipertensión y enfermedad coronaria? Si en algún caso la hay, calcular la V de Crámer.

3. Entre los enfermos con Alzhéimer, ¿es un factor de riesgo o un factor de protección ser diagnosticado antes de los 70 años, para que el descenso de Mini-Mental a los 3 años de diagnóstico sea mayor de 2 puntos (o sea, 3 ó más)? Calcular la Odds ratio y su intervalo de confianza del 95%.

Soluciones:

IMG_1303

IMG_1304

IMG_1305

IMG_1306

IMG_1307

IMG_1308

IMG_1309

IMG_1310

IMG_1311

IMG_1312

Un estudio para aplicar ANOVA, ANCOVA, ANOVA de medidas repetidas, Regresión simple y Regresión múltiple

Vamos a plantear un estudio para poder visualizar, a partir de él, el uso de técnicas tan importantes como el ANOVA, el ANCOVA, el ANOVA de medidas repetidas, la Regresión simple y la Regresión múltiple .

Para seguir mejor la teoría de estas técnicas se pueden consultar los siguientes ficheros: Tema 15: ANOVA,  Tema 30: Ampliación de ANOVATema 6: Introducción a la REGRESIÓNTema 12: Regresión múltiple y otros links de artículos que se van encontrando en el interior de estos temas.

Es interesante ver, a través de ejemplos de este tipo, las peculiaridades de diferentes técnicas. Es la forma de ir delimitando qué podemos hacer con cada una de las diferentes técnicas estadísticas que tenemos a nuestro alcance.

Veamos los datos del estudio que vamos a trabajar:

IMG_0783

Tenemos 30 alumnos que al final de sus estudios de primaria y antes de comenzar la ESO se les hace una prueba homologada de nivel de inglés escrito y de nivel de inglés oral. A continuación se distribuyen en tres grupos en un centro de bachillerato donde se va a realizar un experimento didáctico durante toda la ESO. Los primeros 10 (el grupo 1) van a un grupo Control donde realizarán la formación de inglés clásica en una asignatura anual de inglés cada uno de los cuatro cursos. El grupo 2 se integra en un grupo donde se realizan dos horas más semanales de inglés, pero mediante el método clásico. El grupo 3 se integra en un grupo donde cada año van a tener una asignatura (Biología, Física, Matemáticas, etc.) en inglés. Aunque en el centro son muchos los alumnos distribuidos de esta forma se ha hecho un seguimiento focalizado de estos 30 alumnos. (En realidad, esto se podría hacer con todos los alumnos pero lo supongo así para que el número de datos a manejar sea más pequeño y se pueda apreciar, mirando los datos, lo que las técnicas van mostrando).

Estos alumnos integrados en sus grupos respectivos van a ser sometidos a un examen de inglés oral al final de cada curso: IO1, IO2, IO3 e IO4.

De los 10 alumnos de cada grupo se han tomado 5 con un nivel de aprobado únicamente de primaria y otros 5 con un nivel de notable o sobresaliente de primaria. Son los dos grupos de la columna encabezada como Nivel.

En primer lugar se realiza un ANOVA de la variable InglésOral al final de primaria, en los tres grupos, con la finalidad de comprobar que realmente empezamos el experimento con tres grupos con el mismo nivel basal de inglés.

El resultado de este ANOVA con un único factor es el siguiente:

IMG_0785

En este primer caso mostramos la comprobación de la normalidad y la igualdad de varianzas, cosa que no haremos en el resto de casos, para ahorrar espacio, pero cosa que debe hacerse siempre, evidentemente.

La normalidad se comprueba con el Test de Shapiro-Wilk. Observemos que se hacen tres test: uno para cada uno de los grupos que tenemos. Los tres dan un p-valor por encima de 0.05, lo que permite mantener la hipótesis nula de ajuste a la normalidad. Para comprobar la igualdad de varianzas aplicamos el Test de Levene en este caso. Hay otros tests para ello, como también los hay para comprobar el ajuste a la normalidad. Mediante el Test de Levene comprobamos que, como el p-valor es también mayor que 0.05, podemos aceptar la igualdad de varianzas. Estamos pues en las condiciones del modelo ANOVA puesto que la independencia también se cumple. Son 30 alumnos elegidos en un instituto, ninguno de ellos es familiar de otro, no hay, por lo tanto, posibilidad de dependencia.

A continuación se aplica un ANOVA de un factor. Se observa que el p-valor es 0.7464. Esto nos indica que no hay diferencia de medias significativa en los niveles basales de estos tres grupos. Lo podemos visualizar en el gráfico de las medias con sus respectivos intervalos de confianza de la media del 95%. Hemos mostrado también, aunque en este caso no haría falta hacerlo, una prueba de comparaciones múltiples. En concreto el Test LSD. Evidentemente, en este caso, no hay ninguna diferencia significativa entre los tres grupos, como había mostrado previamente el ANOVA. En realidad, esta prueba únicamente se realiza si previamente el ANOVA ha detectado diferencias de medias significativas.

A continuación podemos hacer un ANOVA pero ahora ya con el nivel de inglés al final del primer año; o sea, con la variable IO1. Observemos que los resultados los tenemos en la primera de las dos tablas ANOVA que se muestran el el gráfico siguiente. Tenemos un p-valor de 0.2052. Con intervalos de confianza del 95% dela media todavía solapados. Es verdad que captamos un ligero aumento de la media del grupo 3 pero todavía lo capta como no significativa. Observemos que los intervalos todavía se solapan todos.

Pero debajo mostramos la aplicación de un ANCOVA. Muy importante en este caso. Porque las diferencias de media que hay entre los tres grupos no los capta como significativos el ANOVA hecho anteriormente porque ve que hay mucha dispersión de valores dentro de cada grupo. Esto la Estadística, cualquier técnica estadística, lo capta como un elemento que introduce dudas en las decisiones. Pero con el ANCOVA, al introducir como covariable el nivel de partida de los alumnos, de hecho estamos explicando esa dispersión y podemos disminuir los intervalos de confianza que ahora ya no se solapan. El grupo 3 se ha desprendido ya de los otros dos. Y el p-valor del factor grupo ya es significativo. Observemos con detenimiento la comparación del ANOVA (el primer análisis) y el ANCOVA (el segundo análisis):

IMG_0787

Si aplicamos a esa misma variable un ANOVA de dos factores: Grupo y Nivel, observemos que obtenemos algo en cierta forma similar a lo que obteníamos con el ANCOVA: ver diferencias entre los tres grupos, porque ahora, al introducir el factor Nivel, estamos comparando no los tres grupos entre sí, sino que comparamos los tres grupos pero nivel a nivel. Esto es más fino, porque comparamos grupos más homogéneos. De hecho, el ANCOVA, al introducir la covariable hace esto pero con una variable más fina, porque es cuantitativa y no cualitativa. Aunque en este caso hemos de tener en cuenta que una variable no es la discretización del nivel de inglés oral, es la discretización del nivel global que ha tenido el alumno a lo largo de los estudios primarios. Observemos los resultados:

IMG_0788

Observemos varias cosas en estos resultados:

En los tres grupos observamos unas comparaciones múltiples curiosas: el grupo 1 y el 3 muestra diferencias significativas, pero el 1 y 2 así como el 2 y 3 no son diferentes significativamente. Observemos que los intervalos de confianza de 1 y 2 se tocan y los de 2 y 3, aunque muy poco, se tocan un poquito también.

Y otra cosa importante: La interacción no es significativa. Observemos que en el gráfico de interacciones se observa un progresivo aumento en los grupos, del nivel de inglés oral, pero aunque se aprecia una cierta pérdida del paralelismo al llegar al grupo 3 (las medias están más separadas que en los otros grupos) no se trata de una interacción significativa puesto que el p-valor es 0.2216.

Si aplicamos ese mismo ANOVA pero con la variable IO4 observamos que las diferencias son claramente entre 3 y los otros dos grupos y observamos, también, cosa muy importante, que hay interacción ahora sí significativa (p=0.0363):

IMG_0789

Esta interacción es muy interesante porque está indicando que son los buenos alumnos los que aprovechan mejor un sistema como el ensayado en el grupo 3. Obsérvese que la IO4, en conjunto, aumenta, en el grupo 3, respecto a los otros dos grupos, pero, además, obsérvese que la diferencia entre el nivel bajo y el alto de alumnos es mucho mayor en el grupo 3 que no en los otros dos grupos: esto es lo que nos indica que hay interacción estadísticamente significativa.

Si quisiéramos analizar no un punto, como hemos hecho estudiando al final de la ESO, en cuarto, sino si quisiésemos analizar la evolución de los cuatro tiempos, ver si hay cambios y relacionarlo con los factores estudiados, deberíamos aplicar el ANOVA de medidas repetidas. Las notas al final de cada curso de la ESO se puede ver como un nivel de un factor intrasujetos; o sea, de un factor que tiene cuatro niveles temporales que se van midiendo a cada uno de los alumnos, a cada uno de los sujetos. Esto se podría analizar solo, con una ANOVA de medidas repetidas con ese único factor intrasujetos, pero también se podría analizar con un ANOVA de medidas repetidas que incorporara factores intersujetos; o sea, factores como los que hemos visto antes: los factores típicos del ANOVA, los factores donde en cada nivel hay diferentes individuos, diferentes sujetos a estudiar.

Si incorporarmos los dos factores intersujetos: Grupo y Nivel podemos hacer un ANOVA de medidas repetidas de un factor intrasujeto (los cuatro finales de los cuatro cursos de ESO) y los dos factores intersujetos que ya hemos estudiado. Ahora se analizarán no valores sino, digamos: perfiles de valores a lo largo de esos cuatro años. Se verá si hay cambios significativos en los cuatro años y si eso cambios son distintos según el Grupo, según el Nivel y según la interacción Grupo con Nivel.

Los resultados son los siguientes. Lo primero es la comprobación de la esfericidad de los datos. Esto es equivalente a la prueba de comparación de varianzas del ANOVA. El resultado es el siguiente:

IMG_0804

No hay esfericidad. La hipótesis nula es que hay esfericidad, como el p-valor es menor que 0.05 debemos rechazar tal hipótesis. Esto nos lleva a evaluar el ANOVA de medidas repetidas mediante métodos multivariantes; o sea, con los estadístico que se dan en la siguiente tabla:

IMG_0803

O con las modificaciones de los grados de libertad de la distribución F de referencia que introduce en el típico análisis de una tabla ANOVA  unas correcciones que se han propuesto históricamente para estos casos (Greenhouse-Geise, Huynh-Feldt o la llamada del «límite inferior»):

IMG_0805

En todo caso se llega a lo mismo prácticamente. Hay un cambio a lo largo del tiempo, cosa evidente si se ven los datos. Se podría decir: «sólo faltaría que no hubiera cambio a lo largo de los cuatro años en el nivel de inglés». Lo interesante es aquí ver si hay interacciones entre el tiempo y los factores intersujetos: Grupo y Nivel. Tiempo con Grupo es claramente significativo, lo que nos indica que los perfiles de cambio a lo largo del tiempo son distintos según el grupo. No es significativo, sin embargo, Tiempo con Nivel, lo que nos indica que los dos niveles en conjunto no presentan una diferencia significativa en el perfil. Respecto a Tiempo con la interacción Grupo y Nivel estamos en la frontera: observemos que con métodos multivariantes estamos un poco por encima de 0.05 y, sin embargo, con el método ANOVA modificado estamos un poco por debajo o en la frontera (debemos tener en cuenta que estamos trabajando con pocos datos, con un tamaño de muestra expresamente pequeño para poder visualizar las cosas) del nivel de significación 0.05.

Observemos que es lógico ver lo que estamos viendo. Miremos, en primer lugar, los tres gráficos siguientes que son los dibujos de los perfiles, alumno a alumno, en función del grupo al que pertenecen. Recordemos que grupo 1 es el grupo control, que grupo 2 reciben alguna clase más de inglés tradicional y que el grupo 3 es que al que se le da una asignatura en inglés:

IMG_0809

IMG_0810

IMG_0811

Observemos que se trata de tres grupos de perfiles donde el tercero presenta una diferencia relevante con los otros dos. Es cierto que hay variación dentro de cada grupo pero hay una cierta homogeneidad en la forma de aumentar entre dentro de cada grupo y, además, la forma de aumentar en el grupo 3 es con mayor pendiente. Esto es lo que capta como significativo el análisis.

Veamos ahora lo mismo pero organizado por los dos niveles:

IMG_0812

IMG_0813

Ahora podemos observar perfectamente que hay bastante heterogeneidad de perfiles en cada uno de los dos grupos: en algunos alumnos hay bastante pendiente, en otros no. Esto impide poder decir que sea significativa la tendencia a tener mayor pendiente que tiene el nivel 2. No lo detecta como significativo. Cuando hay mucha dispersión interna en los grupos comparados es difícil que la estadística marque como significativas diferencias globales que haya entre esos grupos. Es lo que sucede aquí.

Respecto a los factores intersujetos individualmente los resultados son los siguientes:

IMG_0806

Grupo y Nivel son significativos y la interacción no. Aquí se miran los datos del tiempo agregados, sin tener en cuenta el perfil.

Regresiones es posible hacer muchas en este contexto. Una posible sería relacionar el Nivel oral de inglés con el escrito que tenemos de los alumnos al final de la primaria para pronosticar el nivel escrito de un alumno, y que aquí no tenemos, de los alumnos en cualquier momento. Es cierto que es posible que esta relación cambie con el tiempo. Es verdad, pero si no se tuviera más información sería factible hacerlo, teniendo en cuenta, como siempre que se hacen predicciones, que estamos en un territorio complejo.

Si hacemos una Regresión lineal simple entre el Nivel de Inglés escrito y el oral, como lo que querremos pronosticar será el escrito, esa variable será la que deberemos poner en la posición de la variable dependiente. Veamos el resultado:

IMG_0784

Tenemos un buen ajuste, con una buena R al cuadrado (94.6%). El modelo es:

InglésEscrito=1.04903*InglésOral+4.13641

Se traba de una buena modelización. En realidad, como hemos dicho, para pronosticar el nivel de inglés escrito a partir del conocimiento el nivel de inglés oral a finales de primaria. No tiene porque ser esa la relación que haya siempre, a cualquier nivel de la enseñanza. Sin embargo, esto nos enseña que uno tiene que usar, de la forma más coherente, la información que tiene, sabiendo las limitaciones en cada situación.

Otras regresiones podrían hacerse. Por ejemplo, grupo por grupo, podría hacerse el pronóstico, al acabar la primaria, del nivel de inglés oral que tendrá el niño o niña al final de la ESO. A continuación se muestran esas tres regresiones lineales simples. Con variable dependiente el nivel de inglés oral a los 4 años de ESO (IO4) y la variable independiente nivel de inglés al final de primaria (InglésOral):

IMG_0796

IMG_0797

IMG_0798

Como puede observarse la R al cuadrado, el denominado coeficiente de determinación es más grande en este tercer grupo, lo que indica que la capacidad predictiva es superior, en este caso.

Si ahora intentamos pronosticar una variable dependiente con dos o más variables independientes entramos en el ámbito de la Regresión múltiple.

Vamos a intentar, en primer lugar, pronosticar IO4 mediante InglésOral e InglésEscrito; o sea, mediante los dos datos que tenemos a finales de primaria. Por lo tanto, se trata de la construcción de un modelo que intenta pronosticar con esa información lo que sucederá cuatro años después. La regresión da lo siguiente:

IMG_0799

Si aplicamos el Stepwise regression, en su versión forward (hacia delante), el procedimiento acaba eliminado una variable, la InglésEscrito, puesto que el muy pequeño aumento de precisión que introduce teniendo ya la variable InglésOral no justifica su entrada puesto que existe colinealidad entre esas dos variables independientes y esto es muy perjudicial en las estimaciones de los coeficientes del modelo final. El resultado es, pues, el siguiente:

IMG_0800

Supongamos que estamos a comienzos de tercero de ESO y por lo tanto tenemos cuatro de las variables que hemos registrado. Y queremos hacer un pronóstico de la variable IO4; o sea, del nivel de inglés oral de un alumno al final de la ESO. La Regresión múltiple nos daría:

IMG_0801

Si aplicamos Stepwise regression:

IMG_0802

Como puede verse, puesto que se muestra el procedimiento paso a paso que sigue el procedimiento, al final acaba seleccionando únicamente dos de las cuatro variables independientes, en el modelo: InglésOral e IO2.

Aquí no estamos distinguiendo por grupos, hemos trabajado con los tres grupos por separado. Parece evidente que sería recomendable trabajar grupo por grupo para conseguir mejores predicciones.

Finalmente, facilito los datos por si alguien los quiere descargar y trabajar con ellos:

Alumno InglésEscrito InglésOral Grupo Nivel IO1 IO2 IO3 IO4
1 12 11 1 1 14 17 20 23
2 18 14 1 1 17 20 23 26
3 25 18 1 1 23 28 33 38
4 14 7 1 1 12 17 22 27
5 19 10 1 1 14 18 22 26
6 36 30 1 2 37 44 51 55
7 34 26 1 2 32 38 44 48
8 35 27 1 2 27 27 27 27
9 22 22 1 2 30 38 46 54
10 25 19 1 2 21 23 25 27
11 10 7 2 1 12 17 22 27
12 20 16 2 1 24 32 40 48
13 27 22 2 1 25 28 31 34
14 16 12 2 1 17 22 27 32
15 21 15 2 1 16 17 18 19
16 28 21 2 2 21 21 21 21
17 36 27 2 2 29 31 33 35
18 34 30 2 2 32 34 36 38
19 50 44 2 2 46 48 50 52
20 28 24 2 2 34 44 54 64
21 14 7 3 1 18 29 40 47
22 20 11 3 1 18 25 32 39
23 9 7 3 1 11 20 25 30
24 10 9 3 1 20 23 30 37
25 21 19 3 1 34 49 55 58
26 28 25 3 2 44 60 65 73
27 36 32 3 2 39 55 66 78
28 47 39 3 2 44 49 54 80
29 34 30 3 2 46 52 55 84
30 35 29 3 2 40 50 66 75

Base de datos de Demencias 3: Correlación y Regresión

A partir de la base de Demencias contestar a las siguientes preguntas:

1. Calcular la correlación entre la Edad y el nivel de Mini-Mental a tiempo 0, en toda la muestra.

2. Calcular la correlación entre Edad y Diferencia de Mini-Mental a los 3 años de diagnóstico menos Mini-Mental en el diagnóstico en los pacientes con Alzhéimer, por un lado, y en los pacientes con Demencia vascular, por otro. ¿Qué parecen apuntar estos resultados?

3. Calcular la correlación entre el nivel de Mini-Mental a los 3 años de diagnóstico y el volumen del Hipocampo en cada uno de los tres grupos de pacientes con demencia: Alzhéimer, Demencia vascular y Demencia mixta. ¿Qué parecen apuntar estos resultados?

4. Predecir el volumen del hipocampo que tendrá una persona que tenga Alzhéimer, que lleve tres años desde el diagnóstico, y que tenga un Mini-Mental de 18.

5. Predecir la pérdida de Mini-Mental que tendrá, en los próximos tres años, una persona que se le acaba de diagnosticar la enfermedad de Alzhéimer y que tiene 60 años.

Soluciones:

IMG_1300

IMG_1301

IMG_1302

Base de datos de Demencias 2: Estadística descriptiva e intervalos de confianza

En la base de datos de Demencias que aparece en el artículo Base de datos de Demencias 1: Base de datos, aplicar los siguientes técnicas estadísticas:

1. Hacer una estadística descriptiva de las variables Nivel de estudios, Diabetes, Hipertensión y Enfermedad coronaria, en los 200 pacientes de la base de datos.

2. Hacer una estadística descriptiva (Media y Desviación estándar o Mediana y Rango intercuartílico) del nivel de Mini-Mental, a los 3 años del diagnóstico, de los pacientes con Alzhéimer, otra de los pacientes con Demencia Vascular y, finalmente, otra de los pacientes con Demencia Mixta.

3. Hacer un Box-Plot del nivel del Mini-Mental, a los 3 años del diagnóstico, de los 150 pacientes con el diagnóstico de alguna de las tres demencias.

4. Construir un intervalo de confianza del 95% del porcentaje de diabetes, del porcentaje de hipertensión y del porcentaje de enfermedad coronaria que hay en la población que representa esta muestra en su globalidad; o sea, teniendo en cuenta la muestra de tamaño 200.

5. Construir un intervalo de confianza del 95% de la media del Mini-Mental que tienen, a los tres años del diagnóstico, los pacientes con Alzhéimer, otro intervalo también de la media de los pacientes con Demencia vascular, finalmente, otro de los pacientes con Demencia mixta.

 Soluciones:

IMG_1295

IMG_1296

IMG_1297

IMG_1298

IMG_1299

 

Base de datos de Demencias 1: Base de datos

La siguiente base de datos de pacientes de demencia tiene la siguientes variables:

P=Número de Paciente

G=Grupo (Control, Alzhéimer, Demencia vascular y Demencia mixta)

S=Sexo

E=Edad

ES=Nivel de estudios (A=Analfabeto, P=Primarios, M=Mediosy S=Superiores)

D=Diabetes mellitus

H=Hipertensión

C=Enfermedad coronaria

MM0=Valor del Mini-Mental State Examination (MMSE) en el diagnóstico

MM3=Valor del Mini-Mental a los 3 años del diagnóstico

Dif=MM0-MM3

VH3=Volumen del Hipocampo a los 3 años del diagnóstico en cc

P G S E ES D H C MM0 MM3 Dif VH3
1 Control h 60 P Si Si No 27 27 0 5.5
2 Control h 79 M No No No 27 27 0 5.5
3 Control h 71 M No Si No 27 28 -1 5.7
4 Control h 66 P Si No Si 28 27 1 5.4
5 Control m 69 A No No Si 27 27 0 5.3
6 Control m 62 M No Si No 30 30 0 6.1
7 Control m 60 P Si Si No 28 28 0 6.0
8 Control m 63 P Si No No 27 27 0 5.4
9 Control m 77 P No No Si 28 28 0 5.6
10 Control h 63 M No Si No 28 28 0 5.6
11 Control h 79 P Si Si No 29 29 0 5.8
12 Control h 55 S Si Si No 27 27 0 5.5
13 Control m 72 P No No No 29 29 0 5.5
14 Control m 68 P No No No 29 29 0 5.7
15 Control h 81 M No Si Si 28 28 0 5.6
16 Control h 71 P No Si Si 27 27 0 5.3
17 Control m 61 M No No No 27 27 0 5.4
18 Control m 76 P Si No No 27 27 0 5.4
19 Control m 72 P No No No 30 29 1 6.2
20 Control m 63 A No Si No 28 28 0 5.7
21 Control m 67 M No No No 28 28 0 5.5
22 Control h 69 P Si Si No 28 28 0 5.6
23 Control h 60 P No No No 28 28 0 5.7
24 Control m 64 P No No Si 28 28 0 5.9
25 Control m 73 M Si Si Si 30 30 0 6.0
26 Control m 66 P Si Si No 29 29 0 5.5
27 Control m 76 S No No No 27 28 -1 5.8
28 Control h 75 P No No No 27 27 0 5.6
29 Control m 62 P Si Si Si 29 29 0 5.6
30 Control m 78 M Si Si No 28 27 1 5.6
31 Control h 57 P No No No 29 27 2 5.2
32 Control h 58 M No No No 28 29 -1 5.7
33 Control m 63 P Si Si No 28 29 -1 5.8
34 Control m 65 P No No No 26 27 -1 5.5
35 Control m 74 A No No Si 27 27 0 5.2
36 Control m 61 M Si Si Si 29 29 0 6.2
37 Control h 71 P No No No 27 29 -2 6.2
38 Control m 71 P No No No 27 28 -1 5.5
39 Control m 63 P Si Si No 28 28 0 5.4
40 Control h 67 M Si No No 29 29 0 6.0
41 Control h 69 P No Si No 28 30 -2 6.1
42 Control m 63 P No Si Si 27 29 -2 5.6
43 Control m 75 P Si No Si 29 27 2 5.8
44 Control m 69 P Si No No 27 26 1 5.1
45 Control m 62 M No Si No 30 30 0 5.6
46 Control m 66 M No No No 27 28 -1 5.8
47 Control h 57 P Si No Si 26 26 0 4.9
48 Control h 62 P No Si No 29 28 1 5.9
49 Control h 59 A No Si No 29 28 1 5.4
50 Control m 72 M Si No No 28 28 0 5.4
51 Alzhéimer m 78 P No No Si 24 22 2 4.4
52 Alzhéimer m 73 P No Si No 24 21 3 4.3
53 Alzhéimer m 63 P No No No 23 21 2 4.2
54 Alzhéimer h 65 M Si No No 23 20 3 4.0
55 Alzhéimer m 67 P Si Si No 23 20 3 4.1
56 Alzhéimer m 66 A No Si No 24 20 4 4.0
57 Alzhéimer h 75 P No No Si 22 18 4 3.6
58 Alzhéimer h 62 P Si No Si 21 17 4 3.4
59 Alzhéimer m 71 M No Si No 23 20 3 4.1
60 Alzhéimer m 59 P No No No 20 16 4 3.3
61 Alzhéimer m 66 M Si No No 24 21 3 4.3
62 Alzhéimer m 64 P Si Si No 23 20 3 4.1
63 Alzhéimer m 65 P No Si No 22 17 5 3.5
64 Alzhéimer h 71 A No No Si 24 22 2 4.5
65 Alzhéimer h 68 M Si No Si 21 18 3 3.7
66 Alzhéimer h 73 P No Si No 21 20 1 4.1
67 Alzhéimer m 64 P No Si No 21 18 3 3.6
68 Alzhéimer m 60 P Si No No 22 19 3 3.8
69 Alzhéimer m 76 M Si No Si 21 18 3 3.6
70 Alzhéimer m 64 P No Si No 23 20 3 4.0
71 Alzhéimer h 68 S No No No 22 18 4 3.7
72 Alzhéimer m 63 P Si No No 23 20 3 4.1
73 Alzhéimer m 68 P No Si Si 21 18 3 3.7
74 Alzhéimer h 73 M No No No 21 20 1 4.1
75 Alzhéimer h 62 P Si No No 20 17 3 3.4
76 Alzhéimer m 65 M Si Si No 23 19 4 3.9
77 Alzhéimer m 76 P No Si No 22 20 2 4.0
78 Alzhéimer m 61 P No No No 21 17 4 3.4
79 Alzhéimer m 67 A Si No Si 21 18 3 3.7
80 Alzhéimer m 64 M No Si Si 21 18 3 3.7
81 Alzhéimer h 64 P No Si No 24 21 3 4.3
82 Alzhéimer m 69 P Si No No 20 18 2 3.7
83 Alzhéimer m 74 P Si No No 22 19 3 3.9
84 Alzhéimer m 57 M No Si No 24 19 5 3.9
85 Alzhéimer h 67 P No No No 23 20 3 4.0
86 Alzhéimer h 73 S Si No Si 22 19 3 3.9
87 Alzhéimer m 74 P No Si Si 21 19 2 3.8
88 Alzhéimer m 72 P No Si No 21 18 3 3.7
89 Alzhéimer m 78 M No No Si 24 21 3 4.3
90 Alzhéimer m 68 M No No No 23 19 4 3.8
91 Alzhéimer h 73 P No Si No 20 18 2 3.7
92 Alzhéimer m 64 P No No No 23 20 3 4.0
93 Alzhéimer h 75 A Si No No 22 18 4 3.7
94 Alzhéimer h 63 M No Si No 23 20 3 4.0
95 Alzhéimer m 79 P No Si Si 21 20 1 4.0
96 Alzhéimer m 77 P Si No Si 24 22 2 4.4
97 Alzhéimer m 76 P Si No No 21 18 3 3.7
98 Alzhéimer m 62 M No No No 22 17 5 3.4
99 Alzhéimer h 70 P No No No 21 18 3 3.7
100 Alzhéimer m 73 P Si Si No 21 19 2 3.9
101 Vascular m 73 P Si Si No 20 17 3 5.3
102 Vascular h 75 P No No Si 20 14 6 5.5
103 Vascular h 72 M No Si Si 20 14 6 5.5
104 Vascular m 71 P Si No No 21 13 8 5.7
105 Vascular m 78 M No No No 18 12 6 5.4
106 Vascular m 61 P No Si No 20 14 6 5.3
107 Vascular h 66 P Si No Si 21 16 5 6.1
108 Vascular h 69 A No No No 19 13 6 6.0
109 Vascular m 76 M No Si No 20 14 6 5.4
110 Vascular m 77 P No Si No 18 16 2 5.6
111 Vascular m 73 P Si No No 20 14 6 5.5
112 Vascular m 61 P Si No No 20 13 7 5.5
113 Vascular h 72 M No Si Si 18 12 6 5.7
114 Vascular m 56 P No No Si 20 18 2 5.4
115 Vascular m 63 P Si No No 20 14 6 5.3
116 Vascular h 67 P Si Si No 20 16 4 6.1
117 Vascular h 63 S Si Si No 21 14 7 6.0
118 Vascular m 73 M Si No No 20 14 6 5.4
119 Vascular m 55 P Si No No 19 12 7 5.6
120 Vascular m 65 M No No Si 20 13 7 5.5
121 Vascular m 58 P Si No Si 21 16 5 5.5
122 Vascular h 74 P Si Si No 21 15 6 5.7
123 Vascular h 61 P No Si No 20 15 5 5.4
124 Vascular m 70 M Si Si Si 21 14 7 5.3
125 Vascular m 58 P Si Si No 20 14 6 6.1
126 Vascular m 62 P Si Si No 21 14 7 6.0
127 Vascular m 63 P No Si No 21 14 7 5.4
128 Vascular h 61 M No No No 18 13 5 5.6
129 Vascular m 71 P Si Si No 18 11 7 5.6
130 Vascular m 60 P Si Si Si 21 15 6 5.8
131 Vascular h 77 P No Si Si 20 12 8 5.5
132 Vascular h 73 P No Si No 19 13 6 5.2
133 Vascular m 69 M Si No No 18 13 5 5.7
134 Vascular m 69 P No No No 18 12 6 5.8
135 Vascular m 78 M No Si No 18 10 8 5.5
136 Vascular h 57 P Si No No 21 15 6 5.2
137 Vascular h 64 S Si No Si 19 14 5 6.2
138 Vascular m 60 P Si Si Si 20 14 6 6.2
139 Vascular m 62 P Si Si No 18 13 5 5.5
140 Vascular m 72 M Si No No 18 12 6 5.4
141 Vascular m 72 P No No No 19 12 7 6.0
142 Vascular h 79 M Si No Si 19 13 6 6.1
143 Vascular m 62 P Si Si No 18 12 6 5.6
144 Vascular m 75 P Si Si Si 21 14 7 5.8
145 Vascular h 68 P Si No No 21 15 6 5.1
146 Vascular h 60 M No No No 19 12 7 5.6
147 Vascular m 60 P Si Si No 19 12 7 5.8
148 Vascular m 79 P Si Si No 20 15 5 4.9
149 Vascular h 67 P No No No 18 14 4 5.9
150 Vascular h 59 S No No Si 18 12 6 5.4
151 Mixta m 65 P Si Si Si 21 15 6 4.2
152 Mixta m 78 P No No No 20 16 4 4.1
153 Mixta m 66 P No No No 20 16 4 4.2
154 Mixta m 64 P Si Si No 19 15 4 4.1
155 Mixta h 55 M Si Si No 21 17 4 4.3
156 Mixta m 63 P No No No 21 17 4 4.5
157 Mixta m 66 M No No Si 20 16 4 4.2
158 Mixta h 65 P Si Si Si 19 15 4 4.2
159 Mixta h 70 P No Si No 21 17 4 4.2
160 Mixta m 71 P No Si No 19 15 4 4.2
161 Mixta m 64 M Si No No 21 18 3 4.3
162 Mixta h 79 P Si No No 20 16 4 3.8
163 Mixta h 63 P No Si Si 18 15 3 4.0
164 Mixta m 60 P No No No 20 16 4 4.3
165 Mixta m 56 P Si No No 19 16 3 4.4
166 Mixta m 78 M Si Si No 19 13 6 3.5
167 Mixta m 67 P No Si No 19 15 4 4.1
168 Mixta h 74 S No No No 19 17 2 4.2
169 Mixta m 60 P Si No Si 21 14 7 4.1
170 Mixta m 77 P No Si Si 18 14 4 3.7
171 Mixta h 72 M No Si No 21 18 3 4.6
172 Mixta h 76 P Si No No 20 15 5 4.1
173 Mixta m 71 M No No No 18 14 4 3.9
174 Mixta m 64 P No Si No 21 16 5 4.1
175 Mixta h 79 P Si No No 20 15 5 3.9
176 Mixta h 58 M Si No No 20 16 4 3.8
177 Mixta m 73 M Si Si Si 20 16 4 4.3
178 Mixta m 72 P No No No 18 13 5 3.5
179 Mixta m 70 P No No No 20 14 6 3.7
180 Mixta m 72 P Si Si No 19 15 4 4.2
181 Mixta h 70 M No No No 21 19 2 4.8
182 Mixta m 74 P No Si No 20 16 4 3.9
183 Mixta m 78 P Si No Si 19 15 4 4.1
184 Mixta h 60 P Si No Si 20 15 5 4.1
185 Mixta h 64 P No Si No 20 16 4 4.2
186 Mixta m 62 M No No No 20 16 4 3.9
187 Mixta m 67 P Si No No 21 17 4 4.3
188 Mixta m 79 M No Si No 21 16 5 4.2
189 Mixta h 70 P No Si No 18 14 4 3.9
190 Mixta h 70 P Si No Si 19 14 5 3.4
191 Mixta m 77 A Si No Si 18 14 4 3.6
192 Mixta m 78 M No Si No 19 14 5 3.8
193 Mixta m 66 P No No No 20 14 6 3.6
194 Mixta m 74 P Si Si No 21 15 6 4.0
195 Mixta h 78 P Si Si Si 20 16 4 3.8
196 Mixta m 67 M No Si No 21 16 5 4.4
197 Mixta m 72 P No Si No 19 15 4 4.1
198 Mixta h 70 S Si Si No 18 13 5 3.4
199 Mixta h 68 P No Si No 20 17 3 4.5
200 Mixta m 75 P No Si No 19 14 5 3.6

 

Para quien quiera ver el Mini-Mental aquí lo tiene. Se puntúa del 0-30. Entre 27 y 30 se considera un valor normal. A partir de ese intervalo y cuando más bajo sea el valor más importante es el deterioro cognitivo:

IMG_0664

IMG_0665

Número de centros educativos y de profesores en comarcas catalanas

Distribución, por comarcas en Catalunya, del número centros públicos y privados y del número de profesores en centros públicos y privados, en el curso 2012-2013:

Comarca Centros públicos Centros privados Profesores públicos Profesores privados
Alt Camp 4 2 219 35
Alt Empordà 14 4 641 89
Alt Penedès 9 6 427 122
Alt Urgell 3 1 115 31
Alta Ribagorça 1 0 38 0
Anoia 11 9 513 165
Bages 19 16 756 312
Baix Camp 19 10 905 221
Baix Ebre 10 4 475 74
Baix Empordà 11 5 573 100
Baix Llobregat 60 56 3059 1121
Baix Penedès 8 3 469 69
Barcelonès 115 253 5620 6754
Berguedà 5 2 166 77
Cerdanya 1 1 67 11
Conca de Barberà 3 1 91 11
Garraf 13 7 596 142
Garrigues 3 1 76 17
Garrotxa 5 3 238 55
Gironès 15 14 897 377
Maresme 32 34 1509 793
Montsià 9 2 384 28
Noguera 6 3 190 41
Osona 16 15 609 341
Pallars Jussà 3 1 91 10
Pallars Sobirà 2 0 47 0
Pla d’Urgell 3 1 138 51
Pla de l’Estany 3 1 179 14
Priorat 2 0 54 0
Ribera d’Ebre 3 1 112 11
Ripollès 4 2 109 35
Segarra 3 1 146 9
Segrià 20 15 986 396
Selva 19 5 796 86
Solsonès 3 1 69 35
Tarragonès 23 15 1305 367
Terra Alta 3 0 59 0
Urgell 7 2 200 38
Val d’Aran 2 0 57 0
Vallès Occidental 63 76 3309 1715