Archivo del Autor: estadisticallopis

Explotación de una base de datos 6: Regresión múltiple

A partir de nuestra base de datos adjunta del artículo Explotación de una base de datos 1: Base de datos podemos realizar regresiones múltiples. Veamos algunos ejemplos:

1. Realizar una Regresión lineal múltiple entre la variable Valoración general y P1, P2, P3, P4, P5, P6 y P7. Se pretende pronosticar la Valoración general que daría un paciente a partir de los valores de los 7 primeros ítems de la encuesta.

 2. Realizar un Regresión lineal múltiple entre la variable Valoración general y las variables Edad y Días de ingreso.

SOLUCIONES:

1. Realizar una Regresión lineal múltiple entre la variable Valoración general y P1, P2, P3, P4, P5, P6 y P7. Se pretende pronosticar la Valoración general que daría un paciente a partir de los valores de los 7 primeros ítems de la encuesta:

Las correlaciones entre todas estas variables son las siguientes:

IMG_7780

Viendo cuáles son las correlaciones entre la variable respuesta o dependiente y las variables explicativas o independientes ya podemos intuir por dónde irá el modelo elegido finalmente. Veamos cuál es:

IMG_7781

Ya vemos cuáles son los coeficientes significativos. Vemos también que la r cuadrado es muy buena.

Apliquemos un Stepwise:

IMG_7782

2. Realizar un Regresión lineal múltiple entre la variable Valoración general y las variables Edad y Días de ingreso:

Las correlaciones entre la variable respuesta y las dos variables explicativas son las siguientes:

IMG_7783

El modelo es:

IMG_7784

Y al aplicar un Stepwise:

IMG_7787

Y si nos fijamos bien veremos que al final hemos acabado en un modelo de Regresión lineal simple que es el que hemos estimado en cuando estábamos aplicando esa técnica a nuestra base de datos.

Explotación de una base de datos 5: Regresión lineal simple

A partir de nuestra base de datos adjunta del artículo Explotación de una base de datos 1: Base de datos podemos hacer distintas regresiones lineales simple. Veamos algunos ejemplos:

1. Hacer una Regresión lineal simple entre las variables Edad y Valoración general. Se pretende pronosticar en el futuro la variable Valoración general a partir de la variable Edad.

2. Hacer una Regresión lineal simple entre P6 y P7. Se pretende pronosticar en el futuro el valor de la variable P7 a partir del conocimiento del valor de la variable P6. O sea, se pretende pronosticar cómo siente el paciente el nivel de información recibido a partir de su valoración acerca del personal médico.

SOLUCIONES:

1. Hacer una Regresión lineal simple entre las variables Edad y Valoración general. Se pretende pronosticar en el futuro la variable Valoración general a partir de la variable Edad:

La recta de regresión es la siguiente:

IMG_7776

La recta es la negra. Las dos rectas rojas y las dos azules son intervalos de confianza del 95% de la media de una predicción (las rojas) y de un valor individual (las azules).

Los coeficientes del modelo son los siguientes:

IMG_7777

Se trata, pues, de una regresión con coeficientes significativos pero con un coeficiente de determinación muy bajo, con una r cuadrado sólo de un 10.25%. Menos de un 50% se considera una muy mala capacidad predictiva de un valor individual de la variable respuesta o dependiente.

2. Hacer una Regresión lineal simple entre P6 y P7. Se pretende pronosticar en el futuro el valor de la variable P7 a partir del conocimiento del valor de la variable P6. O sea, se pretende pronosticar cómo siente el paciente el nivel de información recibido a partir de su valoración acerca del personal médico:

La recta de regresión es, ahora:

IMG_7778

Los coeficientes del modelo:

IMG_7779

 

Ahora tenemos una mejor capacidad de determinación, un 70.87%.

 

Explotación de una base de datos 4: La relación entre variables cualitativas

A nuestra base de datos adjunta en el artículo Explotación de una base de datos 1: Base de datos le podemos analizar la relación entre variables cualitativas. Veamos algunos ejemplos:

1. Analizar la relación entre la variable Sexo y Cirugía.

2. Analizar la relación entre la variable Cirugía y Departamento.

3. Analizar la relación entre la variable Departamento y P8.

4. Analizar la relación entre la variable Departamento y Cirugía, calculando la V de Cramer si existe relación significativa.

SOLUCIONES

1. Analizar la relación entre la variable Sexo y Cirugía:

IMG_7717

 

IMG_7721

2. Analizar la relación entre la variable Cirugía y Departamento:

IMG_7722

 

IMG_7723

3. Analizar la relación entre la variable Departamento y P8:

IMG_7724

 

IMG_7725

4. Analizar la relación entre la variable Departamento y Cirugía, calculando la V de Cramer si existe relación significativa:

IMG_7726

 

IMG_7727

 

IMG_7728

 

 

Explotación de una base de datos 3: Correlaciones

A nuestra base de datos adjunta en el artículo Explotación de una base de datos 1: Base de datos le podemos calcular correlaciones entre variables cuantitativas. Veamos algunos ejemplos:

1. Calcular la correlación de Pearson entre las variables cuantitativas Edad, Días de ingreso y Valoración general.

2. Calcular la correlación de Spearman entre esas mismas variables.

3. Calcular la correlación de Spearman entre las variables P1, P2, P3, P4, P5, P6 y P7.

4. A partir de lo visto en el apartado anterior crear grupos con buena consistencia interna, con alto valor de alfa de Cronbach.

SOLUCIONES

1. Calcular la correlación de Pearson entre las variables cuantitativas Edad, Días de ingreso y Valoración general:

IMG_7709

2. Calcular la correlación de Spearman entre esas mismas variables:

IMG_7711

3. Calcular la correlación de Spearman entre las variables P1, P2, P3, P4, P5, P6 y P7:

IMG_7714

4. A partir de lo visto en el apartado anterior crear grupos con buena consistencia interna, con alto valor de alfa de Cronbach:

Observemos que las combinaciones que tienen alta correlación son los grupos:

P1-P2

P3-P4-P5

P6-P7

Sólo tiene sentido calcular la alfa de Cronbach en estos tres grupos. Para ver cómo se calcula este índice ver el artículo Alfa de Cronbach. La forma más cómoda de cálculo es a partir de la correlación:

IMG_5934

 

Con P1 y P2 el valor es:

2×0,8326/(1+0,8325)=0,9086.

Con P6 y P7:

2×0,8501/(1+0,8501)=0,9189

Con P3, P4 y P5, como el promedio de las tres correlaciones dos a dos entre estas variables es 0,8888:

3×0,8888/(1+2×0,8888)=0,9599

Como podemos ver consistencias internas muy elevadas.

Explotación de una base de datos 2: Estadística descriptiva

A nuestra base de datos adjunta en el artículo Explotación de una base de datos 1: Base de datos le podemos calcular muchas cosas de Estadística descriptiva. Veamos algunos ejemplos:

1. Hacer una Estadística descriptiva de las variables cuantitativas: Edad, Días de ingreso y Valoración general.

2. Hacer una Estadística descriptiva de las variables cualitativas: Sexo, Cirugía, Departamento y P8.

3. Hacer una Estadística descriptiva de las variables P1 y P6 como ejemplos de dos de las siete variables Likert.

4. Representar de la forma más apropiada y resumida, con Media y Desviación estándar o Mediana y Rango intercuartílico, las variables Edad, Días de ingreso y Valoración general.

SOLUCIONES:

1. Hacer una Estadística descriptiva de las variables cuantitativas: Edad, Días de ingreso y Valoración general:

La variable Edad tiene los siguientes valores de los más importantes estadísticos descriptores:

IMG_7674

El Box-Plot:

IMG_7675

La variable Días de ingreso tiene los siguientes valores de los más importantes estadísticos descriptores:

IMG_7676

Y el Box-Plot:

IMG_7678

La variable «Valoración general» tiene los siguientes valores de los más importantes estadísticos descriptores:

IMG_7680

Y el Box-Plot:

IMG_7681

2. Hacer una Estadística descriptiva de las variables cualitativas: Sexo, Cirugía, Departamento y P8:

Para la variable cualitativa «Sexo» la tabla de frecuencias es:

IMG_7682

Y el diagrama de frecuencias:

IMG_7683

Para la variable cualitativa «Cirugía» la tabla de frecuencias es:

IMG_7684

Y el diagrama de frecuencias:

IMG_7685

Para la variable «Departamento»:

IMG_7686

Y el diagrama de frecuencias:

IMG_7687

Para la variable P8:

IMG_7688

Y el diagrama de frecuencias:

IMG_7689

3. Hacer una Estadística descriptiva de las variables P1 y P6 como ejemplos de dos de las siete variables Likert:

Para la variable P1:

IMG_7694

IMG_7695

IMG_7696

Para la variable P6:

IMG_7697

IMG_7698

IMG_7699

4. Representar de la forma más apropiada y resumida, con Media y Desviación estándar o Mediana y Rango intercuartílico, las variables Edad, Días de ingreso y Valoración general:

De las tres variables la única que tiene una suficiente aproximación a la normalidad (Asimetría estandarizada y Curtosis estandarizada entre -2 y 2) es la variable «Valoración general», por lo tanto esta sería la única que se podría representar mediante la Media y la Desviación estándar. Las otras dos sería más apropiado hacerlo mediante la Mediana y el Rango intercuartílico. O sea, sería de esta forma:

Edad: 47 (40, 69)

Días de ingreso: 4 (2, 8)

Valoración general:  6,3 ± 1,66

Explotación de una base de datos 1: Base de datos

En este artículo veremos la base de datos con la que vamos a trabajar en este conjunto de ficheros con el nombre «Explotación de una base de datos», mediante los cuales iremos aplicando diferentes técnicas estadísticas, es la siguiente.

Los códigos de las etiquetas son los siguientes:

Etiqueta Contenido Tipo
S Sexo Cualitativa (h-m)
E Edad Cuantitativa
DI Días de ingreso Cuantitativa
C Cirugía Cualitativa (Sí o No)
D 1:Medicina interna
2:Traumatología
3:Urología
4:Oftalmología
P1 Estado de las habitaciones Likert
P2 Comida Likert
P3 Atención del personal no sanitario Likert
P4 Atención del personal auxiliar sanitario Likert
P5 Atención del personal de enfermeria Likert
P6 Atención del personal médico Likert
P7 Información recibida Likert
P8 Solución del problema Cualitativa (Sí o No)
VG Valoración general Cuantitativa (0-10)

Las variables Likert han sido etiquetadas de la siguiente forma:

1 Totalmente en desacuerdo
2 En desacuerdo
3 Ni de acuerdo ni en desacuerdo
4 De acuerdo
5 Totalmente de acuerdo

La base de datos es la siguiente:

S E DI C D P1 P2 P3 P4 P5 P6 P7 P8 VG
h 52 2 NO 1 3 4 4 4 4 2 1 SI 7
h 78 4 NO 2 2 3 3 4 4 5 4 SI 8
h 34 3 NO 3 2 2 4 4 4 1 2 NO 6
h 45 6 SI 4 4 3 3 3 3 4 4 SI 6
h 47 8 SI 1 5 5 2 2 2 3 3 SI 5
h 59 2 NO 4 4 3 3 3 3 3 2 NO 6
h 67 2 SI 4 4 4 4 4 4 5 4 NO 8
h 32 3 SI 3 3 2 2 2 3 2 1 NO 4
h 56 34 SI 2 5 5 5 5 5 2 2 SI 9
h 78 45 SI 1 5 4 1 2 2 5 4 SI 6
m 43 3 NO 3 2 2 2 3 2 3 4 NO 4
m 42 4 NO 1 2 2 2 2 2 2 2 NO 4
m 38 5 SI 1 4 5 5 5 5 5 4 SI 10
m 75 5 NO 2 3 3 3 4 4 3 2 SI 7
m 27 2 NO 4 3 3 3 3 3 4 3 SI 6
m 34 8 SI 2 5 4 1 1 2 5 4 SI 5
m 32 23 SI 1 5 4 1 2 2 1 2 SI 4
m 43 2 NO 3 3 4 4 3 3 3 4 SI 7
m 45 2 SI 4 2 2 4 4 4 2 2 SI 6
m 55 5 NO 2 2 2 4 5 5 4 3 NO 8
h 59 2 NO 2 4 3 4 3 3 3 2 NO 6
h 67 2 SI 4 4 4 5 4 4 5 4 NO 8
h 32 3 SI 3 3 2 2 3 3 2 1 NO 4
h 56 34 SI 1 5 5 5 4 5 2 2 SI 9
h 78 45 SI 2 5 4 1 1 2 5 4 SI 6
m 43 3 NO 3 2 2 2 3 4 4 4 NO 6
m 42 4 NO 2 2 2 2 2 2 2 2 NO 4
m 38 5 SI 2 4 5 5 5 5 5 4 SI 9
m 77 5 NO 2 3 3 3 4 4 4 2 SI 7
m 29 2 NO 4 3 3 3 3 3 4 3 SI 6
m 36 8 SI 2 5 4 1 1 2 4 4 SI 5
m 64 23 SI 1 5 4 1 2 2 2 2 SI 4
m 29 2 NO 4 3 3 3 3 3 4 3 SI 6
m 36 8 SI 2 5 4 1 1 2 5 4 SI 5
m 71 21 SI 1 5 4 1 2 2 1 2 SI 6
m 45 2 NO 3 3 4 4 3 3 3 4 SI 6
m 47 4 NO 4 2 2 4 4 4 2 2 SI 6
m 57 5 NO 2 2 2 5 5 5 4 3 SI 8
h 61 2 NO 4 4 3 3 3 3 3 2 NO 6
h 69 2 NO 4 4 4 4 4 4 5 4 SI 8
h 34 3 NO 3 3 2 2 2 3 2 1 NO 4
h 61 2 NO 2 4 3 3 3 3 3 2 NO 6
h 69 2 NO 4 4 4 4 4 4 5 4 SI 8
h 34 3 NO 3 3 2 2 2 3 2 1 NO 4
h 68 23 SI 2 5 5 4 5 4 2 2 SI 7
h 80 30 SI 1 5 4 1 2 2 5 4 SI 6
m 45 3 NO 3 2 2 2 3 4 4 4 NO 6
m 44 4 NO 2 2 2 2 2 2 2 2 NO 4
m 40 5 SI 1 4 5 5 5 5 5 4 SI 10
m 77 5 NO 1 3 3 3 4 4 3 2 SI 7
m 27 2 NO 4 3 3 3 3 3 4 3 SI 6
m 35 8 SI 2 5 4 1 1 2 5 4 SI 5
m 64 21 SI 1 5 4 1 2 2 1 2 SI 5
m 25 2 NO 3 3 4 4 5 5 3 4 SI 7
m 66 4 SI 4 2 2 4 4 4 2 2 SI 6
m 57 5 NO 2 2 2 5 5 5 4 3 NO 8
h 71 2 NO 4 4 3 3 3 3 3 2 NO 6
h 69 2 SI 4 4 4 4 4 4 5 4 SI 8
h 22 3 NO 3 3 2 2 2 3 2 1 NO 4
h 78 78 SI 2 5 5 5 5 5 2 2 SI 9
h 80 4 NO 2 2 3 3 4 4 5 4 SI 8
h 36 3 NO 2 2 2 4 4 4 2 2 NO 7
h 47 6 SI 1 4 3 3 3 3 4 4 SI 6
h 46 8 SI 1 5 5 2 2 2 3 3 SI 5
h 61 2 NO 4 4 3 3 3 3 3 2 NO 5
h 69 2 NO 4 4 4 4 4 4 5 4 NO 8
h 34 3 NO 3 3 2 2 3 3 2 1 NO 4
h 58 34 SI 1 5 5 5 4 5 2 2 SI 9
h 80 45 SI 1 5 4 1 2 2 5 4 SI 6
m 45 3 NO 2 2 2 2 3 4 4 4 NO 6
m 44 4 NO 3 2 2 2 2 2 2 2 NO 3
h 61 2 NO 4 4 3 3 3 3 3 2 NO 6
h 69 2 NO 4 4 4 4 4 4 5 4 NO 8
h 75 3 NO 3 3 2 2 2 3 2 1 NO 4
h 68 34 SI 1 5 5 5 5 5 2 2 SI 9
h 73 45 SI 1 5 4 1 2 2 5 4 SI 6
m 45 3 NO 3 2 2 2 3 4 4 4 NO 6
m 44 4 NO 2 2 2 2 2 2 2 2 NO 4
m 40 5 SI 1 4 5 5 5 5 5 4 SI 9
m 77 6 NO 1 3 3 3 4 4 3 2 SI 7
m 29 3 NO 4 3 3 3 3 3 4 3 SI 6
m 76 9 SI 2 5 4 1 1 2 5 4 SI 5
m 66 31 SI 1 5 4 1 2 2 1 2 SI 6
m 45 2 NO 3 3 4 4 5 4 3 4 SI 8
m 47 4 NO 4 2 2 4 4 4 2 2 SI 6
h 69 2 NO 4 4 4 4 4 4 5 4 NO 8
h 34 3 NO 3 3 2 2 2 3 2 1 NO 4
h 58 21 SI 1 5 5 5 5 5 2 2 SI 9
h 80 24 SI 1 5 4 1 2 2 5 4 SI 6
m 45 3 NO 3 2 2 2 3 4 4 4 NO 6
m 44 3 NO 2 2 2 2 3 2 2 3 NO 4
m 40 4 SI 2 4 5 5 5 5 5 4 SI 9
m 77 4 NO 1 3 3 3 4 4 3 3 SI 7
h 34 4 NO 3 3 2 2 2 3 2 2 NO 4
h 78 33 SI 1 5 5 4 5 5 2 1 SI 8
h 84 40 SI 1 5 4 1 2 2 5 4 SI 6
m 45 2 NO 3 2 2 2 3 4 4 3 NO 6
m 44 3 NO 2 2 2 2 2 2 2 2 NO 4
m 40 4 SI 2 4 5 4 5 4 5 4 SI 9
m 28 3 NO 3 1 2 2 4 3 4 4 NO 6

Solución Situación 52

1.La respuesta correcta es la “c”. Es correcta porque se pide lo que no es cierto. Evidentemente un p-valor de 0.67 indica no significación, lo que implica que un intervalo de confianza de la Odds ratio debe incluir al 1, cosa que no sucede en esta opción. Las demás afirmaciones son ciertas, por lo tanto no las debemos elegir.

La opción “a” muestra un intervalo que incluye al 1 y por lo tanto no es significativa. La “b” no incluye al 1 y por lo tanto, es significativa. La “d” indica un p-valor no significativo y el intervalo incluye al 1.

2.La respuesta correcta es, ahora, la “a”. Ahora para que una correlación de Pearson sea significativa no debe contener al 0. En esta afirmación el intervalo no contiene al 0, por lo tanto se trata de una correlación significativa y, por el contrario, nos dicen que es no significativa.

Las demás respuestas son correctas. Siguen la regla de que una correlación de Pearson es significativa si el intervalo de confianza no contiene al 0. Y no es significativa si lo contiene.

3.La respuesta correcta aquí es la “d”. De nuevo nos piden la sentencia no correcta. En esta pregunta la clave es ver la relación entre correlación de Pearson y la pendiente de la recta de la Regresión lineal simple. Si la correlación de Pearson es significativa también lo será la pendiente. Además, una correlación positiva irá asociada de una pendiente positiva y una correlación negativa de una pendiente negativa. Observemos que en esta opción “d” nos afirman que la correlación es negativa y significativa y, sin embargo, no dicen que la pendiente no lo es. Esto no es correcto.

4.La correcta es la “b”. La “a” y la “d” son Regresiones simples. En concreto la «d» es, en realidad, y=10x. Y la “c” no es una Regresión.

5. La respuesta correcta es la “c”. Es la definición del coeficiente de determinación.

6. La respuesta correcta es la “b”. Evidentemente el Stepwise sólo es aplicable a Regresiones múltiples. En una Regresión simple no tiene sentido. Las otras afirmaciones son ciertas.

7. La correcta es la opción “b”: Observemos que e0.6=1.82 y e0.8=2.22. En las otras opciones no coinciden los valores extremos del intervalo con los valores del coeficiente con los de la Odds ratio.

Además, en la opción “a” el coeficiente no es significativo y la Odds ratio sí, cosa que no es posible. En la “c” el coeficiente es negativo y la Odds ratio es mayor que 1, cosa que no es posible. En la “d” el coeficiente es positivo y la Odds ratio es menor que 1, cosa que tampoco es posible.

8. La correcta es la opción “b”. Como la Odds ratio es el número e elevado al valor del coeficiente, si el coeficiente es positivo la Odds ratio será claramente mayor que 1. Será significativa porque el intervalo de confianza del coeficiente no incluye al cero. Y una Odds ratio nunca será negativa.

9.La respuesta correcta es la “c”. Es correcta porque se pide lo que no es cierto. Lo que aquí se indica es el criterio de interpretación del p-valor, no el de la V de Cramer.

10. La respuesta correcta es la “c”. Claramente tenemos un caso de una relación entre una variable dicotómica y una variable continua. En una Regresión logística simple el coeficiente será menor que 0 y, por lo tanto, la Odds ratio será menor que 1.

No debemos calcular una correlación de Pearson. Y la Odds ratio, evidentemente, no será 0.

Situación 52: Examen (Temas 5-12)

1. ¿Cuál de las siguientes afirmaciones no es cierta?

             a. Una Odds ratio con un intervalo de confianza (0.23, 2.45) no es significativa.

             b. Una Odds ratio con un intervalo de confianza (2.33, 3.75) es significativa.

         c. Una Odds ratio con un p-valor de 0.67 es compatible con un intervalo de confianza como el siguiente: (1.23, 1.98).

          d. Una Odds ratio con un p-valor de 0.34 es compatible con un intervalo de confianza como el siguiente: (0.63, 2.34).

2. ¿Cuál de las siguientes afirmaciones no es cierta?

          a. Una correlación de Pearson con un intervalo de confianza (0.23, 0.78) no es significativa.

           b. Una correlación de Pearson con un intervalo de confianza (-0.83, -0.15) es significativa.

         c. Una correlación de Pearson con un p-valor de 0.37 es compatible con un intervalo de confianza como el siguiente: (-0.23, 0.98).

         d. Una correlación de Pearson con un p-valor de 0.02 es compatible con un intervalo de confianza como el siguiente: (0.63, 0.78).

3. En la Regresión lineal simple, no es cierto:

          a. Una correlación de Pearson con un intervalo de confianza (0.63, 0.88) irá asociada de una pendiente positiva y significativa.

            b. Una correlación de Pearson con un intervalo de confianza (-0.73, -0.55) irá asociada a una pendiente negativa y significativa.

            c. Una correlación de Pearson con un intervalo de confianza (-0.23, 0.18) irá asociada a una pendiente no significativa.

            d. Una correlación de Pearson con un intervalo de confianza (-0.93, -0.48) irá asociada a una pendiente negativa pero no significativa.

4. ¿Cuál de los siguientes modelos es una Regresión lineal múltiple?:

            a. y=2x+7

            b. y=3x+5z-3

            c. y=7

            d. y=x+2x+3x+4x

5. La R2 significa:

            a. Que tenemos una Regresión lineal simple.

            b. Que si el valor es superior al 5% tenemos una Regresión significativa.

      c. El grado de determinación que hay entre la variable dependiente y las variables independientes.

            d. Que podemos hacer una Regresión logística.

6.En una Regresión logística simple no es cierto:

            a. La variable dependiente es dicotómica.

      b. Debemos aplicar un Stepwise para seleccionar qué variables independientes son relevantes.

            c. La Odds ratio es un elemento muy importante para evaluar su calidad.

         d. Una Odds ratio con un intervalo de confianza (1.45, 2.26) indica que se trata de una relación significativa.

7. En una Regresión logística simple es cierto:

            a. Un coeficiente que multiplica a la variable independiente con un intervalo de confianza (-0.6, 0.7) es compatible con un intervalo de confianza de la Odds ratio de (1.15, 2.33).

            b. Un coeficiente que multiplica a la variable independiente con un intervalo de confianza (0.6, 0.8) es compatible con un intervalo de confianza de la Odds ratio de (1.82, 2.22).

           c. Un coeficiente que multiplica a la variable independiente con un intervalo de confianza (-0.6, -0.4) es compatible con un intervalo de confianza de la Odds ratio de (1.45, 3.33).

           d. Un coeficiente que multiplica a la variable independiente con un intervalo de confianza (0.8, 0.9) es compatible con un intervalo de confianza de la Odds ratio de (0.15, 0.33).

8. En una Regresión logística simple si tenemos un coeficiente que multiplica a la variable independiente con un intervalo de confianza como el siguiente (0.34, 1.66), podemos afirmar:

            a. Que la Odds ratio no será significativa.

            b. Que la Odds ratio será significativa y mayor que 1.

            c. Que la Odds ratio será significativa y menor que 1.

            d. Que la Odds ratio será negativa.

9. En una V de Cramer no es cierto:

            a. Es un valor entre el 0 y el 1.

            b. Es una medida del grado de relación entre variables cualitativas.

            c. Es un valor que será significativo si es menor que 0.05.

            d. Cuanto mayor es indica más relación entre las variables cualitativas.

10. En los datos siguientes:

y

x

1

2

1

3

1

5

1

6

1

8

0

7

0

9

0

11

0

13

0

15

Podemos afirmar lo siguiente:

        a. La correlación de Pearson será negativa.

       b. En una Regresión logística simple el coeficiente que multiplica a la variable independiente será positivo.

         c. En una Regresión logística simple la Odds ratio será menor que 1.

         d. En una Regresión logística simple la Odds ratio será 0.

La Odds ratio en lingüística

Como puede verse en los siguientes artículos, en Lingüística se usa la Odds ratio. Y estoy convencido que se usaría más si se conociera más.

20140110-075428.jpg

20140110-075442.jpg

Captura de pantalla 2015-10-30 a las 8.25.50

Captura de pantalla 2015-10-30 a las 8.29.26Captura de pantalla 2015-10-30 a las 8.30.15

Para una explicación de la Odds ratio y sus posibilidades ver el Terma 9 y los artículos Factores de riesgo de accidente de automóvilLa Odds ratio, el riesgo relativo y sus intervalos de confianza y La Odds ratio como medida del riesgo o la protección ante la violencia de género.

La Odds ratio como medida del riesgo o de la protección ante la violencia de género

En Medicina es muy usual el uso de la Odds ratio. Sin embargo, es sorprendente ver que en ciertos ámbitos no se usa en absoluto.
El artículo del que a continuación muestro el abstract es una interesante muestra para ver que estamos ante un concepto general con una utilidad amplísima.

20140109-174838.jpg

Observemos especialmente los valores siguientes:

OR=0.14 (IC 95%=(0.06, 0.34)). Esta Odds ratio cuantifica y estima la asociación entre ser caucásica y sufrir violencia de género. Respecto a no ser caucásica. Al ser una Odds ratio menor que 1 y significativa (el intervalo de confianza no incluye al 1), podemos decir que ser caucásica relativamente a no serlo es un factor de protección. Evidentemente, no serlo es un factor de riesgo, claro.

OR=0.10 (IC 95%=(0.04, 0.24)). Esta Odds ratio cuantifica la asociación entre ser soltera o viuda respecto a ser separada o divorciada. Se trata de un factor de protección, lo primero. Además, como es 0.1 podemos decir que se estima que estar separada o divorciada es un riesgo 10 veces mayor de sufrir violencia de género, respecto a ser soltera o viuda.

OR=0.09 (IC 95%=(0.04, 0.21)). Esta Odds ratio cuantifica la asociación entre ser casada o tener pareja estable respecto a ser separada o divorciada. Se trata de un factor de protección, también, lo primero. Además, como es 0.09, que es casi 0.1, como antes, podemos decir que se estima que estar separada o divorciada es, también, un riesgo 10 veces mayor de sufrir violencia de género, respecto a estar casada o con pareja estable. O, dicho de otro modo, que estar casada o en pareja estable es un factor de protección 10 veces mayor que estar separada o divorciada.

Para ver el cálculo de la Odds ratio, ver el tema Tema 9 de esta blog, o ver el tema La Odds ratio y el Riesgo relativo y sus intervalos de confianza.