Archivo de la categoría: PROBLEMAS

Solución Situación 56

1. ¿Existe asociación estadísticamente significativa entre la variable Sexo y la variable Fumador?

20140130-170756.jpg

2. ¿Existe asociación estadísticamente significativa entre la variable Haber fumado y la variable Bronquitis crónica? Si existe asociación significativa, calcular la Odds ratio.

 20140130-170809.jpg

Se ha utilizado el software Statgrafics. La versión castellana de este software estadístico traduce la Odds ratio como Razón de momios. Pero, en todo caso, puede verse que la Odds ratio es, en este caso, OR=11.9. Sería OR=(32/22)/(5/41)=11.9. O sea, entre los fumadores hay una proporción de diagnosticados con Bronquitis crónica 11.9 veces superior a lo que sucede entre no fumadores.

3. ¿Existe asociación estadísticamente significativa entre la cantidad de tabaco fumado acumulado en los fumadores y en los ex-fumadores y tener o no el diagnóstico de Bronquitis crónica? Calcular la Odds ratio.

 20140130-170817.jpg

4. ¿Existen diferencias estadísticamente significativas entre los niveles de tabaco fumado acumulado y el ser fumadores activos o ex-fumadores?

 20140130-170827.jpg

5. ¿Existen diferencias significativas entre los niveles de tabaco fumado acumulado en los dos sexos?

 20140130-170835.jpg

6. ¿Existe una correlación significativa entre la variable Edad y la variable Tabaco acumulado?

20140130-170842.jpg

Pero si ahora eliminamos los que nunca han fumado:

20140130-170855.jpg

Solución Situación 55

1a : El rango es 17, no el rango intercuartílico.

2a: Como entre 14 y 26, por aquello de media más y menos dos veces la desviación estándar, hay aproximadamente el 95% de los valores poblacionales, por debajo de 26 es 97.5% porque hay que sumar a esos 95% el 2.5% que hay por debajo de 14. Por lo tanto, el percentil 97.5 es aproximadamente 26.

3c: Si el p-valor es mayor que 0.05 entonces tenemos que no podemos rechazar la Hipótesis nula, o, dicho de otro modo, que no tenemos suficientes argumentos como para pensar que la correlación es distinta de cero.

4d: Efectivamente una muestra puede ser simétrica y no ajustarse a una distribución normal. La siguiente muestra sería un ejemplo: (2, 2, 3, 50, 51, 51).

5b: La V de Cramer únicamente tiene valor si existe una relación significativa entre las variables cualitativas estudiadas. Por lo tanto, la ji-cuadrado es una técnica adecuada para evaluar, previamente, si hay que tener o no en cuenta esa medida de la relación entre esas variables cualitativas.

Situación 55: Examen (Temas 1-14)

1. En la muestra (-1, 0, 1, 16), no es cierto:

a. El rango intercuartílico es 17.

b. La mediana es 0.5.

c. La media es 4.

d. El tercer cuartil es 8.5.

2. En una muestra con una variable que se ajusta bien a una distribución normal y que se resume así: 20 ± 3, podemos afirmar:

a. Que el percentil 97.5 es, aproximadamente, 26.

b. Que el 95% de la población, aproximadamente, tiene valores entre 17 y 23.

c. Que el rango intercuartílico es 6.

d. Que el 68.5% de la población, aproximadamente, tiene valores por encima de 17.

3. Si nos dicen que la correlación entre dos variables es 0.75 (p>0.05), podemos afirmar:

a. Que estamos trabajando con una muestra muy grande.

b. Que es una correlación significativa y positiva.

c. Que no tenemos argumentos suficientes para desestimar que la correlación poblacional sea 0.

d. Que no es suficiente saber que el p-valor es mayor que 0.05, que necesitamos saber con precisión el p-valor para tomar una decisión.

4. ¿Qué afirmación, entre las siguientes, es cierta?:

a. Cuanta más dispersión tenemos en dos grupos a comparar menos tamaño de muestra necesitamos para encontrar diferencias significativas.

b. Cuanta menos diferencia haya entre las medias muestrales de dos grupos a comparar menos tamaño de muestra necesitaremos para detectar significación estadística.

c. Una técnica estadística de comparación de dos poblaciones aplicada a dos muestras con medias muestrales iguales nos dará un p-valor de 0, independientemente de la dispersión que tengamos.

d. Hay muestras con simetría en sus valores que no se ajustan bien a una distribución normal.

5. ¿Qué afirmación, entre las siguientes, es cierta?:

a. Si la Odds ratio entre dos variables dicotómicas nos da un intervalo de confianza del 95% (0.9, 1.1) se trata de una relación significativa porque es un intervalo muy estrecho.

b. Una V de Cramer de 0.4 será significativa si el p-valor de la ji-cuadrado es menor que 0.05.

c. Una correlación de Pearson entre dos variables cuantitativas con intervalo de confianza del 95% (0.1, 0.9) no es una correlación significativa porque es un intervalo demasiado amplio.

d. Si dos medias muestrales son distintas con una diferencia superior al 5% esa diferencia ya se considera estadísticamente significativa.

Situación 54: Examen (Temas 1-14)

1. En la muestra (1, 1, 2, 16), no es cierto:

a. La media es 5.

b. La mediana es 1.5.

c. El rango intercuartílico es 7.5.

d. El tercer cuartil es 9.

2. En una muestra de una variable que no se ajusta bien a una distribución normal nos dicen que se resume así: 20 ± 3, podemos afirmar:

a. Que el 95% de la muestra, aproximadamente, tiene valores entre 14 y 26.

b. Que el 95% de la población, aproximadamente, tiene valores entre 14 y 26.

c. Que el error estándar es 3.

d. Ninguna de las tres afirmaciones anteriores es cierta.

3. Si nos dicen que la correlación entre dos variables es 0.75 (p>0.05), podemos afirmar:

a. Que es una fuerte correlación.

b. Que es una correlación significativa y bastante fuerte.

c. Que no tenemos argumentos suficientes para desestimar que la correlación poblacional sea 0.

d. Que no es suficiente saber que el p-valor es mayor que 0.05, que necesitamos saber con precisión el p-valor para tomar una decisión.

4. Si la correlación de Pearson entre dos variables es 0.9 (p<0.05) podemos afirmar:

a. La R2 es del 90%.

b. La Regresión lineal que podremos hacer entre estas dos variables tendrá pendiente significativa.

c. La Regresión lineal que podremos hacer entre estas dos variables tendrá pendiente significativa y negativa.

d. La Regresión lineal que podremos hacer entre estas dos variables tendrá pendiente positiva pero no significativa.

5. La V de Cramer entre dos variables cualitativas entre las cuales la ji-cuadrado nos ha dado un p-valor de 0.75.

a. Nos dará 0.

b. Nos dará 1.

c. No tiene mucho sentido calcularla porque no hay relación significativa entre esas variables.

d. En este caso calcularemos una correlación de Pearson.

6. Si queremos comparar la diferencia de medias que hay entre los hipertensos en Barcelona y Nueva York y lo hacemos tomando una muestra de 20 personas adultas en cada una de estas ciudades, donde cada una de ellas se comprueba que no se ajusta bien a una distribución normal, el test estadístico que deberemos aplicar es:

a. El Test exacto de Fisher.

b. El Test de la t de Student de datos apareados.

c. El Test de Mann-Whitney.

d. El Test de la t de Student de muestras independientes y varianzas iguales.

7. Nos dicen que han comparado la media de rentas de dos poblaciones con una muestra de cada población. Ambas muestras siguen bien una distribución normal y una estadística básica de cada una de ellas es: Población A: 15000±4000 y Población B: 13000±4000, podemos afirmar lo siguiente:

a. La diferencia de medias no es significativa porque si hacemos los intervalos de confianza del 95% de la media los intervalos se tocan porque son: (7000, 23000) y (5000, 21000).

b. La diferencia de medias sí que es significativa porque si hacemos los intervalos de confianza del 95% de la media los intervalos no se tocan porque son: (14200, 15800 ) y (12.200, 13800).

c. Para ver la diferencias de medias necesitamos saber el tamaño de las muestras que nos permita calcular el intervalo de confianza de la media de cada población para ver si se tocan o no los intervalos.

d. Estadísticamente lo único que podemos decir es que las medias de las rentas son distintas.

8. Si se quiere hacer un resumen descriptivo de una muestra de la variable cantidad de agua caída en diferentes días del año mediante una muestra como la siguiente:

(0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 2, 3, 3, 4, 5, 5, 7, 8, 25, 250), la forma más coherente sería:

a. Lo haremos con los dos descriptores más habituales: la media y la desviación estándar.

b. Lo haremos con la mediana y el rango intercuartílico expresado con el primer y tercer cuartil.

c. Lo haremos con la mediana y la media.

d. Muestras tan anormales no pueden resumirse.

9. Se quiere comparar la humedad relativa entre dos zonas a partir de muestras de cada una de esas dos zonas. Se ha aplicado el Test de Shapiro-Wilk a las dos muestras y el p-valor en ambas es mayor que 0.05. Para comparar las medias o las medianas de ambas poblaciones el test más adecuado al caso será:

a. Test de la t de Student de varianzas iguales si se comprueba previamente, mediante el test de Fisher, que las varianzas no son distintas significativamente.

b. Test de Mann-Whitney.

c. El Test de proporciones.

d. El Test de la t de Student de datos apareados.

10. Si en una Regresión lineal simple entre dos variables tenemos una r=0.9 (p<0.05) y una R2 del 81% podemos afirmar:

a. Que la pendiente es significativa.

b. Que existe no hay suficiente determinación.

c. Que la pendiente podría ser positiva o negativa.

d. Poco podemos decir si no sabemos, también, el p-valor de la R2.

Solución Situación 53

1a: Variable es dicotómica, son muestras independientes y como el tamaño de muestra es inferior a 30 deberemos aplicar el Test exacto de Fisher.

2b: El error estándar será 400, porque 4000/raiz(100) es 400. Por lo tanto, un intervalo de confianza de la media del 95% de cada una de las dos poblaciones es el que nos da esta opción «b». Como estos intervalos no se tocan la diferencia es significativa.

Los intervalos de la opción «a» son de valores individuales, no de la media.

La «c» no es correcta. Trabajar con intervalos de confianza de la media y valorar si se tocan o no es equivalente a obtener un p-valor. Es otra forma de evaluar, estadísticamente, la significación de las diferencias.

Por lo dicho en el párrafo anterior, la «d» tampoco es correcta.

3b: La distribución de esta variable claramente no sigue la distribución normal, por lo tanto a la hora de describirla hay que hacerlo con la mediana y el rango intercuartílico.

4b: Variable continua, muestras independiente y no normales, porque el p-valor del Shapiro-Wilk es inferior a 0.05. Por lo tanto, hay que aplicar el Test de Mann-Whitney.

5d: Realmente el coeficiente de determinación es algo (80%), pero sin tener el p-valor de la correlación no podemos decir nada sobre la calidad de la Regresión lineal simple que podamos hacer entre esas dos variables.

Situación 53: Examen (Temas 1-14)

1. Si queremos comparar la diferencia que hay de hipertensos en Barcelona y Nueva York y lo hacemos tomando una muestra de 20 personas adultas en cada una de estas ciudades, el test estadístico que deberemos aplicar es:

a. El Test exacto de Fisher.

b. El Test de la t de Student de datos apareados.

c. El Test de proporciones.

d. El Test de McNemar.

2. Nos dicen que han comparado la media de rentas de dos poblaciones con una muestra de tamaño 100 en cada población. Ambas muestras siguen bien una distribución normal y una estadística básica de cada una de ellas es: Población A: 15000±4000 y Población B: 13000±4000, podemos afirmar lo siguiente:

a. La diferencia no es significativa porque si hacemos los intervalos de confianza del 95% de la media los intervalos se tocan porque son: (7000, 23000) y (5000, 21000).

b. La diferencia sí que es significativa porque si hacemos los intervalos de confianza del 95% de la media los intervalos no se tocan porque son: (14200, 15800 ) y (12.200, 13800).

c. Necesitamos tener un p-valor para poder afirmar tal cosa. De otra forma no tiene relevancia estadística.

d. Estadísticamente lo único que podemos decir es que las medias de las rentas son distintas.

3. Si se quiere hacer un resumen descriptivo de una muestra de la variable cantidad de agua caída en diferentes días del año mediante una muestra como la siguiente:

(0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 2, 3, 3, 4, 5, 5, 7, 8, 25, 120), la forma más coherente sería:

a. 9.25±26.6, que son la media y la desviación estándar.

b. 2(0, 5), que son la mediana y el rango intercuartílico expresado con el primer y tercer cuartil.

c. N(9.25, 26.6), que es la expresión de la distribución normal con parámetros 9.25 y 26.6.

d. (2, 9.25), que son la mediana y la media.

4. Se quiere comparar la humedad relativa entre dos muestras de dos zonas que se quiere comparar. Se ha aplicado el Test de Shapiro-Wilk a las dos muestras y el p-valor en ambas es menor que 0.05. Para comparar las medias o las medianas de ambas poblaciones el test más adecuado al caso será:

a. Test de la t de Student de varianzas iguales si se comprueba previamente, mediante el test de Fisher, que no son distintas significativamente.

b. Test de Mann-Whitney.

c. El Test de proporciones.

d. El Test de la t de Student de datos apareados.

5. Si en una Regresión lineal simple entre dos variables tenemos una R2 del 80% podemos afirmar:

a. Que la pendiente es significativa.

b. Que existe una buena determinación.

c. Que la correlación es 0.8.

d. Poco podemos decir sin comprobar previamente que la correlación sea significativa.

Solución Situación 52

1.La respuesta correcta es la “c”. Es correcta porque se pide lo que no es cierto. Evidentemente un p-valor de 0.67 indica no significación, lo que implica que un intervalo de confianza de la Odds ratio debe incluir al 1, cosa que no sucede en esta opción. Las demás afirmaciones son ciertas, por lo tanto no las debemos elegir.

La opción “a” muestra un intervalo que incluye al 1 y por lo tanto no es significativa. La “b” no incluye al 1 y por lo tanto, es significativa. La “d” indica un p-valor no significativo y el intervalo incluye al 1.

2.La respuesta correcta es, ahora, la “a”. Ahora para que una correlación de Pearson sea significativa no debe contener al 0. En esta afirmación el intervalo no contiene al 0, por lo tanto se trata de una correlación significativa y, por el contrario, nos dicen que es no significativa.

Las demás respuestas son correctas. Siguen la regla de que una correlación de Pearson es significativa si el intervalo de confianza no contiene al 0. Y no es significativa si lo contiene.

3.La respuesta correcta aquí es la “d”. De nuevo nos piden la sentencia no correcta. En esta pregunta la clave es ver la relación entre correlación de Pearson y la pendiente de la recta de la Regresión lineal simple. Si la correlación de Pearson es significativa también lo será la pendiente. Además, una correlación positiva irá asociada de una pendiente positiva y una correlación negativa de una pendiente negativa. Observemos que en esta opción “d” nos afirman que la correlación es negativa y significativa y, sin embargo, no dicen que la pendiente no lo es. Esto no es correcto.

4.La correcta es la “b”. La “a” y la “d” son Regresiones simples. En concreto la «d» es, en realidad, y=10x. Y la “c” no es una Regresión.

5. La respuesta correcta es la “c”. Es la definición del coeficiente de determinación.

6. La respuesta correcta es la “b”. Evidentemente el Stepwise sólo es aplicable a Regresiones múltiples. En una Regresión simple no tiene sentido. Las otras afirmaciones son ciertas.

7. La correcta es la opción “b”: Observemos que e0.6=1.82 y e0.8=2.22. En las otras opciones no coinciden los valores extremos del intervalo con los valores del coeficiente con los de la Odds ratio.

Además, en la opción “a” el coeficiente no es significativo y la Odds ratio sí, cosa que no es posible. En la “c” el coeficiente es negativo y la Odds ratio es mayor que 1, cosa que no es posible. En la “d” el coeficiente es positivo y la Odds ratio es menor que 1, cosa que tampoco es posible.

8. La correcta es la opción “b”. Como la Odds ratio es el número e elevado al valor del coeficiente, si el coeficiente es positivo la Odds ratio será claramente mayor que 1. Será significativa porque el intervalo de confianza del coeficiente no incluye al cero. Y una Odds ratio nunca será negativa.

9.La respuesta correcta es la “c”. Es correcta porque se pide lo que no es cierto. Lo que aquí se indica es el criterio de interpretación del p-valor, no el de la V de Cramer.

10. La respuesta correcta es la “c”. Claramente tenemos un caso de una relación entre una variable dicotómica y una variable continua. En una Regresión logística simple el coeficiente será menor que 0 y, por lo tanto, la Odds ratio será menor que 1.

No debemos calcular una correlación de Pearson. Y la Odds ratio, evidentemente, no será 0.

Situación 52: Examen (Temas 5-12)

1. ¿Cuál de las siguientes afirmaciones no es cierta?

             a. Una Odds ratio con un intervalo de confianza (0.23, 2.45) no es significativa.

             b. Una Odds ratio con un intervalo de confianza (2.33, 3.75) es significativa.

         c. Una Odds ratio con un p-valor de 0.67 es compatible con un intervalo de confianza como el siguiente: (1.23, 1.98).

          d. Una Odds ratio con un p-valor de 0.34 es compatible con un intervalo de confianza como el siguiente: (0.63, 2.34).

2. ¿Cuál de las siguientes afirmaciones no es cierta?

          a. Una correlación de Pearson con un intervalo de confianza (0.23, 0.78) no es significativa.

           b. Una correlación de Pearson con un intervalo de confianza (-0.83, -0.15) es significativa.

         c. Una correlación de Pearson con un p-valor de 0.37 es compatible con un intervalo de confianza como el siguiente: (-0.23, 0.98).

         d. Una correlación de Pearson con un p-valor de 0.02 es compatible con un intervalo de confianza como el siguiente: (0.63, 0.78).

3. En la Regresión lineal simple, no es cierto:

          a. Una correlación de Pearson con un intervalo de confianza (0.63, 0.88) irá asociada de una pendiente positiva y significativa.

            b. Una correlación de Pearson con un intervalo de confianza (-0.73, -0.55) irá asociada a una pendiente negativa y significativa.

            c. Una correlación de Pearson con un intervalo de confianza (-0.23, 0.18) irá asociada a una pendiente no significativa.

            d. Una correlación de Pearson con un intervalo de confianza (-0.93, -0.48) irá asociada a una pendiente negativa pero no significativa.

4. ¿Cuál de los siguientes modelos es una Regresión lineal múltiple?:

            a. y=2x+7

            b. y=3x+5z-3

            c. y=7

            d. y=x+2x+3x+4x

5. La R2 significa:

            a. Que tenemos una Regresión lineal simple.

            b. Que si el valor es superior al 5% tenemos una Regresión significativa.

      c. El grado de determinación que hay entre la variable dependiente y las variables independientes.

            d. Que podemos hacer una Regresión logística.

6.En una Regresión logística simple no es cierto:

            a. La variable dependiente es dicotómica.

      b. Debemos aplicar un Stepwise para seleccionar qué variables independientes son relevantes.

            c. La Odds ratio es un elemento muy importante para evaluar su calidad.

         d. Una Odds ratio con un intervalo de confianza (1.45, 2.26) indica que se trata de una relación significativa.

7. En una Regresión logística simple es cierto:

            a. Un coeficiente que multiplica a la variable independiente con un intervalo de confianza (-0.6, 0.7) es compatible con un intervalo de confianza de la Odds ratio de (1.15, 2.33).

            b. Un coeficiente que multiplica a la variable independiente con un intervalo de confianza (0.6, 0.8) es compatible con un intervalo de confianza de la Odds ratio de (1.82, 2.22).

           c. Un coeficiente que multiplica a la variable independiente con un intervalo de confianza (-0.6, -0.4) es compatible con un intervalo de confianza de la Odds ratio de (1.45, 3.33).

           d. Un coeficiente que multiplica a la variable independiente con un intervalo de confianza (0.8, 0.9) es compatible con un intervalo de confianza de la Odds ratio de (0.15, 0.33).

8. En una Regresión logística simple si tenemos un coeficiente que multiplica a la variable independiente con un intervalo de confianza como el siguiente (0.34, 1.66), podemos afirmar:

            a. Que la Odds ratio no será significativa.

            b. Que la Odds ratio será significativa y mayor que 1.

            c. Que la Odds ratio será significativa y menor que 1.

            d. Que la Odds ratio será negativa.

9. En una V de Cramer no es cierto:

            a. Es un valor entre el 0 y el 1.

            b. Es una medida del grado de relación entre variables cualitativas.

            c. Es un valor que será significativo si es menor que 0.05.

            d. Cuanto mayor es indica más relación entre las variables cualitativas.

10. En los datos siguientes:

y

x

1

2

1

3

1

5

1

6

1

8

0

7

0

9

0

11

0

13

0

15

Podemos afirmar lo siguiente:

        a. La correlación de Pearson será negativa.

       b. En una Regresión logística simple el coeficiente que multiplica a la variable independiente será positivo.

         c. En una Regresión logística simple la Odds ratio será menor que 1.

         d. En una Regresión logística simple la Odds ratio será 0.

Solución Situación 50

1. Las correlaciones entre las tres variables cuantitativas que tenemos son las siguientes:

IMG_7580

Como puede observarse se trata de tres correlaciones significativas. El p-valor, en los tres casos, es menor que 0.05. Hay una correlación positiva (entre el Tiempo de visualización y el Número de paradas) y hay dos correlaciones negativas (entre Tiempo de visualización y Velocidad y entre Velocidad y Número de paradas). Correlaciones que, si las pensamos un poco, son lógicas.

2. La regresión lineal simple entre la variable Número de paradas y la variable Tiempo de visualización nos proporciona un gráfico como el siguiente:

IMG_7581

La estimación de los parámetros del modelo (La pendiente y la ordenada en el origen) son los siguientes:

IMG_7582

Con este modelo podemos predecir el número de paradas en función del tiempo de visualización. Con una R cuadrado del 71.44%, que es bastante buena.

3. Al relacionar las variables cualitativas Sexo y Relacionado con el mundo del Arte obtenemos la siguiente tabla de contingencias:

IMG_7584

La ji-cuadrado aplicada a esta tabla de contingencias es la siguiente:

IMG_7583

Por lo tanto, como el p-valor es superior a 0.05 no podemos decir que haya relación entre ambas variables.

4. Para resolver este problema debemos hacer una Regresión logística simple de la variable dicotómica «Relacionado con el mundo del Arte» con cada una de las variables cuantitativas que tenemos. Evidentemente se podría hacer también una Regresión logística múltiple y ver con un Stepwise cuál es el modelo final elegido. Pero vamos a hacer aquí, porque nos irá bien a efectos didácticos, tres regresiones logísticas simples y seleccionaremos la que nos ajuste un modelo más predictivo.

Veamos primero la relación con la variable Tiempo de visualización:

IMG_7585

Y hecho con otro software que nos dibuja la Regresión logística obtenemos esta salida de ordenador:

IMG_7589

Es interesante comprobar que, aunque los resultados fundamentales son paralelos, son los mismos, la salida de ordenador que nos proporciona cada software tiene su singularidad. Por ejemplo, la del primer software (El G-Stat 2.0) nos da una algo peculiar: una prueba de clasificación. Aplica el criterio creado con esta muestra para establecer una clasificación entre los dos tipos de variable dependiente dicotómica a la muestra que, en realidad, ya sabe qué valor tiene cada individuo de esa variable respuesta. De esta forma puede comparar lo que haría con lo verdadero y, así, establecer una calidad de clasificación. En este caso nos da una buena clasificación del 85%.

El segundo software (El Statgrafics) nos ofrece algo muy visual: el gráfico. El gráfico donde se ven donde quedan los valores muestrales y cuál sería la curva construida como probabilidad de predicción de cada uno de los dos estados posibles de la variable dependiente dicotómica.

Es bueno combinar diferentes softwares, si es posible, porque cada uno tiene sus elementos de interés que nos ayuda a perfilar las conclusiones finales.

Veamos ahora la relación con la variable Velocidad media del ojo:

IMG_7586

Y con el otro software:

IMG_7590

Y, finalmente, veamos la relación con la variable Número de paradas:

IMG_7588

Y con el otro software:

IMG_7591

Es interesante comprobar que se trata de una elección no clara. Las tres variables pueden ser usadas como predictoras. Las tres tienen una relación significativa con la variable dicotómica «Relacionado con el Arte».

Si elegimos por la calidad de la clasificación debemos elegir la variable independiente «Velocidad media del ojo». Si elegimos por la prueba de la verosimilitud debemos elegir, en este caso, la variable «Tiempo de visualización».

En todo caso estamos en una situación difícil donde ambas variables podrían ser elegidas. Están en una posición muy paralela. De hecho, es lógico que sea así, el que la correlación entre ellas sea tan grande lo que indica es que en gran parte son variables intercambiables.