1c:Debe aplicarse la fórmula de la construcción de un intervalo de confianza del 95%. Aquí tenemos las dos fórmulas. La primera para una variable cuantitativa y la segunda para una variable dicotómica. En nuestro caso debemos aplicar la segunda:
El cálculo es:
0,1±2x(Raíz(0,1×0,9))/Raíz(10000))
en tanto por uno, que da este intervalo de (9.4, 10.6), en tanto por ciento.
2c:El error estándar es 0.5 porque el radio del intervalo es 1 (porque la distancia que hay desde la media, que es 50 a cualquiera de los dos extremos del intervalo es 1) y como para construir un intervalo del 95% de la media siempre se coge dos veces el valor de error estándar, éste error debe ser 0.5, porque dos veces 0.5 da 1.
Entonces aplicamos la fórmula del error estándar vista en el tema 3: EE=DE/Raíz(n); o sea, en nuestro caso: 0.5=DE/Raíz(400). Por lo tanto, la DE es 10.
Si ahora construimos un intervalo de valores individuales del 95% debemos coger dos veces esa DE y nos da el intervalo (30, 70). No olvidemos que los intervalos de confianza descriptivos, individuales (que significa individuo a individuo), se construyen con la DE y, en cambio, los intervalos de confianza de la media se construyen con el error estándar (EE).
3c:Con los valores (1, 2) la muestra es la que tendrá un índice de Gini mayor; o sea, será cuando tendremos un muestra con más desigualdad económica. Pensemos que se nos pide con qué dos valores aumentará el índice de Gini; o sea, con qué dos valores habrá más diferencia entre los ricos y los pobres. Añadiendo el 1 y el 2 estamos añadiendo dos personas con ganancias muy bajas. En este momento el individuo que gana 10 unidades monetarias es aún más rico respecto al resto de la muestra. Se crea más desigualdad. Esto se reflejará en un aumento del valor del índice de Gini. Evidentemente se puede calcular para comprobarlo. Pero intuitivamente debe comprenderse qué supone que se añadan dos individuos nuevos con ganancias bajas o, por el contrario, con ganancias altas.
4b: Este caso es el única en el que es coherente lo dicho en de la correlación y de la pendiente. En ambos casos se está diciendo que no hay significación.
5c: De las cuatro respuestas únicamente una presenta una relación significativa y, por lo tanto, es la única predicción posible y, por lo tanto, la mejor. Es la única que tiene un intervalo de confianza o de la pendiente o de la correlación que no tiene al 0 en su interior.
6c: Este es el único caso en el que las dos afirmaciones van en la misma dirección de la respuesta generada. En este caso si disminuimos la diferencia de medias y aumentamos la desviación estándar el p-valor subirá por las dos causas. Si disminuimos la diferencia de medias es evidente que el p-valor subirá, porque habrá más igualdad y si aumentamos la desviación estándar lo que estamos haciendo es mezclar más las muestras y esto se reflejará también en un mayor aumento del p-valor porque será aún más razonable la hipótesis nula.
En los otros casos no sucede así. O en ambos casos no se cumple el resultado dicho o en un caso sí y en otro no, lo que implica que no puede decirse en general que se obtenga en resultado argumentado. Por ejemplo, cojamos la respuesta d: Es verdad que si aumentamos la diferencia de medias el p-valor bajará, porque será más razonable rechazar la hipótesis nula, pero si disminuimos el tamaño de muestra sucederá justo lo contrario: el p-valor subirá porque será más razonable mantener la hipótesis nula. Esta contradicción entre ambas afirmaciones es lo que impide que podamos seleccionar esta opción d.
7c:Debemos aplicar la fórmula:
pero con una variación: con un 9 en lugar de un 4 porque es un intervalo del 99.5%, lo que implica que hay que construir un intervalo con 3 veces el error estándar. El 9 viene de hacer el cuadrado de 3. Podemos deducirlo de las fórmula del inicio del Tema 16.
Si aplicamos esta fórmula con una p=0.2 y un radio r=0.01 porque se trabaja siempre en tanto por uno, obtenemos n=14400.
8c:El valor de referencia es 12.59 en una tabla 4×3. Como el valor de la ji-cuadrado es mayor que ese valor de referencia el p-valor será menor que 0.05.
9d:Variable dicotómica, muestras relacionadas, la técnica a aplicar es el Test de McNemar.
10a: Zona es un factor significativo. Claramente hay tres grupos homogéneos. El sexo no es significativo. Se observa claramente que en promedio no hay diferencias entre ambos sexos. Y hay interacción porque claramente dependiendo de la zona los valores de los sexos cambian.