Base de datos de Investigación de mercados

La siguiente base de datos de una investigación de mercados tiene la siguientes variables:

P=Persona

Z=Zona (1, 2)

S=Sexo (h=hombre, m=mujer)

E=Edad

P1=Producto 1 (Si=Consumiría, No=No consumiría)

P2=Producto 2 (Si=Consumiría, No=No consumiría)

P3=Producto 3 (Si=Consumiría, No=No consumiría)

P4=Producto 4 (Si=Consumiría, No=No consumiría)

R=Renta anual

F=Número de miembros en su unidad familiar

Captura de pantalla 2016-01-31 a las 10.33.57

 

  1. Estadística descriptiva e Intervalos de confianza:

a) Hacer una estadística descriptiva de la variable Sexo en la muestra de la Zona 1 y otra en la muestra de la Zona 2.

b) Hacer una estadística descriptiva de la variable Número de miembros de la unidad familiar en la muestra de cada una de las dos zonas.

c) Hacer una descriptiva reducida, en dos o tres valores fundamentales, de la variable Renta, en cada uno de los dos grupos del estudio.

d) Hacer una predicción, mediante un intervalo de confianza, del porcentaje de consumo del producto 1.

e) Hacer una predicción, mediante un intervalo de confianza, de la Renta media poblacional en cada una de las dos zonas.

SOLUCIONES:

1.

a) En la zona 1:

img_3228

img_3229

En la zona 2:

img_3230

img_3231

b) La variable Número de miembros de la unidad familiar se podría resumir tanto como variable cuantitativa como variable cualitativa. Lo hago como cuantitativa, pero como cualitativa sería perfectamente factible.

Zona 1:

img_3232

img_3233

Zona 2:

img_3234

img_3235

c) La descriptiva de la variable Renta en la zona 1:

img_3236

Como se ajusta a la distribución normal, porque tanto la Asimetría estandarizada como la Curtosis estandarizada están entre -2 y 2 podemos resumirla brevemente con la media y la desviación estándar:

34297.6±21.730.26

La descriptiva de la variable Renta en la zona 2:

 img_3237

Como no se ajusta a la distribución normal, porque tanto la Asimetría estandarizada como la Curtosis estandarizada están fuera del -2 y 2, no podemos resumirla brevemente con la media y la desviación estándar y debemos hacerlo con la mediana y el rango intercuartílico, expresado con el primer y tercer cuartil:

20575 (14700-31800)

d) El producto 1 reuniendo las dos zonas tenemos la siguiente descriptiva:

img_3238

El 24% parece que consumirá el producto. Esto es la estimación, pero debemos construir un intervalo de confianza. Aplicando el procedimiento de construcción de intervalos de confianza del 95% para una proporción visto en el tema 3 obtenemos:

img_3244

e) Para hacer un intervalo de confianza de la media de la renta en la zona 1 y en la zona 2 debemos usar la media y el error estándar. Al construir intervalos de confianza de la media no es preciso la comprobación de la normalidad de la muestra, especialmente si el tamaño de muestra es a partir de 30 valores, porque en estos casos siempre se cumple la normalidad. Pensemos que estamos hablando de la normalidad de la variable media, no de la variable original, que en la zona 2 hemos visto que claramente no se ajusta a la normalidad. Pero la media sí se ajusta porque el tamaño de muestra es 50, que es mayor que 30.

Zona 1:

34297.6±2×3073.12

34297.6±6146.24

Zona 2:

25008.4±2×1994.8

25008.4±3989.6

2. Técnicas de relación:

a) Calcular la correlación de Pearson entre Edad y Renta. ¿Es estadísticamente significativa?

b) ¿Hay alguna relación, estadísticamente significativas, entre el consumo de los productos 3 y 4?

c) ¿Dónde hay más relación entre el consumo de los productos 3 y 4, en los hombres o en las mujeres?

Soluciones:

a) La correlación de Pearson es r=0.10 con un p-valor de 0.318. Por lo tanto, es una correlación que no es estadísticamente significativa.

b) La ji-cuadrado de la relación entre el consumo del producto 3 y 4 es de 79.39 con una p<0.05 y una V de Crámer V=0.89.

c) En Hombres la relación entre el consumo del producto 3 y 4 es estadísticamente significativa con una ji-cuadrado de 20.61 y una p<0.05. Y una V=0.76.

En Mujeres la relación entre el consumo del producto 3 y 4 es, también, estadísticamente significativa, con una ji-cuadrado de 59.84 y una p<0.05. Y una V=0.97.

La relación es más intensa en las mujeres puesto que la V es mayor.

3. Técnicas de comparación:

a) Hacer una comparación entre las dos zonas de la muestra para la variable Renta.

b) Hacer una comparación entre las dos zonas para la variable Consumo de P2.

c) Hacer un ANOVA de dos factores con interacción para la variable Renta con los factores Zona y Sexo.

Soluciones:

a) La variable renta es continua, las muestras son independientes y ninguna de las dos se ajusta a la distribución normal (p<0.05 con el Test de Shapiro-Wilk). Por lo tanto, hay que aplicar el Test de Mann-Whitey. El p-valor es 0.0553, por lo que no podemos decir que haya diferencias estadísticamente significativas. Es cierto que es muy justo este p-valor. Sólo que la muestra fuera un poco más grande la diferencia sería significativa, con toda probabilidad.

b) La variable es dicotómica, las muestras son independientes, el tamaño de muestra es mayor que 30 y el valor esperado por grupo es mayor o igual que 5, por lo que podemos aplicar el test de proporciones o el test de la ji-cuadrado. Al hacerlo el p-valor es mayor que 0.05, por lo que no puede considerarse que hay una diferencia estadísticamente significativa entre ambas zonas en cuanto al consumo del P2.

c) Si se realiza un ANOVA de dos factores observamos que hay diferencia entre zonas, que hay diferencia entre sexos y que hay interacción. Los tres p-valores son menores que 0.05. En la zona 1 hay mucha igualdad de rentas entre sexos y, sin embargo, en la zona 2 hay una marcada diferencia entre las rentas de ambos sexos en perjuicio de las mujeres.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s