Saber, realmente, cuántas personas miden más de 184 cm, en esa población, sólo lo podríamos llegar a saber si midiéramos la altura de la población entera. Esto es evidente, pero es necesario decirlo para poder situar bien lo que estamos haciendo. En Estadística pronosticamos valores, realizamos afirmaciones acerca de poblaciones inaccesibles y lo hacemos siempre a partir de información parcial de ellas, a partir de muestras.
Por lo tanto, no podemos saber el valor real solicitado, pero lo que sí podemos hacer es una estimación, podemos hacer un pronóstico de cuántos miden, en esa población, más de 184 cm. Y como la población no la tenemos construimos un modelo de ella, un sustituto de ella. Hacemos una representación mediante una maquinaria matemática.
Cuando tenemos una variable definida en una población los modelos matemáticos que dibujan, que representan, la variabilidad de esa variable, son las llamada Funciones de distribución. La más conocida y usada de ellas es la distribución normal, porque muchas variables en la Naturaleza se distribuyen según el ritmo de esa distribución. Esa fue la gran intuición que tuvo el genial Gauss ya hace siglos.
En el planteamiento de la Situación se nos dice que la muestra que tenemos se distribuye de una forma análoga a como se distribuyen las áreas bajo una campana de Gauss.
Si tomamos, pues, la distribución normal como modelo, como la media y la desviación de la muestra son 170 y 7, respectivamente, podemos decir que un modelo de nuestra población es la distribución normal N(170, 7).
Al construir el modelo es como si ya tuviéramos la población. Un poco es como cuando nos dan un plano a escala de un piso: es como si lo tuviéramos ya el piso, sin en realidad tenerlo. Podemos calcular cosas al plano y es como si le calculásemos, en realidad, al piso (metros cuadrados de una determinada habitación, etc). Pues lo mismo sucede con un modelo matemático. Le calculamos cosas y esos cálculos, si la modelización es buena, podemos proyectarlos al conjunto de la población de la que queremos decir cosas.
Observemos, ahora, que 184 es igual a la Media más dos DE (170+(2×7)=184) y como sabemos que en una distribución normal la media más menos dos desviaciones estándar cubre un 95% de los valores, a la derecha de 184 habrá un 2,5% de la población; o sea 25000 personas.
Este 25000 es, como hemos dicho, un pronóstico. Pero un pronóstico hecho mediante un procedimiento razonable, siguiendo los pasos de la modelización matemática.
Observemos que aquí el tamaño de muestra no ha jugada ningún papel. Cuanto más grande sea la muestra la estimación de la media y de la desviación estándar es más fiable, pero una vez se tiene un tamaño de muestra y una estimación de la media y de la Desviación estándar el procedimiento es el mismo, se tenga el tamaño de muestra que se tenga. Este tamaño no influye en el cálculo del pronóstico.
Solución Situación 5
Deja un comentario