La distribución hipergeométrica es la distribución que sigue la siguiente situación de incertidumbre: Tenemos N posibles observaciones, distribuidas en dos tipos distintos, en proporción r y N-r, y donde realizaremos n observaciones sin repetición. La incertidumbre es ver cuántas de estas n observaciones que tenemos son de un tipo o del otro.
La distribución hipergeométrica paradigmática es la de extracciones de una urna con bolas (N) de dos colores en una determinada proporción (r y N-r), de la que se extraen bolas (n) sin reemplazamiento y se pretende ver la probabilidad de una determinada combinación.
La función de densidad y la función de distribución de la distribución hipergeométrica es la siguiente:
Veamos un ejemplo con la situación paradigmática de urna y bolas de dos colores:
Existen tablas para valores concretos de N, de r y de n. Pero ocupan muchas páginas por la necesidad de ir combinando tres parámetros al mismo tiempo.
Para ver cómo funcionan las tablas aquí va la primera página. En ella se contemplan las situaciones en las que N es igual a 2, a 3, a 4, a 5 y a 6. El 7 no está completo:
Debe tenerse en cuenta que son tablas donde aparece el acumulado.
Para practicar un poco cuelgo el fragmento de la tabla donde poder calcular las probabilidades del ejemplo anterior. Nuestro caso tenía los siguientes parámetros: N=10, r=4 y n=4. Está enmarcada la zona de las probabilidades buscadas, para x=0, x=1, x=2, x=3 y x=4:
Para x=0, como puede verse, la probabilidad es 0,0714. Para x=1 hay que restarle a 0,4524 el valor de x=0. Será pues: 0,4524-0,0714=0,381. Para x=2 hay que restarle a 0,8810 el valor de x=1. Sólo este, porque en él ya está contemplado el valor x=0. Será pues: 0,8810-0,4524=0,4286. Y así podemos ir obteniendo las probabilidades de cada una de las posibles situaciones, obteniendo los valores vistos en el ejemplo anterior.