1. La Regresión de Poisson es un tipo especial de Regresión donde la particularidad es que la variable dependiente se ajusta bien a una distribución Poisson para cualquier combinación de valores de la variable independiente (en una Regresión de Poisson simple) o de las variables independientes (en una Regresión de Poisson múltiple).
2. Existen múltiples tipos de Regresión. La Regresión de Poisson es un caso más entre el amplísimo ámbitos de tipos de Regresión que se han definido. A lo largo del tiempo se han ido ajustando nuevos modelos de Regresión con la finalidad de conseguir representar mejor determinadas relaciones entre las cosas. Este tipo de Regresión es un ejemplo de este progreso de construcción de modelos matemáticos cada vez más ajustados a la realidad.
3. La distribución de Poisson es una distribución que modeliza bien situaciones de conteo. Por ejemplo: números de accidentes, número de personas que tienen un infarto, número de personas que llaman a una centralita de teléfono, etc, siempre todo esto evaluado en unidad de tiempo determinada.
4. La distribución de Poisson tiene un único parámetro, la lambda, que coincide con la Esperanza y la Varianza de la distribución. O sea, es una distribución que cuanto más grande es el valor esperado más dispersión tienen los valores que puede tomar la variable que se distribuya así.
5. La distribución de Poisson toma, pues, valores enteros no negativos: 0, 1, 2, 3, 4, … Una peculiaridad especial de esta distribución es, como he dicho en el apartado anterior, que su esperanza y su varianza es la misma. Este es un buen criterio, pues, para comprobar si unos datos se ajustan a una distribución Poisson. Por ejemplo, la muestra (2, 4, 3, 4, 4, 5, 3, 4, 1, 4, 3, 5) se ajusta bien porque tiene la media muestral y la varianza muestral muy similares. Sin embargo, la muestra (1, 1, 2, 3, 50, 4, 55, 3) no se ajusta porque tiene una media muestral mucho más pequeña que la varianza muestral.
6. En el artículo Funciones de distribución pueden verse algunas peculiaridades de esta función de distribución: la función matemática, la forma que tiene, algunas peculiaridades y algunas aplicaciones. Ahora lo que sí nos puede ser útil, para poder entender lo que pretendemos captar y representar, mediante la Regresión de Poisson, es mostrar el siguiente dibujo de los cambios que se visualizan en la distribución Poisson cuando el valor de su parámetro, la lambda va aumentando:
7. La lambda puede ser cualquier valor real positivo. Observemos cómo al ir aumentando el valor de la lambda los valores con más probabilidad se van desplazando hacia la derecha y, al mismo tiempo, los valores posibles se van diversificando.
8. Si recordamos regresiones vistas en otros temas podremos situar mejor ésta. En la Regresión lineal la variable dependiente, la que solemos representar por una «y», es una variable continua, una variable que potencialmente puede tomar cualquier valor real dentro de un intervalo. En la Regresión logística hemos visto que esa variable dependiente era dicotómica: era una variable que tomaba dos valores posibles que normalmente codificamos como 0 y 1. Pues, ahora, con la Regresión de Poisson tenemos una situación en cierta forma intermedia: Potencialmente son infinitos los valores posibles de la variable dependiente pero con limitaciones. Son enteros no negativos, porque son recuentos, y los valores tienen la peculiaridad de tener media muestral y varianza muestral similar.
9. Veamos en el siguiente gráfico el dibujo de los tres tipos de regresión comentados, para situarnos:
10. Y observemos ahora más en concreto lo que pretende representar la Regresión de Poisson. Observemos que se trata de, a partir de unos datos como podrían ser los del tercer esquema del gráfico anterior, construir un modelo como podría ser el siguiente:
11. Para poder evitar el problema de dar valores negativos en este tipo de regresión se realiza una transformación de los datos que nos evita estos problemas: una transformación logarítmica.
12. El modelo básico con una única variable independiente es el siguiente:
13. El modelo para varias variables independientes es:
14. Veamos tres ejemplos de cómo sería una Regresión de Poisson con una única variable independiente. En el primer caso no funciona el modelo porque el coeficiente «a» no es significativo. Pensemos que el coeficiente «a» es el que multiplica a la variable independiente x, por lo tanto, si su valor es cero significa que no hay relación entre la variable «y» y la la variable «x», como se puede ver visualizando el gráfico de valores:
15. En el segundo caso:
16. En el tercer caso:
17. En Regresión de Poisson se puede trabajar con los valores brutos (valores absolutos) o con tasas (valores relativos).
18. Como puede observarse se trata de un caso un tanto especial, por las peculiaridades del tipo de variables y de relaciones entre ellas, pero estamos hablando de conceptos que ya han ido saliendo en temas anteriores: conceptos de Regresión, conceptos que preparan el terreno para el establecimiento de un modelo matemático de la relación entre variables.
Hola! Aprovecho de agradecer por tu blog, pues me sido de gran ayuda para entender estadística, pero me ha quedado una duda respecto a la Regresión de Poisson…esta es un tipo de regresion para relacionar variables?? cierto? Planteo esto, pues estoy haciendo mi tesis de pregrado en un tema de salud, donde a traves de un modelo Poisson, han relacionado los ingresos hospitalarios con la concentración de un contaminante, y al leer tu blog, he pensado el por qué el estadístico ha elegido este modelo… tu tienes alguna idea?? (se que puedo preguntarle al estadístico, pero quisiera ir con algunas ideas antes de hacerlo, y creo me puedes ayudar)
Gracias!
Hola, gracias por tus palabras. La elección me parece razonable. Fíjate que el número de ingresos en una unidad de tiempo puede ser 0, 1, 2, etc. O sea, un número entero no negativo. Después al ponerlo en relación con la variable concentración de un contaminante es lógico pensar que al aumentar esa concentación aumentará el valor medio esperado de ingresos y la desviación estándar de esos ingresos. Eso es algo ligado a la distribución Poisson que es una función con esperanza y varianza iguales, lo que quiere decir que cuando aumenta la media aumenta al unísono la dispersión. Fíjate que esto ha quedado reflejado en uno de los gráficos del artículo del blog. Un saludo
Pues muy aqradecido por el contenido de su blog, realmente logran que uno capte rápido y
fácil, gracias, los consultaré muy a menudo
Muchas gracias.
Una de las explicaciones más clara acerca de la regresión de Poisson, la cual me va a permitir avanzar en su comprensión. Agradecido
tengo una duda tremenda sobre si usar regresion lineal simple o poisson en un ejercicio, en el cual me muestra para diferentes años el numero total de muertes y el numero de habitantes en ese año.
Ayudame porfa
Yo aplicaría una Regresión de Poisson. Mira en el punto 15 del tema porque tendrás un caso de este tipo. Al aumentar el número de habitantes aumentaran la media y la varianza del número de muertes. Aplicar este modelo en este caso te permitirá mejor ajuste a la realidad. Piensa que con un modelo matemático lo que pretendemos es dibujar lo mejor posible una determinada realidad.
Un saludo cordial.
Te felicito por la pedagogía para explicar. Todo muy sencillo! gracias!
Hola buen día! existe para esta regresión alguna medida de la determinación de la variable respuesta por las variables causa? Alguna especie de R²? Gracias!