Ejercicio con regresión de Poisson

Autor: | Última modificación: 7 de noviembre de 2022 | Tiempo de Lectura: 3 minutos
Temas en este post:

En este post te mostraremos un ejercicio con regresión de Poisson, ¿preparado?

El modelo de regresión de Poisson se usa típicamente para modelar conteo de conjuntos de datos, pero a veces es más relevante modelar el ratio en lugar del conteo.

Así, en lugar de tener la siguiente fórmula, donde y es el conteo esperado para la variable x:

Ejercicio con regresión de Poisson

Tenemos esta, donde n es el número de intentos para esa variable x:

Ejercicio con regresión de Poisson 1

De este modo, la ecuación puede escribirse como:

Ejercicio con regresión de Poisson 2

Ese valor de log (n) es lo que se conoce como offset ().

Ejercicio con regresión de Poisson

En otro artículo hemos visto cómo se desarrolla un Test A/B con GLM y cómo se resuelve, dentro de este test, un ejercicio de regresión logística. En este caso haremos lo mismo, pero con una pequeña variación; resolveremos el ejercicio con regresión de Poisson, ya que lo que tenemos son conteos, números de cosas que ocurren.

La regresión de Poisson en la mayoría de ocasiones se utiliza para hacer conteos de datos, pero no nos interesa saber el número de éxitos que hemos tenido. Lo que nos interesa es el ratio de éxito que hemos tenido.

Para eso, lo que nos interesaría ver es el logaritmo de:

Ejercicio con regresión de Poisson 1

Este equivale al número de intentos, porque cuantos más intentos, mayor va a ser el valor de y. Así, con el doble de visitas en la web podríamos tener el doble de éxitos.

En caso de que utilizáramos esta fórmula:

Ejercicio con regresión de Poisson 4

Nos sería completamente inútil la información recogida, ya que esta función lo que nos arrojaría sería el número de clics y lo que necesitamos saber es, de ese número de clics, cuántos fueron casos de éxito.

Así pues, en la fórmula que utilizaremos dividiremos el número de intentos entre el número de aciertos y ese será el log.

El logaritmo del número de intentos se traduce en R como offset.

model <- glm (formula = exitos ~ type + offset (log (intentos)), data = df, family = poisson)
library (jtools)
#plot_summs (model, scale = TRUE, exp= TRUE)
exp(model$coef [2])
exp (confint (model))

Este código está intentando predecir el número de éxitos en función del tipo, pero desplazándolo por el número de intentos.

Ejercicio con regresión de Poisson 5

typenuevo: 1.16751269035533

En este ejercicio con regresión de Poisson tenemos el mismo resultado que con el ejercicio anterior. La razón de momios es exactamente igual y la repuesta a la pregunta de cuánto mejora el ratio al cambiar de una web a otra sigue siendo la misma.

exp (confint (model))
2.5 %97.5 %
(Intercept)0.17075520.2258035
typenuevo0.96553871.4130566

¿Cuál de los modelos es mejor, teniendo en cuenta el ejercicio con regresión de Poisson y el de regresión logística? No podríamos decirlo con certeza; no obstante, pensamos que es mejor el de Poisson por ser más conservador. Puedes probar ambos a ver cuál se adapta mejor a tus necesidades.

¿Te gustó este post?

Con el ejercicio con regresión de Poisson resulto, es hora de que tomes la decisión de verificar cuál de los modelos se adapta mejor a ti. Para ello te invitamos a seguir instruyéndote y aprendiendo por medio de nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, donde adquirirás todas las bases necesarias para, en muy poco tiempo, incursionar en el mercado laboral. ¡Anímate y solicita más información!

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

[email protected]

¿Trabajo? Aprende a programar y consíguelo.

¡No te pierdas la próxima edición del Aprende a Programar desde Cero Full Stack Jr. Bootcamp!

 

Prepárate en 4 meses, aprende las últimas tecnologías y consigue trabajo desde ya. 

 

Solo en España hay más de 120.400 puestos tech sin cubrir, y con un sueldo 11.000€ por encima de la media nacional. ¡Es tu momento!

 

🗓️ Próxima edición: 13 de febrero

 

Reserva tu plaza descubre las becas disponibles.