Análisis causal y contrafactual en estadística

Autor: | Última modificación: 18 de abril de 2024 | Tiempo de Lectura: 3 minutos
Temas en este post:

Algunos de nuestros reconocimientos:

Premios KeepCoding

El análisis causal y contrafactual en estadística para el manejo de los macrodatos es de suma importancia, ya que supone una gran facilidad para llevar a cabo el procesamiento del Big Data en este amplio campo de la estadística.

En efecto, este tipo de análisis te ayudará a comprender cómo se comportan los datos que se están trabajando, de manera que sabrás qué tipo de preguntas puedes hacer a la investigación de la información. Por esta razón, en este post, te presentamos el análisis causal y contrafactual en estadística para el Big Data.

Análisis causal y contrafactual en estadística

El análisis causal y contrafactual en estadística para el Big Data, como su nombre lo indica, es la unión entre el análisis causal y el contrafactual.

El análisis causal

En primer lugar, el análisis causal te permite ver la relación causa-efecto que hay entre diferentes variables. Para mostrar cómo funciona, te exponemos un ejemplo que hemos extraído del libro The book of why:

  • Imaginemos que la vacuna de la viruela se aplica al 99% de la población.
  • De los vacunados, un 1% desarrolla una reacción, y de ese grupo, un 1% fallece. Pero ninguno coge viruela.
  • De los no vacunados, un 2% coge la enfermedad, y de esos enfermos, un 20% fallece.

Si pintas cada una de esas probabilidades, la probabilidad de sufrir una reacción (R) o la enfermedad (E) en función de la vacuna (V), la inscripción sería la siguiente:

Análisis causal y contrafactual en estadística

De manera que las probabilidades de fallecimiento (M) en función de la reacción (R) o la enfermedad (E) son:

Análisis causal y contrafactual en estadística

Por otra parte, si partes de una población de 1 millón de personas, habrá 990.000 vacunados y 10.000 sin vacunar. Así que entre todos los vacunados fallecerán 99 personas, mientras que de los no vacunados fallecerán 40 personas.

De manera que, en esta población, muere más gente por las vacunas que por la enfermedad.

Análisis contrafactual

Con respecto al ejemplo que venías trabajando, el análisis contrafactual trata de responder a la siguiente pregunta: si no se hubiera aplicado la vacuna, ¿cuánta gente habría fallecido?

Entonces, el análisis sería la probabilidad de fallecer si te pones la vacuna es:

Análisis causal y contrafactual en estadística

Así que, la probabilidad de fallecer si NO te pones la vacuna es:

Análisis causal y contrafactual en estadística

En definitiva, en este análisis causal y contrafactual en estadística para el manejo Big Data, el resultado sería que si el millón de personas no se hubiera vacunado, el número de fallecidos sería de 106·0.004=4000 personas. De manera que la vacuna ha salvado la vida de 4000−99−40=3861 personas.

Sigue aprendiendo sobre el Big Data

En este post, te hemos expuesto qué es y cómo funciona el análisis causal y contrafactual en estadística para el manejo de los macrodatos, de manera que ahora podrás implementarlo en el procesamiento de tus datos. No obstante, este proceso requiere de más práctica para desempeñarse efectivamente.

Por este motivo, en KeepCoding contamos con el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Leraning. Gracias a esta formación de alta calidad, podrás instruirte en profundidad por medio de once módulos que verás en directo y en remoto desde cualquier parte del mundo sobre los principales sistemas, lenguajes y herramientas que trabajan con el procesamiento de los macrodatos. En menos de nueve meses podrás considerarte todo un experto. ¡No dudes en consultar nuestro temario y apúntate ahora!

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado