Análisis causal y contrafactual en estadística

| Última modificación: 28 de junio de 2024 | Tiempo de Lectura: 2 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

El análisis causal y contrafactual en estadística para el manejo de los macrodatos es de suma importancia, ya que supone una gran facilidad para llevar a cabo el procesamiento del Big Data en este amplio campo de la estadística.

En efecto, este tipo de análisis te ayudará a comprender cómo se comportan los datos que se están trabajando, de manera que sabrás qué tipo de preguntas puedes hacer a la investigación de la información. Por esta razón, en este post, te presentamos el análisis causal y contrafactual en estadística para el Big Data.

Análisis causal y contrafactual en estadística

El análisis causal y contrafactual en estadística para el Big Data, como su nombre lo indica, es la unión entre el análisis causal y el contrafactual.

El análisis causal

En primer lugar, el análisis causal te permite ver la relación causa-efecto que hay entre diferentes variables. Para mostrar cómo funciona, te exponemos un ejemplo que hemos extraído del libro The book of why:

  • Imaginemos que la vacuna de la viruela se aplica al 99% de la población.
  • De los vacunados, un 1% desarrolla una reacción, y de ese grupo, un 1% fallece. Pero ninguno coge viruela.
  • De los no vacunados, un 2% coge la enfermedad, y de esos enfermos, un 20% fallece.

Si pintas cada una de esas probabilidades, la probabilidad de sufrir una reacción (R) o la enfermedad (E) en función de la vacuna (V), la inscripción sería la siguiente:

De manera que las probabilidades de fallecimiento (M) en función de la reacción (R) o la enfermedad (E) son:

Por otra parte, si partes de una población de 1 millón de personas, habrá 990.000 vacunados y 10.000 sin vacunar. Así que entre todos los vacunados fallecerán 99 personas, mientras que de los no vacunados fallecerán 40 personas.

De manera que, en esta población, muere más gente por las vacunas que por la enfermedad.

Análisis contrafactual

Con respecto al ejemplo que venías trabajando, el análisis contrafactual trata de responder a la siguiente pregunta: si no se hubiera aplicado la vacuna, ¿cuánta gente habría fallecido?

Entonces, el análisis sería la probabilidad de fallecer si te pones la vacuna es:

Así que, la probabilidad de fallecer si NO te pones la vacuna es:

En definitiva, en este análisis causal y contrafactual en estadística para el manejo Big Data, el resultado sería que si el millón de personas no se hubiera vacunado, el número de fallecidos sería de 106·0.004=4000 personas. De manera que la vacuna ha salvado la vida de 4000−99−40=3861 personas.

En este post, te hemos expuesto qué es y cómo funciona el análisis causal y contrafactual en estadística para el manejo de los macrodatos, de manera que ahora podrás implementarlo en el procesamiento de tus datos. No obstante, este proceso requiere de más práctica para desempeñarse efectivamente.

Por este motivo, en KeepCoding contamos con el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Leraning. Gracias a esta formación de alta calidad, podrás instruirte en profundidad por medio de once módulos que verás en directo y en remoto desde cualquier parte del mundo sobre los principales sistemas, lenguajes y herramientas que trabajan con el procesamiento de los macrodatos. En menos de nueve meses podrás considerarte todo un experto. ¡No dudes en consultar nuestro temario y apúntate ahora!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado