La distribución normal es una de las más importantes en estadística y probabilidad. Su forma de campana y su capacidad para modelar fenómenos naturales y sociales la convierten en un pilar fundamental en estadística computacional. Hoy quiero contarte qué es, sus propiedades, funciones generatrices y cómo se aplica en la práctica con ejemplos.
Qué es la distribución normal
La distribución normal, también llamada distribución de Gauss, es un modelo de probabilidad de variable continua con una forma de campana simétrica. Para poder usarla tienes que entender sus dos parámetros:
- Media (μ): Determina el centro de la distribución.
- Desviación estándar (σ): Indica la dispersión de los datos.
Matemáticamente, la función de densidad de probabilidad (FDP) de la distribución normal se expresa así:
Esta ecuación te dice que los valores más cercanos a la media son los más probables, mientras que los extremos tienen menor probabilidad de ocurrencia.
Propiedades de la distribución normal
La distribución normal tiene características esenciales que la hacen única:
- Simetría: La campana es perfectamente simétrica alrededor de la media.
- Moda, mediana y media coinciden: En una distribución normal, estos tres valores son iguales.
- Regla empírica (68-95-99.7): Aproximadamente:
- El 68% de los datos está dentro de una desviación estándar de la media.
- El 95% dentro de dos desviaciones estándar.
- El 99.7% dentro de tres desviaciones estándar.
Estos valores son clave en estadística inferencial y análisis de datos.
Funciones generatrices de la distribución normal
Las funciones generatrices se usan para describir la distribución normal de manera más general.
Función generatriz de momentos
Esta función se define como:
Con esta ecuación obtienes los momentos de la distribución (media, varianza, etc.).
Función característica
Permite transformar la distribución en el dominio de los números complejos:
Esta función sirve en estadística computacional para trabajar con transformadas y convoluciones.
¿Qué es la distribución normal compleja?
Cuando una variable aleatoria normal se extiende al dominio de los números complejos, obtenemos la distribución normal compleja. Se usa en análisis de señales y telecomunicaciones, especialmente en el procesamiento de señales de radar e imágenes médicas.
La función de densidad de probabilidad en el caso complejo es:
Se usa en teoría de comunicación y análisis de datos multivariados.
Usos de la distribución normal en estadística computacional
Esta distribución tiene aplicaciones en:
- Inferencia estadística: Se usa en pruebas de hipótesis y estimación de parámetros.
- Machine learning: Modelos como Naive Bayes y Redes Neuronales asumen distribuciones normales en ciertos casos.
- Análisis de errores: Se aplica en regresión y algoritmos de optimización.
- Control de calidad: Permite modelar la variabilidad en procesos de manufactura.
Ejemplo 1: Simulación de un modelo en estadística computacional
En estadística computacional, la distribución normal sirve para la simulación de datos, lo que permite modelar fenómenos del mundo real y realizar inferencias estadísticas.
Un caso práctico es la simulación de tiempos de respuesta en un servidor web.
Planteamiento
El tiempo de respuesta de un servidor web (en milisegundos) sigue una distribución normal con media 200 ms y desviación estándar 50 ms. Queremos estimar la probabilidad de que el tiempo de respuesta supere los 300 ms.
Esto se traduce en calcular:
donde:
- X es el tiempo de respuesta del servidor.
- μ = 200 ms (media).
- σ = 50 ms (desviación estándar).
Estandarización
Para calcular esta probabilidad, tienes que convertir X en una variable de la distribución normal estándar (Z):
Sustituyendo los valores:
Cálculo de la probabilidad
Cuando busques en la tabla de distribución normal estándar, encontrarás:
Por lo tanto:
Interpretación
Esto significa que hay solo un 2.28% de probabilidad de que el servidor tarde más de 300 ms en responder.
Ejemplo 2
En una fábrica se producen tornillos cuya longitud sigue una distribución normal con una media de 5 cm y una desviación estándar de 0.2 cm. Si vas a calcular la probabilidad de que un tornillo mida más de 5.4 cm, usas la fórmula:
Con este cálculo la empresa toma decisiones sobre el control de calidad.
Aprende por completo estos conceptos y aplícalos a Machine Learning, Data Science o Big Data, el Bootcamp de KeepCoding. Verás que es tu mejor opción para convertirte en un experto en análisis de datos. ¡Atrévete a transformar tu carrera!