¿Sabes que es la función de densidad de probabilidad? ¿qué variables tienen función de probabilidad y que variables tienen función de densidad?
La función de densidad de probabilidad en estadística Big Data se presenta como uno de los conocimientos base para llevar a cabo un pronóstico asertivo en el procesamiento de los datos, gracias a que a partir de esta se derivan muchas más funciones importantes.
Por esta razón, en este post te explicamos qué es y cómo funciona la función de densidad de probabilidad en estadística para que puedas emplearla en tu análisis estadístico de manera adecuada.
Función de densidad de probabilidad en estadística
La función de densidad de probabilidad en estadística es la que describe la probabilidad relativa según la cual dicha variable aleatoria tomará determinado valor.
De manera que puedes pensar en ella como un histograma con un gran número de barras; si quisieras ser más riguroso, sería un histograma cuando el número de barras tiende a infinito (y su ancho a cero).
Esta función se puede dividir en dos grupos:
- Discretas: son aquellas que solo pueden tomar valores dentro de un conjunto finito (Cara/Cruz, Oros/Bastos/Espadas/Copas). Se pueden representar con números enteros (1,2,3,4….).
- Continuas: son aquellas que pueden tomar cualquier valor, números reales.
Propiedades de la función
Para explicar sus propiedades, te expondremos un breve ejemplo en el que vas a suponer que f(χ) es la función de densidad de probabilidad de una variable aleatoria χ. Por otra parte, su integral (suma) a lo largo de todo el dominio es igual a 1, esto significa que la suma de probabilidades de todos los posibles valores será 1.
Ahora bien, para una distribución continua la fórmula será:
Mientras, para una distribución discreta la fórmula será:
Continuamente, su integral (suma) a lo largo de dos puntos [a,b] da la probabilidad de que la variable aleatoria x caiga en ese rango.
Entonces, para una distribución continua la fórmula será:
Por otra parte, para una distribución discreta la fórmula será:
Por ejemplo
Ahora, si eliges una persona al azar en España, ¿cuál es la probabilidad de que sea un milenial?
Según la Wikipedia los milenials podrían comprender los nacidos entre 1980 y 2000, entonces:
f_poblacion <- poblacion[,c("Total","edad")] f_poblacion$nacimiento <- 2021-f_poblacion$edad f_poblacion$Ratio <- f_poblacion$Total/sum(f_poblacion$Total) f_poblacion_milenial <- sum(f_poblacion$Ratio[f_poblacion$nacimiento>=1980 & f_poblacion$nacimiento<=2000]) paste("La probabilida de que eligiendo una persona al azar en España sea milenial es ", f_poblacion_milenial)
Finalmente, la operación de la función de densidad de probabilidad en estadística Big Data apunta a que la probabilidad de que eligiendo una persona al azar en España sea milenial es de: 0.250367182579079′.
También existe la funcion de densidad condicional, que veremos en otro apartado.
En este post has podido familiarizarte con la función de densidad de probabilidad en estadística Big Data. Sin embargo, debes tener en cuenta que estas derivan en muchas más funciones según la distribución a la que pertenezcan, por lo que es necesario estudiar cada una de ellas por separado. ¡Así que todavía queda mucho más por aprender al respecto!
Nuestro Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning te ayudará a conocer muchos más sistemas, infraestructuras, lenguajes y herramientas que manipulen los macrodatos. En KeepCoding enseñamos por medio de una metodología propia, centrada en enseñar hands on; además, nos caracterizamos por formar profesionales diferentes, curiosos, cuestionadores, amantes del trabajo bien hecho y buscadores incansables de la autosuperación y del desafío intelectual, con independencia de su área de especialización. ¡Inscríbete ahora mismo!