Distribución Bernoulli en estadística Big Data

Autor: | Última modificación: 3 de noviembre de 2022 | Tiempo de Lectura: 3 minutos
Temas en este post:

Cálculos como la distribución Bernoulli en estadística Big Data se presentan como un gran beneficio en el procesamiento de los datos. En general, los estadísticos son una forma acertada y necesaria tanto para un exploración de datos que te guíe en los cuestionamientos clave como para la instancia de análisis y visualización de los macrodatos.

Por esta razón, comprender cómo se desarrollan este tipo de estrategias te ayudará en tu procesamiento de los datos y los resultados arrojados. Por ello, en este post, te lo explicamos todo sobre la distribución de Bernoulli en estadística Big Data.

¿Cuáles son los tipos de distribuciones en estadística?

Antes de presentarte para qué se utiliza la distribución Bernoulli en estadística Big Data, queremos recordarte qué son y cuáles son las distribuciones que podrás encontrar.

Los tipos de distribuciones en estadística forman parte de las funciones de probabilidad que aparecen con mayor frecuencia cuando se realiza algún estudio estadístico.

A modo de resumen, estos son los tipos distribuciones en estadística Big Data:

  • Distribución uniforme: continua. Los valores tienen todos la misma posibilidad.
  • Distribución Bernoulli: discreta. Hay dos posibles soluciones; por ejemplo: echar una moneda al aire.
  • Distribución Exponencial: continua. El tiempo medio entre ocurrencia de eventos de una distribución de Bernoulli.
  • Distribución Binomial: discreta. Generalización de Bernoulli. Por ejemplo: tirar varias monedas al aire.
  • Distribución Poisson: discreta. Generalización de Binomial cuando hay eventos infinitos de probabilidad muy baja.
  • Distribución Gaussiana: continua. La distribución más usada, toda combinación de variables aleatorias tiende a una gaussiana.
  • Distribución Chi cuadrado: continua. El cuadrado de una distribución gaussiana.

Distribución Bernoulli en estadística Big Data

La distribución Bernoulli en estadística Big Data es una distribución discreta que puede tomar dos valores: uno con probabilidad y otro no. Por ello, esta se utiliza para describir sucesos que solo tienen dos posibles resultados, como, por ejemplo, Sí/No, 1/0 o Cara/Cruz.

Un ejemplo más claro sería tirar una vez una moneda al aire y esperar cuál de las dos caras sale al caer.

Por otra parte, la distribución Bernoulli en estadística Big Data cuenta con las siguientes fórmulas para los estimadores de la media y la varianza:

¿Cuáles son los tipos de distribuciones en estadística? 5
options(repr.plot.height=2,repr.plot.width=6)
p<- 0.7
q<- 1-p

df <- data.frame(x=c("Si","No"), prob=c(p,q))
ggplot(data=df,aes(x=x,y=prob))+geom_point(color="blue")+geom_col(width=0.005,color="blue")+
 theme_bw()+ggtitle("Función de densidad de probabilidad \n de una distribución de Bernoulli")

options(repr.plot.height=4,repr.plot.width=6)
Distribución Bernoulli en estadística Big Data 1

La función de densidad de probabilidad de la distribución Bernoulli en estadística Big Data se puede representar como:

Distribución Bernoulli en estadística Big Data 2

donde k solo admite dos posibles valores

Distribución Bernoulli en estadística Big Data 3

Esta formula también se puede expresar como:

Distribución Bernoulli en estadística Big Data 4

La distribución de Bernoulli en estadística Big Data es un caso especial de la distribución binomial con n=1. Podrás simular una distribución de Bernoulli a partir de una uniforme simplemente comparando si el valor supera un umbral que viene determinado por la probabilidad de la distribución binomial.

p <- 0.1
v<-runif(5,min=0,max=1)
v
as.integer(v>p)
  1. 0.860110642388463
  2. 0.956164636649191
  3. 0.926419156603515
  4. 0.0539636595640332
  5. 0.246409463929012
  1. 1
  2. 1
  3. 1
  4. 0
  5. 1
options(repr.plot.height=4,repr.plot.width=6)

slices <- c(p,1-p)
lbls <- c("Cara", "Cruz")
pie(slices, labels = lbls, main="Probabilidad")
Distribución Bernoulli en estadística Big Data 5

Ahora, una vez conoces cómo funciona la distribución Bernoulli en estadística Big Data, te familiarizamos con la binomial que deriva de esta:

Distribución binomial

La distribución binomial es una generalización de la distribución de Bernoulli para sucesos independientes, cada uno de los cuales tiene dos posibles resultados (Sí/No) con probabilidad.

Para ello, debes tener en cuenta las variables que definen la distribución:

  • p – la probabilidad de éxito de un caso individual.
  • n – el número de eventos totales que se desean medir.
  • k – el número de eventos en los que ha salido SÍ.

Por otra parte, la inscripción de este tipo de distribución binomial para los estimadores de media y varianza es esta:

¿Cuáles son los tipos de distribuciones en estadística? 6

¿Cómo aprender más sobre el Big Data?

En este post, te hemos expuesto todo lo relacionado con la distribución Bernoulli en estadística Big Data. Ahora, recuerda que debes tener en cuenta para qué funcionan las demás distribuciones dentro de la estadística en el manejo de los macrodatos, de manera que decidas efectivamente cuál de ellas es la mejor para tu estudio.

Para facilitarte este proceso de aprendizaje, desde KeepCoding te brindamos el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning, por medio del que te formarás en el proceso de ingesta, clasificación, resguardo, procesamiento y presentación de los macrodatos gracias al uso de diferentes herramientas, sistemas y lenguajes. Al terminar, en solo nueve meses, serás capaz de reconocer las ventajas e inconvenientes de los distintos programas estudiados. ¡Échale un vistazo a nuestro temario e inscríbete!

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

[email protected]

¿Trabajo? Aprende a programar y consíguelo.

¡No te pierdas la próxima edición del Aprende a Programar desde Cero Full Stack Jr. Bootcamp!

 

Prepárate en 4 meses, aprende las últimas tecnologías y consigue trabajo desde ya. 

 

Solo en España hay más de 120.400 puestos tech sin cubrir, y con un sueldo 11.000€ por encima de la media nacional. ¡Es tu momento!

 

🗓️ Próxima edición: 13 de febrero

 

Reserva tu plaza descubre las becas disponibles.