Los cuatro tipos de estimadores estadísticos en Big Data son la parte principal de las estrategias para llevar a cabo un análisis estadístico de los datos junto a los tests, las relaciones, el muestreo, las distribuciones y los gráficos.
En este post, te presentamos los cuatro tipos de estimadores estadísticos en Big Data.
4 tipos de estimadores estadísticos en Big Data
Los tipos de estimadores estadísticos en Big Data son un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de la población, así, sustrae valores de una muestra de datos y estima un valor que define la muestra.
Ahora te compartimos cuáles son los cuatro tipos de estimadores estadísticos en Big Data:
Media aritmética
El primero de los tipos de estimadores aparece en matemáticas y estadística, donde la media aritmética (también llamada promedio o media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado. Se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos:
En R, la función de estimadores de la media se podría definir así:
// propiedades de los estimadores estadistica
myMean<-function(X){
# A rellenar
}
myMean(alturas)
Varianza/desviación típica
Otro de los tipos de estimadores es la variancia, que suele representarse como σ², s² o Var(X), de una variable aleatoria es una medida de dispersión que se define como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. En otras palabras, es la media de los residuos al cuadrado, ya que define lo mucho que varía una variable aleatoria respecto a la media como estimador :
- Si todos los valores son iguales, no hay variación, por lo que la varianza es 0.
- Si los valores son muy diferentes unos de otros, la varianza será alta.
El motivo de usar el cuadrado es porque se quiere ver lo mucho que cambia cada elemento sin importar su signo; si cambia por arriba o por abajo, el signo se elimina.
Mediana
La mediana es otro de los tipos de estimadores estadisticos, que el valor de una distribución donde la mitad de los elementos son superiores y la mitad son inferiores.
// estimador insesgado
myMedian<-function(x){
# A rellenar
}
myMedian(alturas)
No olvides que la media y la mediana no tienen que ser iguales como estimadores.
Cuartiles
Otro de los estimadores estadisticos son los cuartiles son los tres valores que dividen un conjunto de datos ordenados en cuatro partes porcentualmente iguales. Estos estimadores estadisticos se presentan así:
- Q1: el 25% de las muestras se encuentran por debajo del primer cuartil.
- Q2: el 50% de las muestras se encuentran por debajo del segundo cuartil. Este valor también se conoce como mediana.
- Q3: el 75% de las muestras se encuentran por debajo del tercer cuartil.
- Rango intercuartílico (IQR): Q3-Q1.
Por medio de este post te has familiarizado con cuatro de los tipos de estimadores estadísticos en Big Data. Sin embargo, cada uno de los estimadores requieren de un estudio específico por cada uno de ellos. Para profundizar en este tema y en muchos otros, no puedes perderte el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning, que te ayudará con la tarea y podrás identificar las múltiples herramientas, sistemas y lenguajes del manejo de los datos y seleccionar la que más se acople y potencie el estudio de la información. Además, contarás con profesores expertos en el tema y con una amplia trayectoria dentro de este campo. ¡Apúntate ya!