4 tipos de estimadores estadísticos en Big Data

| Última modificación: 27 de junio de 2024 | Tiempo de Lectura: 3 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

Los cuatro tipos de estimadores estadísticos en Big Data son la parte principal de las estrategias para llevar a cabo un análisis estadístico de los datos junto a los tests, las relaciones, el muestreo, las distribuciones y los gráficos.

En este post, te presentamos los cuatro tipos de estimadores estadísticos en Big Data.

4 tipos de estimadores estadísticos en Big Data

Los tipos de estimadores estadísticos en Big Data son un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de la población, así, sustrae valores de una muestra de datos y estima un valor que define la muestra.

Ahora te compartimos cuáles son los cuatro tipos de estimadores estadísticos en Big Data:

Media aritmética

El primero de los tipos de estimadores aparece en matemáticas y estadística, donde la media aritmética (también llamada promedio o media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado. Se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos:

tipos de estimadores

En R, la función de estimadores de la media se podría definir así:

// propiedades de los estimadores estadistica
myMean<-function(X){
# A rellenar
}
myMean(alturas)

Varianza/desviación típica

Otro de los tipos de estimadores es la variancia, que suele representarse como σ², o Var(X), de una variable aleatoria es una medida de dispersión que se define como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. En otras palabras, es la media de los residuos al cuadrado, ya que define lo mucho que varía una variable aleatoria respecto a la media como estimador :

  • Si todos los valores son iguales, no hay variación, por lo que la varianza es 0.
  • Si los valores son muy diferentes unos de otros, la varianza será alta.

El motivo de usar el cuadrado es porque se quiere ver lo mucho que cambia cada elemento sin importar su signo; si cambia por arriba o por abajo, el signo se elimina.

Mediana

La mediana es otro de los tipos de estimadores estadisticos, que el valor de una distribución donde la mitad de los elementos son superiores y la mitad son inferiores.

// estimador insesgado
myMedian<-function(x){
# A rellenar
}
myMedian(alturas)

No olvides que la media y la mediana no tienen que ser iguales como estimadores.

Cuartiles

Otro de los estimadores estadisticos son los cuartiles son los tres valores que dividen un conjunto de datos ordenados en cuatro partes porcentualmente iguales. Estos estimadores estadisticos se presentan así:

  • Q1: el 25% de las muestras se encuentran por debajo del primer cuartil.
  • Q2: el 50% de las muestras se encuentran por debajo del segundo cuartil. Este valor también se conoce como mediana.
  • Q3: el 75% de las muestras se encuentran por debajo del tercer cuartil.
  • Rango intercuartílico (IQR): Q3-Q1.

Por medio de este post te has familiarizado con cuatro de los tipos de estimadores estadísticos en Big Data. Sin embargo, cada uno de los estimadores requieren de un estudio específico por cada uno de ellos. Para profundizar en este tema y en muchos otros, no puedes perderte el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning, que te ayudará con la tarea y podrás identificar las múltiples herramientas, sistemas y lenguajes del manejo de los datos y seleccionar la que más se acople y potencie el estudio de la información. Además, contarás con profesores expertos en el tema y con una amplia trayectoria dentro de este campo. ¡Apúntate ya!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado